quinta-feira, 24 de junho de 2010

Analisando resultados: comparando listas

A Goldman Sachs desde 1998 elabora relatórios com previsões sobre as probabilidades de seleções dos países serem a campeã da Copa do Mundo de Futebol. Como é um respeitado banco de investimentos e de análise de riscos, a imprensa costuma dar grande destaque a esses relatórios.

Mas como eles se saem nas previsões? Um método simples é comparar a listagem - que é ordenada da maior probabilidade para a menor probabilidade - dos países no relatório da GS e o resultado final da Copa. Podemos assumir que o ranqueamento pelas probabilidades reflita o ranqueamento final na Copa - com critérios de desempate entre os que são desclassificados equivalentes aos critérios de desempate na fase de grupos.

Analisemos então a previsão e o resultado para a Copa de 2006, na Alemanha. A tabela abaixo mostra à esquerda a previsão e à direita o resultado final.


E então, como se compara? No olhômetro já não parece bater direito, mas vemos que, por exemplo, para a Argentina acertou em cheio, o mesmo para algumas outras seleções, como Togo. Em outros, a diferença não é tão grande, como para a Arábia Saudita. Uma ideia intuitiva seria tirar a diferença entre todos e somar. Bem, isso não ajudaria muita coisa - a soma sempre será zero. Podemos tentar, então, usar o módulo - o valor absoluto das diferenças. Mas a simples soma não serve - é meio complicado analisar isso estatisticamente.

Um procedimento que os estatísticos desenvolveram foi um método chamado teste não-paramétrico de sinais ranqueados de Wilcoxon. O nome é pomposo, mas o mecanismo é simples - ainda que possa ser trabalhoso fazer à mão (ainda bem que desenvolveram planilhas eletrônicas e programas estatísticos).

Uma vez calculadas as diferenças de cada par e obtidos os valores absolutos, descartam-se os valores nulos, ordenam-se as diferenças restantes do menor para o maior. A menor diferença recebe o valor 1, a seguinte o valor 2 e assim por diante. Se dois ou mais valores seguidos são iguais, receberão o mesmo valor, por exemplo, se tivermos: 2; 4; 4; 6 - assinalaremos os valores (os ranques) 1; 2,5; 2,5; 4. A seguir, transferimos o sinal das diferenças para esses novos números: se a diferença absoluta 2 se refere a um par "3 - 5", então teremos -1. Se for "5 - 3", então será 1. Agora é só somar os ranques com sinais - o total vamos chamar de W (de Wilcoxon). Antes é preciso observar-se se o total de pares que dão valores diferentes de zero é igual ou maior do que 10 - para que o teste tenha validade.

O valor obtido de W pode ser comparado com tabelas estatísticas disponíveis.

No nosso caso, temos 30 pares cujas diferenças são diferentes de 0. O W é igual a -12. Isso nos dá uma probabilidade de P = 0,45. Há 45% de chances das diferenças entre as listas serem geradas por uma lista com a ordem das seleções produzida ao acaso. Normalmente aceitamos como limite uma probabilidade de 5% (mas podemos ser mais restritivos ou menos), de todo modo, 45% é uma chance muito alta, então rejeitamos a hipótese de que as duas listas sejam equivalentes. Ou seja, os especialistas da Goldman Sachs erraram feio e estão com chutômetro descalibrado.

Vamos ver como se sairão para as previsões desta Copa 2010.

quarta-feira, 16 de junho de 2010

Os campeões dos campeões

As fórmulas dos campeonatos nacionais de futebol variam de país para país e de ano para ano - pontos corridos, eliminatórias com ou sem fase de grupos, pontuações por vitória, critérios de desempate, número de participantes, etc...

De todo modo, fazendo-se uma tabela de campeões de todos os tempos - ranqueando-se os clubes por número de títulos -, dividindo-se o número de títulos pelo total de campeonatos já realizados (isto é, obtendo-se a fração de títulos conquistados por clube) e plotando-se em um gráfico a média para diversos países, obtemos um gráfico como o abaixo.

Parece seguir uma distribuição gama. Fazendo um ajuste de curva, os parâmetros de escala θ = 6 e de forma k = 0,6. (As federações nacionais amostradas foram: Alemanha, Bélgica, Brasil, Dinamarca, El Salvador, França, Inglaterra, Grécia, Hong Kong, Israel, Itália, México, Noruega e Peru - para o campeonato brasileiro foram considerados o Robertão e outros anteriores ao Campeonato Brasileiro.)

segunda-feira, 17 de maio de 2010

A Ciência do Gol

O canal por assinatura Discovery Channel Brasil está exibindo uma série de programas relacionados ao futebol (claro, aproveitando-se da proximidade da Copa do Mundo na África do Sul). Um deles é "A Ciência do Gol" que analisa diversos aspectos científicos e tecnológicos a respeito do futebol


A Ciência do Gol Video at DiscoveryBrasil.com

domingo, 16 de maio de 2010

Gata de laboratório - 10


Kara Cooney é egiptóloga, Professora Assistente em Arte e Arquitetura Egípcias na UCLA. Formada pela University of Texas em Austin, recebeu PhD em Estudos do Oriente Próximo pela John Hopkins University em 2002. Apresentadora do programa Out of Egypt (Legados do Egito) exibido pela Discovery Channel.

quinta-feira, 6 de maio de 2010

A história da História do futebol tupiniquim

Reportagem da revista Ciência Hoje sobre os trabalhos de História do desporto preferido nestas paragens tupiniquins.

Gata de laboratório - 9

Foto: Jeffrey Goldberg/Math Doesn't Suck

Danica McKellar, a Winnie Cooper de Anos Incríveis, graduada em matemática pela UCLA. Educadora e autora de livros sobre matemática. Co-autora do teorema Chayes-McKellar-Winn.

quarta-feira, 10 de fevereiro de 2010

Gata de laboratório - 8


Kirsten H. Sanford, neurofisiologista, formada em Manejo da Vida Selvagem pela UC Davis, PhD pela mesma universidade em Fisiologia Molecular, Celular e Integrativa, atua como jornalista independente de ciências.