segunda-feira, 17 de dezembro de 2012

Um valor mais alto se alevanta? Sim, mas ainda (provavelmente) não é o maior.

Causando rebuliço o resultado da última pesquisa Datafolha a respeito das torcidas de futebol no Brasil. As suspeitas de erro - e até de manipulação - não procedem.

As três principais questões são a respeito do número de cidades amostradas: 160 (e sua consequente representatividade); o tamanho da torcida da Portuguesa ser igual à do Fluminense e se realmente a torcida corintiana alcançou a do Flamengo em número.

1) Número de cidades. Além da questão da limitação técnico-financeira de se pesquisar muito mais cidades dentro de um intervalo razoável; ela é suficiente para se captar as principais torcidas. Naturalmente, as torcidas pequenas - 5% ou menos - sofrerão flutuações a cada amostragem. As cidades cobrem todas as regiões.

2) A pesquisa não deve ser levada a ferro e a fogo. Especialmente para os valores menores. O tamanho da torcida do Fluminense tem sido mais ou menos constante ao longo do tempo - em torno de 1%. Desde 1993, é a primeira vez que, em nível nacional, ocorre o registro de 1% da amostra normalizada como torcedores da Portuguesa. Há a questão do arredondamento - 0,6% e 1,5% correspondem a 1%. Essa variação é esperada pela natureza de qualquer amostragem - mesmo as teoricamente perfeitas. Considerando-se a margem de erro (que aqui não deve ser considerado o 2% genérico adotado na divulgação por questões de simplificação), não há nenhum absurdo. Sim, o número não quer dizer que a torcida lusa seja do mesmo tamanho da do Tricolor das Laranjeiras.

3) Vinícius Paiva aponta que a restrição do número de cidades pode prejudicar o Flamengo dada a distribuição de sua torcida - tende a crescer em cidades pequenas, mais pobres. Isso, em boa parte, é coberta pela margem de erro. Há ainda o fato de que o tamanho das torcidas flutua um tanto - bastante dependente da fase dos times (em uma fase ruim, um torcedor pode se declarar como sem preferência, por exemplo). O fato de nominalmente a torcida rubro-negra e a corintiana estarem empatadas, não quer dizer que sejam exatamente do mesmo tamanho. Quer dizer apenas que uma não é muito maior do que a outra. Olhando as pesquisas anteriores temos informações para uma interpretação mais robusta dos valores.
Figura 1. Evolução das torcidas do Corinthians-SP e do Flamengo-RJ. Fonte: Datafolha.

A torcida do Flamengo tem uma certa variação, mas está essencialmente estacionada em torno de 17%. A torcida do Corinthians cresce consistentemente (com flutuações, claro) e atualmente deve estar em torno de 14,5%. O cenário muda um pouco, mas não muito quando se consideram outras pesquisas.

É bobagem dizer que há manipulação ou que há um erro metodológico. O problema são as interpretações em cima dos números mais recentes - piora quando descontextualizado do histórico e ignorado o contexto socioesportivo do momento.

segunda-feira, 13 de agosto de 2012

Medalha, medalha, medalha

No gráfico abaixo, a evolução do número de países com pelo menos uma medalha por olimpíada.

Figura 1. Evolução do total de países com medalhas em cada olimpíada.

A evolução é do tipo exponencial. Naturalmente não será possível se manter essa taxa de crescimento de modo indefinido, já que há um limite do número total de países no mundo - mesmo que este esteja em crescimento também.

Nos anos de 1976, 1980, 1984 e 1988 (faixa amarela no gráfico), houve boicotes. No primeiro, em Montreal, por países africanos, liderados pela Tanzânia, pela participação da Nova Zelândia - cujo time de rúgbi havia feito um tour pela África do Sul, então sob regime do apartheid.  No segundo, em Moscou, por países do bloco capitalista - liderados pelos EUA - sob alegação de protesto contra a Guerra no Afeganistão. Em resposta, na olimpíada seguinte - em Los Angeles - países do bloco comunista também não enviaram atletas. Na olimpíada de Seul, houve um pequeno boicote, liderado, claro, pela Coreia do Norte. Se excluirmos a era dos boicotes, o grau de adesão dos dados ao modelo exponencial aumenta para R2=0,9219.

O crescimento tem sido sustentado pelo aumento do número de países participantes, aumento do número de modalidades e de atletas (Figura 2.)

Figura 2. Fatores correlacionados com total de países com medalhas por olimpíada: número de países (NOCs) participantes, número de eventos realizados, número de atletas participantes.

quarta-feira, 11 de julho de 2012

Futebol: dinheiro traz felicidade? Sim. Mas só mais ou menos.

No twitter o consultor Ricardo Amorim sugere que o primeiro título do Sport Club Corinthians Paulista na Libertadores esteja ligado ao fato de ser um dos clubes de maior faturamento no mundo.


No gráfico abaixo, a correlação entre o faturamento dos clubes brasileiros (em 2010 e 2011) e sua pontuação no ranking da Conmebol em 16/mai/2011, 20/fev/2012 e 09/jul/2012.

Figura 1. Correlação entre faturamento dos clubes brasileiros e pontuação no ranking da Conmebol: losangos (09/jul/2012), triângulos (20/fev/2012) e quadrados (16/mai/2011). Em branco, dados do SC Corinthians Paulista.

Há, claro, alguma correlação entre o faturamento e a pontuação na classificação (ou seja, nos resultados nas competições internacionais): times com mais dinheiro para investir em elenco, equipe técnica, infraestrutura, etc., de modo geral, têm um desempenho melhor. Mas outros fatores; como a influência do acaso, de fatores psicológicos, calendário, etc.; têm peso forte. Isso pode ser visto na variação dos resultados para clubes com orçamentos mais ou menos equivalentes - veja, por exemplo, a grande variação da pontuação na faixa dos R$ 200 milhões de faturamento anuais; e na variação do faturamento entre equipes com pontuações mais ou menos similares, veja por exemplo, a grande variação do rendimento financeiro dos clubes com cerca de 150 pontos.

E, no caso específico do Corinthians, o desempenho quase não variou entre maio de 2011 e fevereiro de 2012, mesmo com um salto R$ 78 milhões de reais no orçamento (37% a mais); e, no mesmo ano, ou seja, no mesmo orçamento, o desempenho saltou em seis meses 210 pontos (aumento de 286%).

O futebol, como apresenta placares com relativamente poucos tentos no mais das vezes, permite uma grande variação do desempenho e forte influência de fatores casuais - um chute infeliz ou uma defesa salvadora com a ponta dos dedos (como o de Diego Souza, do Vasco, na semi defendido por Cássio, do Corinthians) pode acabar determinando a classificação ou o título. Claro que fatores como planejamento, treinamento, esforço, concentração, também são de grande importância. Mas um resultado específico, como um título em um determinado ano, não pode ser creditado a este ou aquele fator - nem mesmo a um dado conjunto de fatores. Como a sorte varia - ajuda uma hora, atrapalha em outra -, no longo curso, os fatores não casuais fazem efeito - mas isso só pode ser visto ao longo dos anos (ou em uma população de clubes).

Um único ponto não tem como descrever a curva.

sexta-feira, 22 de junho de 2012

Crescimento das maiores torcidas brasileiras

Sem surpresas, as maiores torcidas do Brasil são do Flamengo, Corinthians, 5PFW, Palmeiras e Vasco (Figura 1). (Isso, claro, tirando as duas maiores - a anticorintiana e a antiflamenguista respectivamente.)

Figura 1. Evolução das cinco maiores torcidas de futebol no Brasil. (Eixo vertical em porcentagem dos respondentes.) Dados: Datafolha e Ibope.

Com alguma frequência, ouvimos e lemos alegação de que a torcida são-paulina é a que mais cresce. Os dados desmentem. A torcida tricolor tem crescido a uma taxa média de 0,13% ao ano. Mas a corintiana cresce a uma taxa de 0,19% ao ano.*

As do Flamengo (0,04%), Palmeiras (0,04%) e Vasco (0,02%) estão praticamente estagnadas.

*Upideite(23/jun/2012): Considerando-se os dados de pesquisa do CNT/Sensus de 2007 e da Pluri Consulturia de 2012, o índice de crescimento da torcida corintiana cai para 0,16% ao ano, ainda acima da taxa média são-paulina.

quarta-feira, 6 de junho de 2012

Corre, corre, Mulher-Maravilha

O gráfico abaixo (Figura 1) mostra casos de (sub)celebridades femininas adultas fantasiadas de Mulher-Maravilha (a trabalho, em festa de aniversário, de Dia das Bruxas, etc.) noticiados na imprensa.


Figura 1. Variação da idade de celebridades femininas adultas fantasiadas de Mulher-Maravilha ao longo dos anos. Pontos vermelhos: idade; pontos azuis: total de casos noticiados no ano; em amarelo: idade média das mulheres fantasiadas de Mulher-Maravilha no ano.

A idade média das mulheres foi de 30,0±5,9 anos, o intervalo mínimo/máximo foi de: 21 a 51 anos.

Embora possa haver um efeito de dados incompletos para tempos mais recuados, aparentemente há uma tendência de aumento do número de casos divulgados. (Figura 2)

Figura 2. Curva de crescimento do número de casos noticiados de celebridades femininas adultas vestidas de Mulher-Maravilha. Número de casos em logaritmo neperiano. Os casos de 2012 não foram incluídos.


Os casos considerados nesta análise (e outros) serão publicados aos sábados aqui.

sábado, 19 de maio de 2012

Glossário do futebol

Em 2005, foi defendida uma tese na Faculdade de Ciências e Letras da Unesp de Assis com um levantamento dos termos futebolísticos usados na imprensa escrita contemporânea.

Queiroz, J.M. 2005. Vocabulário do futebol na mídia impressa: o glossário da bola. Tese de doutoramento. Assis. FCL-Unesp (Assis). 948 pp.

São 741 pp. dedicadas ao glossário.

domingo, 15 de abril de 2012

Winning

No Grande Prêmio da China de 2012, a F1 conheceu seu 103o ganhador - desde 1950, são 864 GPs disputados. A maior vencedor é, claro, Michael Schumacher com 91 vitórias até aqui. O índice de diversidade de Shannon H é de 5,72 - a diversidade máxima seria de 9,75 para 864 GPs e de 6,69 para 103 vencedores.

O gráfico abaixo mostra a distribuição de vitórias na Fórmula 1 ao longo destes 62 anos de disputa.



O padrão é de distribuição gama, como o de times campeões nacionais de futebol, com parâmetro de escala θ = 10,4 e forma k = 0,8.

sábado, 25 de fevereiro de 2012

Analisando resultados: comparando listas 2

Na postagem anterior vimos como podemos comparar duas listas entre si, uma com a previsão e outra com o resultado final.

E quando temos três ou mais listas? Podemos utilizar o mesmo procedimento da comparação de duas listas? Sim, mas é preciso fazer uma alteração. Se usamos simplesmente o mesmo limite de 5%, para cada comparação as chances de erro se acumulam de modo exponencial: na primeira comparação temos os 5% de chances de aceitar uma hipótese como verdadeira sendo que ela é falsa (mais especificamente, de aceitar que o resultado tem significância estatística, quando, na verdade, é fruto do acaso - situação que os estatísticos chamam de erro do tipo I), na segunda comparação temos os mesmos 5%; ou seja, com duas comparações temos 1-(0,95)^2 = 9,75% de chance de errar; com três são 14,26%; com quatro, 18,55%; com dez, 40,13% e assim por diante.

Um método para corrigir isso é a correção de Bonferroni: simplesmente divide o nível de significância desejado pelo número de comparações realizadas.

Peguemos as previsões das classificações dos clubes brasileiros no Campeonato Brasileiro de Futebol da Série A de 20102011 feitas por nove jornalistas esportivos. E comparemos com o resultado final. Serão, no total, nove comparações. Se quisermos um nível de 5%, basta dividir 5%/9 e usar esse valor como o nível de aceitação ou rejeição para cada teste. Nas 9 comparações, a probabilidade acumulada de erro será de 4,9%.

A tabela abaixo mostra o resultado.

Todos os testes rejeitaram a hipótese nula de que a classificação prevista é igual à classificação final. Isto é, os palpites dos jornalistas esportivos foram todos furados. Como o palpite da Goldman Sachs para a Copa 2006.