quarta-feira, 16 de maio de 2018

Apito amigo? 2

O jornalista Mauro Cezar Pereira da ESPN, um entre tantos ferrenhos críticos da arbitragem brasileira de futebol, fez um levantamento de pênaltis marcados contra e a favor dos clubes. Ele destaca o saldo (isto é, a diferença entre pênaltis a favor e contra) grande positivo de Fluminense e Corinthians e negativo do Internacional. A ideia é interessante, mas do modo como foi feito é enganador.

Isso porque não considera o seguinte fato: clubes com defesas sólidas como a do Corinthians, que faz marcação alta no campo do adversário, oferece poucas oportunidades de penetração em sua área, e, por consequência, poucas oportunidades de pênaltis; por outro lado, clubes com ataques inoperantes tenderão a entrar pouco na área adversária e, por conseguinte, terão poucas ocasiões de sofrer pênaltis.

Um bom modo de analisar uma defesa sólida (e uma furada como peneira) é pelo número de gols sofridos. E um bom modo de analisar ataques produtivos (e também os improdutivos) é pelo número de gols marcados.

O resultado está na figura 1. (Compilando-se os gols pró e contra no mesmo período do levantamento de Pereira - a partir de 2010, incluindo até a 4a rodada da edição de 2018 do Campeonato Brasileiro de Futebol Série A - e subtraindo os gols de penalidades para eliminar eventuais autocorrelações.)

Figura 1. Correlação entre gols marcados ou sofridos e pênaltis a favor e contra para o Campeonato Brasileiro de Futebol Série A (entre 2011 e a 4a rodada de 2018). Em vermelho: pênaltis e gols contra; em azul: pênaltis e gols a favor.*

A situação do Corinthians é consistente com o fato de ter um ataque relativamente produtivo e uma defesa muito sólida - os pontos não se afastam muito da curva de ajuste. Fluminense e Internacional talvez sejam mesmo pontos fora. Embora também não se afastem tanto das curvas, o ângulo da reta formado pelos pontos de gols/pênaltis favoráveis e contrários, em relação às curvas de ajuste no caso do Fluminense é bem acentuado positivamente; do Inter, bem acentuado negativamente.

*Upideite(17.mai.2018): A versão anterior da figura indicava o ponto dos gols/pênaltis contra o Corinthians no lugar errado.

Figura 2. Relação entre pênaltis marcados a favor pelo total de gols pró marcados e pênaltis contra pelo total de gols marcados contra. Média por equipe na disputa pelo Campeonato Brasileiro de Futebol Série A. A linha horizontal marca a média de todos os clubes no período de 2010 a 2018 (até a 4a rodada). A variação maior dos clubes à direita da Chapecoense é bastante influenciada pelos números menores - tanto de pênaltis quanto de gols - e relativamente poucas participações no certame.

Apito amigo?

Entre 2011 e 2013, o projeto colaborativo Placar Real analisava os lances polêmicos dos jogos do Campeonato Brasileiro da Série A e corrigia o placar eliminando-se os erros de arbitragem: validação de gol impedido, anulação de gol legítimo, marcação errada de pênalti ou não marcação incorreta de pênalti (considerando sempre que seriam convertidos).

Desde o ano passado a CBF divulga em seu site as análises da comissão de arbitragem de lances capitais das partidas do Campeonato Brasileiro em suas várias séries, incluindo, claro a primeira divisão.

Infelizmente o site do Placar Real encontra-se atualmente fora do ar, mas é possível se encontrar os resultados finais na internet. Aqui para 2011, 20122013. As análises da comissão de arbitragem da CBF para 2017 também parece não estar mais na página da entidade, mas podemos ver as principais conclusões aqui.

Considerando-se os dados do Placar Real, entre 2011 e 2013, ao lado do Palmeiras, o Corinthians foi o clube que mais *perdeu* pontos por erros de arbitragem: 14 pontos cada. O clube que mais ganhou, foi o Flamengo, 13 pontos, seguido de Santos, 12 pontos; Cruzeiro, 10 pontos, e Fluminense, 9 pontos. (Fig. 1.)
Figura 1. Total de pontos ganhos em função de erros de arbitragem por clubes por edição do Campeonato Brasileiro de Futebol Série A nos anos de 2011, 2012 e 2013, e a média de pontos ganhos por campeonato. Fonte: Placar Real.

Se corrigirmos os placares pelas análises da comissão de arbitragem da CBF, em 2017, os clubes que mais ganharam pontos por erros de arbitragem foram Atlético-MG e Sport, com 2 pontos a mais de saldo; Avaí, Bahia, Corinthians, Flamengo e São Paulo, tiveram 1 ponto a mais do que deveriam. Atlético-GO, Chapecoense, Cruzeiro, Ponte Preta e Vasco foram prejudicados em 1 ponto. E quem mais perdeu foram Botafogo e Coritiba, que ficaram com 3 pontos a menos. (Fig. 2.)


Figura 2. Total de pontos ganhos em função de erros de arbitragem por clubes na edição de de 2017 do Campeonato Brasileiro de Futebol Série A. Fonte: CBF.

A reclamação recorrente de favorecimento pela arbitragem contra o Flamengo pode encontrar algum apoio nos dados, bem como a reclamação da torcida vascaína de que sejam prejudicados. Já a acusação de que o Corinthians seja beneficiado pelo apito amigo não é muito consistente com os dados.

sexta-feira, 19 de agosto de 2016

Medalha, medalha, medalha 2

Sediar as Olimpiadas, de modo geral, tem um efeito de aumentar o desempenho do país na edição em comparação com seu desempenho médio em todas as edições dos jogos.

Os gráficos abaixo ilustram isso de três modos: a melhor na posição do ranking no quadro de medalhas (Fig. 1), o aumento do número absoluto de medalhas (Fig. 2) e o aumento do número relativo de medalhas (relativo ao número médio de medalhas recebidas por edição olimpica) (Fig. 3). Considerando-se as Olimpiadas de Verão de 1896 a 2012.

Figura 1. Desempenho do país sede nos jogos em casa em comparação com a posição geral no ranking de medalhas no somatório de todas as participações (considerando o ordenamento pelo número de medalhas de ouro, seguido pelo número de prata e, por fim número de bronze). A linha laranja é referência se o ranqueamento não fosse afetado: os pontos acima da linha indicam uma piora no ranking de medalhas, os pontos abaixo indicam uma melhora.

Em somente duas edições, o país sede apresentou uma posição no ranking de medalhas pior do que seu desempenho geral na história olimpica: Londres 1948 (mas o Reino Unido foi bem nas outras vezes em que recebeu os jogos em Londres: 1908, quando ficou em primeiro, e em 2012, em terceiro) e Montreal 1976. Nas edições em que os Jogos Olimpicos foram realizados nos EUA, claro, não houve melhora - continuou sendo o primeiro no quadro. Somente países top 7 no ranking geral conseguiram ser o primeiro no quadro pelo menos uma vez quando sediaram o evento. Os maiores saltos de desempenho do país-sede foram: Cidade do México 1968; Atenas 1896 (o que não conta muito em função de ser a primeira edição, com poucos países e poucas medalhas em jogo); Barcelona 1992 e Antuérpia 1920.

Figura 2. Desempenho do país sede nos jogos pelo número absoluto de medalhas (soma de medalhas de ouro, prata e bronze), A linha laranja é referência se o total de medalhas não fosse afetado: os pontos acima indicam um aumento no total de medalhas recebidas em comparação com a média de medalhas recebidas por edição; os pontos abaixo, indicam uma piora.

De modo geral, quanto mais medalhas um país costuma receber por edição olimpica, maior o aumento do número absoluto de medalhas quando sedia a competição. Somente em três edições o país sede ficou em sua média histórica - pouca coisa abaixo: além de Londres 1948 e Montreal 1972, Munique 1972 (comparando-se o desempenho da Alemanha Ocidental, não da Alemanha pré-guerra, nem pós-reunificação).

Figura 3. Desempenho do país sede nos jogos pelo número de medalhas recebidas nas edições em casa em relação ao número médio de medalhas recebidas por edição. A linha laranja é referência se o total de medalhas não é afetado: acima da linha estão os pontos em que ocorre um aumento no total de medalhas; abaixo, uma piora.

Em termos relativos, os países com um menor número médio de medalhas por edição tendem a apresentar um ganho maior. O pior desempenho foi em Londres 1945, em que o Reino Unido obteve apenas cerca de 80% das medalhas que recebe em média por edição: 23 medalhas no total versus 28,9 de sua média histórica.

sexta-feira, 15 de abril de 2016

Sem clubes: um gigante que cai

Volta e meia com a liberação de uma nova pesquisa sobre tamanho das torcidas, comentaristas esportivos destacam (até surpresos) que o grupo dos que se declaram "sem clube" de preferência é superior em tamanho ao grupo de torcedores de qualquer clube individualmente - até de flamenguistas e corintianos.

Mas no longo prazo - isto é, desde pelo menos 1982 -, menos e menos pessoas não torcem para time algum; ou, de modo equivalente, mais e mais pessoas adotam algum time do coração.

No início da década de 1980, os que não torciam por equipe nenhuma eram quase 40%. Hoje são por volta de 20-25%. (Fig. 1.)

Figura 1. Evolução de brasileiros que não torcem por nenhum clube de futebol (laranja). Para fins de comparação, valores para os dois clubes com as maiores torcidas do país: Flamengo (amarelo) e Corinthians (azul). Fonte: Datafolha, Ibope, Gallup, Paraná Pesquisas, Sensus e Pluri.

quarta-feira, 13 de abril de 2016

Defesas de pênalti: Salto de qualidade? Não é o que dizem os números.

O blogue Numerólogos fez uma comparação com números levantados a respeito de resultados de cobranças de pênaltis no futebol brasileiro. A conclusão da análise é que houve um aumento do número de defesas e isso foi atribuído a melhor treinamento dos goleiros.

Das 120 primeiras cobranças de pênaltis em 2015 e igual número em 2016 analisadas, o levantamento obteve os resultados apresentados na tabela 1.


Tabela 1. Resultados de cobranças de pênaltis no futebol brasileiro. (Rebotes são considerados defesas mesmo em caso de gol.)
2015 2016
Total 120 120
Defendidos 20 27
Convertidos 88 83
Fora 7 4
Trave 5 6
Fonte: Numerólogos

Fazendo um teste qui quadrado, obtemos um valor de p=0,24. Se juntamos as categorias "defendidos", "fora" e "trave" contra "convertidos", p=0,34; se juntamos as categorias "convertidos", "fora" e "trave", p=0,13. Em todas as situações (para alfa=0,05), não derrubamos a hipótese nula: de que a diferença deve-se somente a flutuações casuais.

Em um prazo mais longo pode ser que haja diferenças estatisticamente significativas, no entanto, dificilmente há um salto de um ano para outro.

sábado, 27 de fevereiro de 2016

Escanteio curto pra quê? Curto e grosso: porque funciona.

O aumento da frequência de cobranças curtas de escanteio por equipes brasileiras tem sido acompanhado com aumento da frequência de críticas a esse estilo de cobrança. Mas por quê, então, técnicos insistem em treinar tal estilo e implementá-lo nos jogos?

A resposta curta é: porque funciona.

"Corner-kick preparation time and attempts at goal
[...] Short corner kicks are far more effective when the time from the corner kick being awarded to being executed is less than 20 seconds. Similarly, short corner kicks involving a pass and a direct cross into the box are also far more successful if taken quickly. In contrast, corner kicks played directly into the penalty area are more effective when the preparation time is greater than 20 seconds, thereby allowing teams to send defensive player into the attacking penalty area and to organize effectively for the expected ball delivery. Similar results were obtained for the 2000 European Championships." P. 114
["Preparação de cobrança de escanteio e chute a gol.
[...] Cobranças curtas de escanteio são bem mais efetivas quando o tempo entre a marcação do escanteio e a cobrança é de menos de 20 segundos. Do mesmo modo, cobranças curtas envolvendo um passe e cruzamento direto na área são muito mais efetivas se feitas rapidamente. Em contraste, escanteios cobrados diretamente para a área são muito mais eficientes quando o tempo de preparação é maior do que 20 segundos, permitindo, assim, às equipes enviarem jogadores de defesa na área de ataque e se organizarem efetivamente para a chegada esperada da bola. Resultados similares foram obtidos na Eurocopa de 2000."]
Carling, C. et al. 2007. Handbook of Soccer Match Analysis: A Systematic Approach to Improving Performance. 184 pp.

Claro que nem sempre funciona. E, de fato, a taxa é baixa. Cerca de 2 a 4%. Mas a conversão de cobranças de escanteio em geral é baixa, algo entre 1 e 5%. Na média, cobranças curtas são tão ou mais eficientes do que cobranças longas. (Tab 1.)

Tabela 1. Resultados de cobranças de escanteio na Premier League temporada 2001/2. Fonte: Taylor et al. in Reilly et al. (eds) 2005 p. 231
estilo frequência resultados
mal sucedidos
gols chutes a gol
certos
chutes a gol
errados
curvo para dentro
(fechado)
79 57 4 11 7
curvo para fora
(aberto)
66 38 1 10 17
reto 36 28 0 3 5
primeiro pau 9 6 0 3 0
curto 27 20 1 2 4

Além disso, a introdução de variação no estilo de cobrança introduz um fator de incerteza para a equipe adversária, o que tende a tornar suas táticas defensivas menos eficientes.

terça-feira, 8 de setembro de 2015

A caixinha de surpresas em números

Fiz uma simulação de 1.000 campeonatos brasileiros de futebol (20 clubes) com resultados aleatórios seguindo as probabilidades de 40:30:30 (de vitória, empate e derrota) em casa - e 30:30:40 em jogos fora. Plotei no gráfico a distribuição resultante de pontuações finais das equipes, juntamente com a distribuição das pontuações reais das equipes nos campeonatos desde 2006 (quando a fórmula atual de pontos corridos em turno e returno com 20 times foi finalmente adotada) (Fig. 1).

A média na simulação foi de 51,005 ((± 7,821) pontos. Nos campeonatos reais: 51,867 (± 11,546).


Figura 1. Distribuição de pontuações finais em campeonatos brasileiros de futebol simulados (n=1.000) e reais (n=9; período: 2006-2014).

O gráfico de correlação entre a distribuição simulada e a real, dá um índice de determinação de 0,63. Mais de 60% da variância das pontuações finais podem ser explicados pela proporção 40:30:30.


Isso indica um forte papel do acaso e confirma o forte equilíbrio (os times são muito equivalentes em termos de competitividade desportiva).