Web Analytics: Quando as Estatísticas de Acesso Dão… os Números

Como orientar-se quando as estatísticas de acesso fornecem valores diferentes para o mesmo site

Os diversos programas de web analytics que medem os acessos de um site na internet muitas vezes mostram resultados diferentes um do outro deixando desorientado o proprietário do site. Já me deparei com muitos usuários irritados que não sabem como interpretar essa discordância de dados nas estatísticas de acesso de seus blogs.

O que acontece mais frequentemente (e talvez tenha acontecido a você também) é verificar em aplicações de estatísticas externas, como Google Analytics ou Lloogg, diferenças nos números, mas muita mesmo, em respeito às estatísticas de acesso integradas no próprio servidor.

Photo Credit: AnaBGD

Os falsos visitantes

A razão é muito simples: os programas de web analytics que monitoram os acessos lendo os files log do servidor web (como awstats, por exemplo) avaliam erroneamente como visitas muitos contatos que na realidade não o são. Eis uma lista dos mais comuns falsos positivos que podem exceder nas estatísticas de uma aplicação do tipo log analytics:

XML engines

Quando você insere o seu feed em agregadores XML se ativa um bot que de vez em quando controla o seu feed para verificar a presença de eventuais novos conteúdos. O Technorati, por exemplo, funciona deste modo: quanto mais você atualiza o seu site mais ele passa gerando um log de acesso que poderia ser confundido com um visitante mas, ao contrário, não é.

Spiders

A mesma conversa para os bots dos motores de busca que indexam as páginas web, às vezes, eles sobrecarregam tanto o servidor a ponto de derrubá-lo.

Trackback spammers

Esta é uma das causas mais comuns de falsos positivos. Se o seu blog administra os trackbacks, ele está sujeito a spam. Bots automáticos, de fato, chamam continuamente o script de trackbacks tentando inserir alguns links. Alguns desses bots são capazes até de modificar o próprio IP de proveniência cada vez que chamam o script de trackback, e poderiam, portanto, ser vistos como visitantes diferentes para cada chamada.

Spam nos comentários

A mesma conversa para os comentários: aplicações automáticas tentam continuamente inserir falsos comentários contendo links. Independentemente de serem bloqueados ou não eles entram no log e podem ser confundidos com visitantes.

Estas são as estatísticas de um site que tem cerca de 150 visitas reais por dia, mas o número que aparece no relatório é muito maior: são todas tentativas de spam (bloqueados) consideradas como visitas reais.

Como ter estatísticas de acesso confiáveis

Em poucas palavras, não é possível. Pelo menos utilizando apenas um programa de web analytics. Um conselho que dou é utilizar contemporaneamente ao próprio programa log analytics uma segunda aplicação externa que utiliza um javascript para inserir nas páginas que queremos monitorar (aconselho LLOOGG).

Desse modo, as tentativas de spam nos trackbacks ou nos comentários não serão nem mesmo levadas em consideração, pois as visitas serão contadas somente quando o javascript for executado na página de conteúdo. Em todo caso, você nunca terá as estatísticas absolutamente precisas, mas poderá ter uma idéia mais confiável sobre o real tráfego do seu blog.

Comments

comments