Gráficos, dados e erros - Parte 1


O principal método utilizado para visualizar resultados ainda são os gráficos, especialmente os estáticos para publicações que ainda são feitas em papel. Mas a escolha do gráfico pode não só influenciar a percepção do leitor quanto as conclusões da pesquisa: muitas vezes olhar os dados em gráficos podem dar insights ao pesquisador sobre outros dados ou hipóteses que podem ser relevantes para o problema. Conhecento mais sobre gráficos é possível até evitar armadilhas do nosso próprio cérebro como as ilusões de ótica da imagem acima.

A teoria 

Os conceitos que serão mostrados nestes posts vêm de um paper bem antigo (tão velho quanto eu ;), chamado Graphical Perception and Graphical Methods for Analizing Cientific Data

A cada conceito, serão passados exemplos de uso em meios de comunicação e papers, mas se você possui conhecimento em leitura de inglês bom o sufuciente para não se perder, eu recomendo que leia o paper original.

Ironicamente, como o estudo é bem antigo, os gráficos usados não são coloridos e tem aspecto de terem sido feitos a mão. 


A conlusão do estudo enumera quais as melhores e piores representações baseado na porcentagem de erro dos participantes. Do melhor (menos erros) para o pior (mais erros) temos:

  1. Posição em mesma escala
  2. Posição em escala diferente
  3. Comprimento
  4. Ângulo
  5. Inclinação
  6. Area
  7. Volume
  8. Densidade
  9. Saturação (cor)
  10. Matiz (cor)

Exemplos

Os primeiros exemplos foram retirados do própio paper. O primeiro mostra a melhora ao transformar uma comparação de comprimento em uma comparação de posição em mesma escala. No gráfico abaixo, fica difícil comparar os 5 segmentos de cada classe porque o tamanho deles é muito parecido.


Para a classe A, você consegue dizer se o 5 é maior que o 3? Ou se o 2 é maior que o 4?
Isso pode ser resolvido colocando todos numa mesma escala.


Outro caso interessante é quando vamos comparar valores em curvas. Não é muito fácil dizer o quanto os valores das duas curvas se aproximam ou se distanciam:


E isso pode ser corrigindo criando uma terceira variável de diferença entre os dois gráficos e plotando em uma mesma escala.


Nos próximos posts vou colocar exemplos mais atuais de uso de gráficos, tanto de bons exemplos como de fails. Boa quarentena e até a próxima. =D 

Comentários

Top 3 em 1 ano: