Início do conteúdo
Covariância e Coeficiente de Correlação

Covariância

A covariância mede a relação linear entre duas variáveis. Ela é semelhante à correlação entre duas variáveis, no entanto, elas diferem nas seguintes maneiras:

  • Os coeficientes de correlação são padronizados. Assim, um relacionamento linear perfeito resulta em um coeficiente de correlação 1. A correlação mede tanto a força como a direção da relação linear entre duas variáveis.
  • Os valores de covariância não são padronizados. Portanto, a covariância pode variar de menos infinito a mais infinito. Assim, o valor para uma relação linear ideal depende dos dados. Como os dados não são padronizadas, é difícil determinar a força da relação entre as variáveis.

É possível utilizar a covariância para compreender a direção da relação entre as variáveis. Valores de covariância positivos indicam que valores acima da média de uma variável estão associados a valores médios acima da outra variável e abaixo dos valores médios são igualmente associado. Valores de covariância negativos indicam que valores acima da média de uma variável estão associados com valores médios abaixo da outra variável.

O coeficiente de correlação é uma função da covariância. O coeficiente de correlação é igual à covariância dividida pelo produto dos desvios padrão das variáveis. Portanto, uma covariância positiva sempre resulta em uma correlação positiva e uma covariância negativa sempre resulta em uma correlação negativa.

Nas Planilhas do Google a covariância possui a seguinte sintaxe COVAR(dados_y;dados_x) onde dados_y se refere ao intervalo que representa a matriz ou o conjunto de dados dependentes e dados_x se refere ao intervalo que representa a matriz ou o conjunto de dados independentes.

É importante salientar que os textos encontrados em argumentos valor serão ignorados e que a covariância positiva indica que dados independentes e dependentes tendem a mudar juntos na mesma direção, já a negativa indica que eles tendem a mudar em conjunto na direção oposta (ou seja, o aumento de um leva à diminuição do outro. O valor de magnitude de covariância é difícil de interpretar – use CORREL ou PEARSON, a versão normalizada de COVAR, para medir a força de correlação linear.

Note que o COVAR não serve para comparar variáveis com quantidade de elementos diferentes e o motivo é simples, porquê a covariância é um coeficiente para comparar variáveis de um mesmo dado, sendo assim, normalmente temos a mesma quantidade amostral, no vídeo abaixo ilustramos este uso.

 

 

Coeficiente de Correlação

Um coeficiente de correlação mede o grau pelo qual duas variáveis tendem a mudar juntas. A correlação de Pearson avalia a relação linear entre duas variáveis contínuas. Uma relação é linear quando a mudança em uma variável é associada a uma mudança proporcional na outra variável. Por exemplo, você poderia usar uma correlação de Pearson para avaliar se aumentos na temperatura da instalação de produção estão associados a uma redução da espessura da cobertura de chocolate.

Outra correlação possível é da ordem de posto de Spearman, nesta correlação se avalia a relação monotônica entre duas variáveis contínuas ou ordinais. Em uma relação monotônica, as variáveis tendem a mudar juntas mas não necessariamente a uma taxa constante. O coeficiente de correlação de Spearman baseia-se nos valores classificados de cada variável, em vez de os dados brutos. Esta correlação é muito usada para avaliar relações envolvendo variáveis ordinais. Por exemplo, você poderia usar a correlação de Spearman para avaliar se a ordem na qual os funcionários executam um teste está relacionada ao número de meses de emprego.

O coeficiente de correlação do Spearman vamos calcular manualmente para observarmos melhor a diferença entre os dois coeficientes de correlação, este se dá pela fórmula abaixo.


Quem não está acostumado com cálculos peço que não se assustem com a fórmula acima, basicamente significa 1 – ( Fração entre (6 x Somatório de diferença da ordem ao quadrado) sobre ((número de itens para se calcular) que multiplica por (este ao quadrado menos 1))). Vamos a um exemplo prático para visualizar isso. Observe no vídeo abaixo que à partir de cálculos simples é possível fazer cálculos mais complexos e sofisticados extremamente úteis no universo da estatística tais como as fórmulas de comparação entre variáveis.

 

 

fonte:minitab.com