[MÚSICA] Existe associação entre a satisfação dos clientes e a indicação da empresa para amigos? A idade e a intenção de compra se associam? A satisfação do funcionário interfere na quantidade de vendas? Muitas das variáveis observadas no mundo real podem apresentar relações lineares entre si, especialmente quando falamos pesquisas com pessoas, que muitas variáveis são latentes, essa linearidade pode aparecer com mais frequência. Ao final deste vÃdeo, você vai compreender o que é análise de correlação amplamente utilizado pesquisas nas ciências sociais e na análise de mercado. A correlação é uma medida de força da relação entre variáveis. A correlação é considerada tamanho de efeito da relação, mas a correlação não indica causalidade. Então, quando existe uma relação, nós só podemos afirmar que as variáveis estudo possuem uma ação conjunta, que é uma varia e a outra varia junto. As duas podem aumentar juntas, as duas podem diminuir juntas. Por exemplo, satisfação do cliente e percepção de valor. Se fizermos uma análise de correlação entre essas duas variáveis e encontrarmos efeito e significância, não poderemos afirmar que a satisfação aumenta a percepção ou que a percepção de valor aumenta a satisfação. Nós só podemos afirmar que existe uma correlação entre essas variáveis. A correlação só pode ser realizada com variáveis contÃnuas e quanto maior a variabilidade das variáveis utilizadas, mais adequado é o teste. A variabilidade interfere na capacidade de encontrar as diferenças ou semelhanças entre as variáveis. As variáveis contÃnuas são muito usadas, especialmente nas ciências sociais, e são avaliadas por meio de escalas. As variáveis contÃnuas, embora tenham suas limitações, nesses casos, podem ser mais próximas do mundo real. Imagine que é difÃcil você dizer se tem ou não satisfação, como uma variável categórica de sim e não, mas é mais fácil você estabelecer nÃvel de satisfação com uma nota de 0 a 10, porque assim você consegue dar intensidade a essa percepção. Outra caracterÃstica dessa análise é que ela é bivariada, ou seja, só envolve duas variáveis. Mesmo que nós escolhamos correlacionar várias variáveis, os resultados serão apresentados 2 a 2, assim como os gráficos da tela. Por meio dos gráficos, veja que há sempre duas variáveis x e y e que os seus pontos de ocorrências são apresentados num plano cartesiano, gráfico de dispersão. Por meio dos pontos da relação, conseguimos observar se essa relação existe, se ela é linear e qual a força e a direção da relação. Vamos analisar. Primeiro, é importante você compreender que o que a correlação faz é identificar, de acordo com as dispersões dos pontos, a reta que melhor representa a relação entre eles. O primeiro gráfico apresenta uma relação perfeita entre as variáveis. Perceba que todos os pontos passam pela reta formada. Então, podemos concluir que a relação entre as variáveis é linear. Essa reta está inclinada na descendente. Então, podemos dizer que a relação é negativa, uma variável aumenta e a outra variável diminui. Você pode observar isso imaginando os pontos e analisando os possÃveis valores de x e y. Podemos também ver que essa relação é forte, pois está inclinada aproximadamente 45 graus, que vamos ver adiante que é uma relação mais forte possÃvel. No segundo gráfico, superior direito, perceba que os pontos de relação entre as variáveis estão bem espalhados e a reta é gerada na horizontal. Se a reta é horizontal, o ângulo é zero. E então não existe relação entre as variáveis. No gráfico inferior esquerdo podemos ver que há uma relação entre as variáveis, pois todos os pontos se aproximam da reta formada. Mais que isso, podemos dizer que essa relação é positiva e forte. Por fim, no gráfico inferior direito, perceba que os pontos da relação forma uma parábola e a reta é horizontal. Nesse caso, não podemos dizer que há relação entre as variáveis, embora ela não seja detectada pela correlação. Essa relação é do tipo quadrática. Então, compreenda que antes mesmo de realizar o teste de correlação, os gráficos de dispersão com a reta formada já nos dizem muito sobre as relações entre as variáveis, mas nós ainda precisamos dos testes para saber o tamanho do efeito e a sua significância. A correlação é avaliada por meio do coeficiente de correlação de Pearson. Esse coeficiente é representado pela letra 'r' minúscula. O coeficiente de correlação é uma medida padronizada que varia de -1 a 1, sendo -1 uma relação perfeita negativa e +1 uma relação perfeita positiva. A medição da correlação parte de uma medida chamada covariância, sendo que a correlação é a covariância padronizada. Se você lembrar da variância, aquela famosa medida de dispersão, e pensar pouco como ela é calculada, você vai lembrar que ela analisa os desvios relação a média de uma variável. A covariância analisa os desvios das duas variáveis relação à s suas respectivas médias. O resultado é uma medida de associação entre elas. A medida padronizada, que é a correlação, é preferida, porque ela permite uma comparação diferentes estudos com diferentes tipos de variáveis. Além disso, com a padronização, é possÃvel identificar padrões de referência, sendo mais ou menos 0,1 considerado efeito pequeno, mais ou menos 0,3 considerado efeito médio, e mais ou menos 0,5 considerado efeito grande. Mas, a covariância pode ser muito útil termos absolutos para saber, considerando a unidade de medida de uma pesquisa especÃfica, qual vai ser o efeito compartilhado entre as variáveis. Geral, as relações, especialmente a sua causalidade, podem ser confirmadas com uma análise de regressão, que você verá nos próximos vÃdeos. [MÚSICA]