Correlações canônicas

 

# a análise de correlações canônicas é utilizada para avaliar correlações entre dois grupos de variáveis, como por exemplo correlacionar variáveis da parte aérea de plantas com variáveis do sistema radicular ou, correlacionar variáveis relacionadas a produção com variaveis relacionadas a qualidade (ex.: produção de leite vs qualidade do leite).

 

# para exemplificar vamos considerar os dados simulados a seguir:

 

# baixe os dados via web

dados<-read.table("https://19e31fa08e.cbaul-cdnwnd.com/fd58c287e8dcea635dc0088984f5a026/200000047-24ffa26f24/correlações.txt",header=TRUE, sep="", dec=".")

 

dados

 

V1  V2 V3 L1 L2 L3 L4
1 45 500 25 12  5 18 89
2 48 460 29 16  9 25 80
3 55 420 56 19  8 69 55
4 62 390 48 19  4 32 23
5 63 375 75 22  3 14 12
6 72 350 96 23  2  5 10


# os dados se referem a dois grupos de variáveis (Grupo V com três variáveis e Grupo L com quatro). vamos separar os grupos em dois arquivos.


V=dados[,c(1,2,3)]
L=dados[,c(4,5,6,7)]

V
  V1  V2 V3
1 45 500 25
2 48 460 29
3 55 420 56
4 62 390 48
5 63 375 75
6 72 350 96

L
  L1 L2 L3 L4
1 12  5 18 89
2 16  9 25 80
3 19  8 69 55
4 19  4 32 23
5 22  3 14 12
6 23  2  5 10

# agora vamos requerer o pacote "yacca" que deve estar previamente instalado.


require(yacca)

# na sequência utilizaremos a função "cca( )"


cca(V,L)

# para um resultado mais completo


summary(cca(V,L))


# do resultado gerado pela função devemos ficar atento no seguinte:

 

# valores das correlações canônicas que devem ser significativos (pelo menos a primeira correlação CV1):

Canonical Correlations:

     CV 1      CV 2      CV 3 
1.0000000 1.0000000 0.7363036 

Bartlett's Chi-Squared Test:

        rho^2    Chisq df    Pr(>X)    
CV 1  1.00000 67.47488 12 9.476e-10 ***
CV 2  1.00000 32.12437  6 1.545e-05 ***
CV 3  0.54214  0.78120  2    0.6767    

# Na sequência as correlações que permitem o estudo da associação entre as variáveis dos dois grupos. Observando o primeiro par canônico abaixo (CV 1), verifica-se que a variável V1 e V3 se correlacionam no mesmo sentido com L1 e de forma oposta a L4. Também verifica-se que a variável V2 correlaciona de forma oposta a L1 e no mesmo sentido de L4. E as variáveis L2 e L3 não são correlacionadas com variáveis do grupo V. A variável L2 ainda tem uma correlação fraca (0,57) que pode ser considerada. O segundo par canônico (CV 2) não fornece informações relevantes e o terceiro nem deve ser considerado por ser não significativo.

 
Structural Correlations (Loadings):

	X Vars:
         CV 1       CV 2        CV 3
V1 -0.9477672  0.2499445 -0.31089437
V2  0.9857650 -0.1219877  0.15446669
V3 -0.9427324  0.5003291 -0.06434098

	Y Vars:
         CV 1       CV 2       CV 3
L1 -0.9974319  0.1680747 0.05495388
L2  0.5743614 -0.4074123 0.76009809
L3  0.1405778 -0.3569417 0.62288443
L4  0.9473280 -0.0914460 0.30499271