Correlações canônicas
# a análise de correlações canônicas é utilizada para avaliar correlações entre dois grupos de variáveis, como por exemplo correlacionar variáveis da parte aérea de plantas com variáveis do sistema radicular ou, correlacionar variáveis relacionadas a produção com variaveis relacionadas a qualidade (ex.: produção de leite vs qualidade do leite).
# para exemplificar vamos considerar os dados simulados a seguir:
# baixe os dados via web
dados<-read.table("https://19e31fa08e.cbaul-cdnwnd.com/fd58c287e8dcea635dc0088984f5a026/200000047-24ffa26f24/correlações.txt",header=TRUE, sep="", dec=".")
dados
V1 V2 V3 L1 L2 L3 L4
1 45 500 25 12 5 18 89
2 48 460 29 16 9 25 80
3 55 420 56 19 8 69 55
4 62 390 48 19 4 32 23
5 63 375 75 22 3 14 12
6 72 350 96 23 2 5 10
# os dados se referem a dois grupos de variáveis (Grupo V com três variáveis e Grupo L com quatro). vamos separar os grupos em dois arquivos.
V=dados[,c(1,2,3)]
L=dados[,c(4,5,6,7)]
V
V1 V2 V3
1 45 500 25
2 48 460 29
3 55 420 56
4 62 390 48
5 63 375 75
6 72 350 96
L
L1 L2 L3 L4
1 12 5 18 89
2 16 9 25 80
3 19 8 69 55
4 19 4 32 23
5 22 3 14 12
6 23 2 5 10
# agora vamos requerer o pacote "yacca" que deve estar previamente instalado.
require(yacca)
# na sequência utilizaremos a função "cca( )"
cca(V,L)
# para um resultado mais completo
summary(cca(V,L))
# do resultado gerado pela função devemos ficar atento no seguinte:
# valores das correlações canônicas que devem ser significativos (pelo menos a primeira correlação CV1):
Canonical Correlations:
CV 1 CV 2 CV 3
1.0000000 1.0000000 0.7363036
Bartlett's Chi-Squared Test:
rho^2 Chisq df Pr(>X)
CV 1 1.00000 67.47488 12 9.476e-10 ***
CV 2 1.00000 32.12437 6 1.545e-05 ***
CV 3 0.54214 0.78120 2 0.6767
# Na sequência as correlações que permitem o estudo da associação entre as variáveis dos dois grupos. Observando o primeiro par canônico abaixo (CV 1), verifica-se que a variável V1 e V3 se correlacionam no mesmo sentido com L1 e de forma oposta a L4. Também verifica-se que a variável V2 correlaciona de forma oposta a L1 e no mesmo sentido de L4. E as variáveis L2 e L3 não são correlacionadas com variáveis do grupo V. A variável L2 ainda tem uma correlação fraca (0,57) que pode ser considerada. O segundo par canônico (CV 2) não fornece informações relevantes e o terceiro nem deve ser considerado por ser não significativo.
Structural Correlations (Loadings):
X Vars:
CV 1 CV 2 CV 3
V1 -0.9477672 0.2499445 -0.31089437
V2 0.9857650 -0.1219877 0.15446669
V3 -0.9427324 0.5003291 -0.06434098
Y Vars:
CV 1 CV 2 CV 3
L1 -0.9974319 0.1680747 0.05495388
L2 0.5743614 -0.4074123 0.76009809
L3 0.1405778 -0.3569417 0.62288443
L4 0.9473280 -0.0914460 0.30499271