Próximo: Funções e Variáveis Definidas para gráficos estatísticos, Anterior: Funções e Variáveis Definidas para estatística descritiva, Acima: descriptive [Conteúdo][Índice]
A matriz de covariância da amostra de várias variáveis, definida como
n ==== 1 \ _ _ S = - > (X - X) (X - X)' n / j j ==== j = 1
onde \(X_j\) é a \(j\)-ésima linha da matriz de amostra.
Exemplo:
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) s2 : read_matrix (file_search ("wind.data"))$ (%i4) fpprintprec : 7$ /* modifique a precisão para obter uma saída melhor */ (%i5) cov (s2); [ 17.22191 13.61811 14.37217 19.39624 15.42162 ] [ ] [ 13.61811 14.98774 13.30448 15.15834 14.9711 ] [ ] (%o5) [ 14.37217 13.30448 15.47573 17.32544 16.18171 ] [ ] [ 19.39624 15.15834 17.32544 32.17651 20.44685 ] [ ] [ 15.42162 14.9711 16.18171 20.44685 24.42308 ]
Veja também a função cov1
.
A matriz de covariância da amostra de várias variáveis, definida como
n ==== 1 \ _ _ S = --- > (X - X) (X - X)' 1 n-1 / j j ==== j = 1
where \(X_j\) is the \(j\)-th row of the sample matrix.
Exemplo:
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) s2 : read_matrix (file_search ("wind.data"))$ (%i4) fpprintprec : 7$ /* modifique a precisão para obter uma saída melhor */ (%i5) cov1 (s2); [ 17.39587 13.75567 14.51734 19.59216 15.5774 ] [ ] [ 13.75567 15.13913 13.43887 15.31145 15.12232 ] [ ] (%o5) [ 14.51734 13.43887 15.63205 17.50044 16.34516 ] [ ] [ 19.59216 15.31145 17.50044 32.50153 20.65338 ] [ ] [ 15.5774 15.12232 16.34516 20.65338 24.66977 ]
Veja também a função cov
.
A função global_variances
retorna uma lista de medidas de variância global:
trace(S_1)
,
trace(S_1)/p
,
determinant(S_1)
,
sqrt(determinant(S_1))
,
determinant(S_1)^(1/p)
, (defined in: Peña, D. (2002) Análisis de datos multivariantes; McGraw-Hill, Madrid.)
determinant(S_1)^(1/(2*p))
.
onde p é a dimensão das várias variáveis aleatórias e \(S_1\) a matriz de covariância retornada por cov1
.
Exemplo:
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) s2 : read_matrix (file_search ("wind.data"))$ (%i4) global_variances (s2); (%o4) [105.338342060606, 21.06766841212119, 12874.34690469686, 113.4651792608502, 6.636590811800794, 2.576158149609762]
A função global_variances
tem um argumento lógico opcional: global_variances(x,true)
diz ao Maxima que x
é a matriz de dados, fazendo o mesmo que global_variances(x)
. Por outro lado, global_variances(x,false)
significa que x
não é a matriz de dados, mas a matriz de covariância, evitando a repetição seu cálculo,
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) s2 : read_matrix (file_search ("wind.data"))$ (%i4) s : cov1 (s2)$ (%i5) global_variances (s, false); (%o5) [105.338342060606, 21.06766841212119, 12874.34690469686, 113.4651792608502, 6.636590811800794, 2.576158149609762]
Veja também cov
e cov1
.
A matriz de correlação da maostra de várias variáveis.
Exemplo:
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) fpprintprec:7$ (%i4) s2 : read_matrix (file_search ("wind.data"))$ (%i5) cor (s2); [ 1.0 .8476339 .8803515 .8239624 .7519506 ] [ ] [ .8476339 1.0 .8735834 .6902622 0.782502 ] [ ] (%o5) [ .8803515 .8735834 1.0 .7764065 .8323358 ] [ ] [ .8239624 .6902622 .7764065 1.0 .7293848 ] [ ] [ .7519506 0.782502 .8323358 .7293848 1.0 ]
A função cor
tem um argumento lógico opcional: cor(x,true)
diz ao Maxima que x
é a matriz de dados, fazendo o mesmo que cor(x)
. Por outro lado, cor(x,false)
significa que x
não é a matriz de dados, mas a matriz de covariância, evitando a repetição de seu cálculo,
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) fpprintprec:7$ (%i4) s2 : read_matrix (file_search ("wind.data"))$ (%i5) s : cov1 (s2)$ (%i6) cor (s, false); /* this is faster */ [ 1.0 .8476339 .8803515 .8239624 .7519506 ] [ ] [ .8476339 1.0 .8735834 .6902622 0.782502 ] [ ] (%o6) [ .8803515 .8735834 1.0 .7764065 .8323358 ] [ ] [ .8239624 .6902622 .7764065 1.0 .7293848 ] [ ] [ .7519506 0.782502 .8323358 .7293848 1.0 ]
Veja também cov
e cov1
.
A função list_correlations
retorna uma lista de medidas de correlação:
-1 ij S = (s ) 1 i,j = 1,2,...,p
2 1 R = 1 - ------- i ii s s ii
sendo um indicador do melhor do ajuste do modelo de regressão linear de várias variáveis dobre \(X_i\) quando o resto das variáveis são usados como regressores.
ij s r = - ------------ ij.rest / ii jj\ 1/2 |s s | \ /
Exemplo:
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) s2 : read_matrix (file_search ("wind.data"))$ (%i4) z : list_correlations (s2)$ (%i5) fpprintprec : 5$ /* for pretty output */ (%i6) z[1]; /* precision matrix */ [ .38486 - .13856 - .15626 - .10239 .031179 ] [ ] [ - .13856 .34107 - .15233 .038447 - .052842 ] [ ] (%o6) [ - .15626 - .15233 .47296 - .024816 - .10054 ] [ ] [ - .10239 .038447 - .024816 .10937 - .034033 ] [ ] [ .031179 - .052842 - .10054 - .034033 .14834 ] (%i7) z[2]; /* multiple correlation vector */ (%o7) [.85063, .80634, .86474, .71867, .72675] (%i8) z[3]; /* partial correlation matrix */ [ - 1.0 .38244 .36627 .49908 - .13049 ] [ ] [ .38244 - 1.0 .37927 - .19907 .23492 ] [ ] (%o8) [ .36627 .37927 - 1.0 .10911 .37956 ] [ ] [ .49908 - .19907 .10911 - 1.0 .26719 ] [ ] [ - .13049 .23492 .37956 .26719 - 1.0 ]
A função list_correlations
também tem um argumento lógico opcional: list_correlations(x,true)
diz ao Maxima que x
é a matriz de dados, fazendo o mesmo que list_correlations(x)
. Por outro lado, list_correlations(x,false)
significa que x
não é a matriz de correlação, mas a matriz de covariancia, evitando a repetição de seu cálculo.
Veja também cov
e cov1
.
Próximo: Funções e Variáveis Definidas para gráficos estatísticos, Anterior: Funções e Variáveis Definidas para estatística descritiva, Acima: descriptive [Conteúdo][Índice]