Próximo: , Anterior: , Acima: descriptive   [Conteúdo][Índice]

45.4, Funções e Variáveis Definidas específicas para estatística descritiva de várias variáveis

Função: cov (matriz)

A matriz de covariância da amostra de várias variáveis, definida como

              n
             ====
          1  \           _        _
      S = -   >    (X  - X) (X  - X)'
          n  /       j        j
             ====
             j = 1

onde \(X_j\) é a \(j\)-ésima linha da matriz de amostra.

Exemplo:

(%i1) load ("descriptive")$
(%i2) load ("numericalio")$
(%i3) s2 : read_matrix (file_search ("wind.data"))$
(%i4) fpprintprec : 7$  /* modifique a precisão para obter uma saída melhor */
(%i5) cov (s2);
      [ 17.22191  13.61811  14.37217  19.39624  15.42162 ]
      [                                                  ]
      [ 13.61811  14.98774  13.30448  15.15834  14.9711  ]
      [                                                  ]
(%o5) [ 14.37217  13.30448  15.47573  17.32544  16.18171 ]
      [                                                  ]
      [ 19.39624  15.15834  17.32544  32.17651  20.44685 ]
      [                                                  ]
      [ 15.42162  14.9711   16.18171  20.44685  24.42308 ]

Veja também a função cov1.

Função: cov1 (matriz)

A matriz de covariância da amostra de várias variáveis, definida como

              n
             ====
         1   \           _        _
   S  = ---   >    (X  - X) (X  - X)'
    1   n-1  /       j        j
             ====
             j = 1

where \(X_j\) is the \(j\)-th row of the sample matrix.

Exemplo:

(%i1) load ("descriptive")$
(%i2) load ("numericalio")$
(%i3) s2 : read_matrix (file_search ("wind.data"))$
(%i4) fpprintprec : 7$ /* modifique a precisão para obter uma saída melhor */
(%i5) cov1 (s2);
      [ 17.39587  13.75567  14.51734  19.59216  15.5774  ]
      [                                                  ]
      [ 13.75567  15.13913  13.43887  15.31145  15.12232 ]
      [                                                  ]
(%o5) [ 14.51734  13.43887  15.63205  17.50044  16.34516 ]
      [                                                  ]
      [ 19.59216  15.31145  17.50044  32.50153  20.65338 ]
      [                                                  ]
      [ 15.5774   15.12232  16.34516  20.65338  24.66977 ]

Veja também a função cov.

Função: global_variances (matriz)
Função: global_variances (matriz, valor_lógico)

A função global_variances retorna uma lista de medidas de variância global:

  • variância total: trace(S_1),
  • variância média: trace(S_1)/p,
  • variância generalizada: determinant(S_1),
  • desvio padrão generalizado: sqrt(determinant(S_1)),
  • variância efetiva determinant(S_1)^(1/p), (defined in: Peña, D. (2002) Análisis de datos multivariantes; McGraw-Hill, Madrid.)
  • desvio padrão efetivo: determinant(S_1)^(1/(2*p)).

onde p é a dimensão das várias variáveis aleatórias e \(S_1\) a matriz de covariância retornada por cov1.

Exemplo:

(%i1) load ("descriptive")$
(%i2) load ("numericalio")$
(%i3) s2 : read_matrix (file_search ("wind.data"))$
(%i4) global_variances (s2);
(%o4) [105.338342060606, 21.06766841212119, 12874.34690469686, 
         113.4651792608502, 6.636590811800794, 2.576158149609762]

A função global_variances tem um argumento lógico opcional: global_variances(x,true) diz ao Maxima que x é a matriz de dados, fazendo o mesmo que global_variances(x). Por outro lado, global_variances(x,false) significa que x não é a matriz de dados, mas a matriz de covariância, evitando a repetição seu cálculo,

(%i1) load ("descriptive")$
(%i2) load ("numericalio")$
(%i3) s2 : read_matrix (file_search ("wind.data"))$
(%i4) s : cov1 (s2)$
(%i5) global_variances (s, false);
(%o5) [105.338342060606, 21.06766841212119, 12874.34690469686, 
         113.4651792608502, 6.636590811800794, 2.576158149609762]

Veja também cov e cov1.

Função: cor (matriz)
Função: cor (matriz, valor_lógico)

A matriz de correlação da maostra de várias variáveis.

Exemplo:

(%i1) load ("descriptive")$
(%i2) load ("numericalio")$
(%i3) fpprintprec:7$
(%i4) s2 : read_matrix (file_search ("wind.data"))$
(%i5) cor (s2);
      [   1.0     .8476339  .8803515  .8239624  .7519506 ]
      [                                                  ]
      [ .8476339    1.0     .8735834  .6902622  0.782502 ]
      [                                                  ]
(%o5) [ .8803515  .8735834    1.0     .7764065  .8323358 ]
      [                                                  ]
      [ .8239624  .6902622  .7764065    1.0     .7293848 ]
      [                                                  ]
      [ .7519506  0.782502  .8323358  .7293848    1.0    ]

A função cor tem um argumento lógico opcional: cor(x,true) diz ao Maxima que x é a matriz de dados, fazendo o mesmo que cor(x). Por outro lado, cor(x,false) significa que x não é a matriz de dados, mas a matriz de covariância, evitando a repetição de seu cálculo,

(%i1) load ("descriptive")$
(%i2) load ("numericalio")$
(%i3) fpprintprec:7$
(%i4) s2 : read_matrix (file_search ("wind.data"))$
(%i5) s : cov1 (s2)$
(%i6) cor (s, false); /* this is faster */
      [   1.0     .8476339  .8803515  .8239624  .7519506 ]
      [                                                  ]
      [ .8476339    1.0     .8735834  .6902622  0.782502 ]
      [                                                  ]
(%o6) [ .8803515  .8735834    1.0     .7764065  .8323358 ]
      [                                                  ]
      [ .8239624  .6902622  .7764065    1.0     .7293848 ]
      [                                                  ]
      [ .7519506  0.782502  .8323358  .7293848    1.0    ]

Veja também cov e cov1.

Função: list_correlations (matriz)
Função: list_correlations (matriz, valor_lógico)

A função list_correlations retorna uma lista de medidas de correlação:

  • matriz de precisão: o inverso da matriz de covariância \(S_1\),
           -1     ij
          S   = (s  )             
           1         i,j = 1,2,...,p
    
  • vetor de correlação multipla: \((R_1^2, R_2^2, ..., R_p^2)\), com
           2          1
          R  = 1 - -------
           i        ii
                   s   s
                        ii
    

    sendo um indicador do melhor do ajuste do modelo de regressão linear de várias variáveis dobre \(X_i\) quando o resto das variáveis são usados como regressores.

  • matriz de correlação parcial: como elemento \((i, j)\) sendo
                             ij
                            s
          r        = - ------------
           ij.rest     / ii  jj\ 1/2
                       |s   s  |
                       \       /
    

Exemplo:

(%i1) load ("descriptive")$
(%i2) load ("numericalio")$
(%i3) s2 : read_matrix (file_search ("wind.data"))$
(%i4) z : list_correlations (s2)$
(%i5) fpprintprec : 5$ /* for pretty output */
(%i6) z[1];  /* precision matrix */
      [  .38486   - .13856   - .15626   - .10239    .031179  ]
      [                                                      ]
      [ - .13856   .34107    - .15233    .038447   - .052842 ]
      [                                                      ]
(%o6) [ - .15626  - .15233    .47296    - .024816  - .10054  ]
      [                                                      ]
      [ - .10239   .038447   - .024816   .10937    - .034033 ]
      [                                                      ]
      [ .031179   - .052842  - .10054   - .034033   .14834   ]
(%i7) z[2];  /* multiple correlation vector */
(%o7)       [.85063, .80634, .86474, .71867, .72675]
(%i8) z[3];  /* partial correlation matrix */
       [  - 1.0     .38244   .36627   .49908   - .13049 ]
       [                                                ]
       [  .38244    - 1.0    .37927  - .19907   .23492  ]
       [                                                ]
(%o8)  [  .36627    .37927   - 1.0    .10911    .37956  ]
       [                                                ]
       [  .49908   - .19907  .10911   - 1.0     .26719  ]
       [                                                ]
       [ - .13049   .23492   .37956   .26719    - 1.0   ]

A função list_correlations também tem um argumento lógico opcional: list_correlations(x,true) diz ao Maxima que x é a matriz de dados, fazendo o mesmo que list_correlations(x). Por outro lado, list_correlations(x,false) significa que x não é a matriz de correlação, mas a matriz de covariancia, evitando a repetição de seu cálculo.

Veja também cov e cov1.


Próximo: , Anterior: , Acima: descriptive   [Conteúdo][Índice]

Informação da licença Javascript