Próximo: Definições para manipulação da dados, Anterior: descriptive, Acima: descriptive [Conteúdo][Índice]
O pacote descriptive
contém um conjunto de funções para fazer cálculos de estatística descritiva e desenhar gráficos. Juntamente com o código fonte três conjuntos de dados em suar árvore do Maxima: pidigits.data
, wind.data
e biomed.data
. Eles também podem ser baixados a partir de www.biomates.net
.
Qualque manual de estatística pode ser usado como referência para as funções no pacote descriptive
.
Para comentários, erros ou sugestões, por favor entre em contato comigo em ’mario AT edu DOT xunta DOT es’.
Aqui está um exemplo sobre como as funções de estatística descritiva no pacote descriptive
fazem esse trabalho, dependendo da natureza de seus argumentos, listas e matrizes,
(%i1) load ("descriptive")$ (%i2) /* univariate sample */ mean ([a, b, c]); c + b + a (%o2) --------- 3 (%i3) matrix ([a, b], [c, d], [e, f]); [ a b ] [ ] (%o3) [ c d ] [ ] [ e f ] (%i4) /* amostra de várias variáveis */ mean (%); e + c + a f + d + b (%o4) [---------, ---------] 3 3
Note que em amostras de várias variáveis a média é calculada em cada coluna.
No caso de muitas amostras amostras com possíveis tamanhos diferentes, A função do Maxima map
pode ser usada para pegar os resultados desejados de cada amostra,
(%i1) load ("descriptive")$ (%i2) map (mean, [[a, b, c], [d, e]]); c + b + a e + d (%o2) [---------, -----] 3 2
Nesse caso, duas amostras de tamanhos 3 e 2 foram armazenadas em uma lista.
Amostras de uma única variável devem ser armazenadas em listas como
(%i1) s1 : [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5]; (%o1) [3, 1, 4, 1, 5, 9, 2, 6, 5, 3, 5]
e amostras de várias variáveis em matrizes como em
(%i1) s2 : matrix ([13.17, 9.29], [14.71, 16.88], [18.50, 16.88], [10.58, 6.63], [13.33, 13.25], [13.21, 8.12]); [ 13.17 9.29 ] [ ] [ 14.71 16.88 ] [ ] [ 18.5 16.88 ] (%o1) [ ] [ 10.58 6.63 ] [ ] [ 13.33 13.25 ] [ ] [ 13.21 8.12 ]
Nesse caso, o número de colunas é igual à dimensão (ao número) de variáveis e o n;umero de linhas é o tamano da amostra.
Dados podem ser introduzidos manualmente, mas grandes amostras são usualmente armazenadas em ficheiros no formato texto plano. Por exemplo, o ficheiro pidigits.data
contém os primeiros 100 dígitos do número %pi
:
3 1 4 1 5 9 2 6 5 3 ...
Com o objectivo de chamar esses dígitos no Maxima,
(%i1) load ("numericalio")$ (%i2) s1 : read_list (file_search ("pidigits.data"))$ (%i3) length (s1); (%o3) 100
Por outro lado, o ficheiro wind.data
contém a média diária de velocidades do ventoem 5 estações meteorológicas na República da Irlanda (Esses dados são parte de um conjunto de dados tomados em 12 estações meteorológicas. O ficheiro original está disponivel livremente para download no Repositório de Dados StatLib e sua análise é discutida em Haslett, J., Raftery, A. E. (1989) Space-time Modelling with Long-memory Dependence: Assessing Ireland’s Wind Power Resource, with Discussion. Applied Statistics 38, 1-50). As linhas seguintes mostram como tornar os dados disponíveis para o Maxima:
(%i1) load ("numericalio")$ (%i2) s2 : read_matrix (file_search ("wind.data"))$ (%i3) length (s2); (%o3) 100 (%i4) s2 [%]; /* last record */ (%o4) [3.58, 6.0, 4.58, 7.62, 11.25]
Algumas amostras possuem dados não numéricos. Como um exemplo, o ficheiro biomed.data
(que é parte de outro grande ficheiro tomado do Repósitório de Dados StatLib) contém quatro medidas sanguíneas tomadas de dois grupos de pacientes, A
e B
, de diferentes idades,
(%i1) load ("numericalio")$ (%i2) s3 : read_matrix (file_search ("biomed.data"))$ (%i3) length (s3); (%o3) 100 (%i4) s3 [1]; /* first record */ (%o4) [A, 30, 167.0, 89.0, 25.6, 364]
O primeiro indivíduo pertence ao grupo A
, com 30 anos de idade e suas medidas sanguíneas foram 167.0, 89.0, 25.6 e 364.
Se deve tomar cuidado quando se trabalha com dados divididos por categorias. no exemplo seguinte, ao símbolo a
é atribuído um valor em algum momento anterior e então a amostra com valores divididos por categoria a
é interpretada como,
(%i1) a : 1$ (%i2) matrix ([a, 3], [b, 5]); [ 1 3 ] (%o2) [ ] [ b 5 ]
Próximo: Definições para manipulação da dados, Anterior: descriptive, Acima: descriptive [Conteúdo][Índice]