Anterior: Funções e Variáveis Definidas específicas para estatística descritiva de várias variáveis, Acima: descriptive [Conteúdo][Índice]
A função dataplot
permite visualização direta de dados de amostra, ambas d uma única variável (lista) e de várias variáveis (matriz). Fornecendo valores para as seguintes opções que são alguns aspéctos de impressão que podem ser controlados:
'outputdev
, o valor padrão é "x"
, indica o formato de dispositivo/arquivo da figura de saída; valores corretos são "x"
, "eps"
e "png"
, para a tela, formato de arquivo postscript e formato de arquivo png, respectivamente.
'maintitle
, o valor padrão é ""
, é o título principal entre aspas duplas.
'axisnames
, o valor padrão é ["x","y","z"]
, é uma lista de nomes dos eixos x
, y
e z
.
'joined
, o valor padrão é false
, um valor lógico para selecionar pontos em 2D para serem unidos ou isolados.
'picturescales
, o valor padrão é [1.0, 1.0]
, fator de proporcionalidade para o tamanho do gráfico.
'threedim
, o valor padrão é true
, diz ao Maxima se ou monta-se o gráfico de uma matriz de três colunas como um diagrama 3D ou se monta-se o gráfico como um diagrama de dispersão de várias variáveis. Veja exemplos abaixo.
'axisrot
, o valor padrão é [60, 30]
, modifica o ponto de visualização quando 'threedim
for escolhido para true
dados forem armazenados em uma matriz de três colunas. O primeiro número é o ângulo de rotação do eixo x, e o segundo número é o angulo de rotação do eixo z-axis, ambas as medidas em graus.
'nclasses
, o valor padrão é 10
, é o número de classes para histogramas na diagonal de gráficos de dispersão de várias variáveis.
'pointstyle
, o valor padrão é 1
, é um inteiro que indica como mostrar pontos de amostra.
Por exemplo, com a seguite entrada um gráfico simples dos primeiros vinte dígitos de %pi
é requisitado e a saída é armazenada em um arquivo no formato eps.
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) s1 : read_list (file_search ("pidigits.data"))$ (%i4) dataplot (makelist (s1[k], k, 1, 20), 'pointstyle = 3)$
Note que dados unidimensionais são colocados no gráfico como uma série de tempo. No caso seguinte, ocorre a mesma coisa só que com mais dados e com mais configurações,
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) s1 : read_list (file_search ("pidigits.data"))$ (%i4) dataplot (makelist (s1[k], k, 1, 50), 'maintitle = "Primeiros dígitos de pi", 'axisnames = ["ordem do dígito", "valor do dígito"], 'pointstyle = 2, 'joined = true)$
A função dataplot
pode ser usada para montar gráficos de pontos no plano. O exemplo seguinte é gráfico de dispersão de pares de pontos de velocidades de vento para o primeira e para o quinta estação meteorológica,
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) s2 : read_matrix (file_search ("wind.data"))$ (%i4) dataplot (submatrix (s2, 2, 3, 4), 'pointstyle = 2, 'maintitle = "Pares de medidas de velocidade do vento em nós", 'axisnames = ["Velocidade do vento em A", "Velocidade do vento em E"])$
Se pontos forem armazenados em uma matriz de duas colunas, dataplot
pode montar o gráfico desses pontos diretamente, mas se eles forem formatados em uma lista de pares, essa lista deve ser transformada em uma matriz como no seguinte exemplo.
(%i1) load ("descriptive")$ (%i2) x : [[-1, 2], [5, 7], [5, -3], [-6, -9], [-4, 6]]$ (%i3) dataplot (apply ('matrix, x), 'maintitle = "Pontos", 'joined = true, 'axisnames = ["", ""], 'picturescales = [0.5, 1.0])$
Pontos no espaço tridimensional podem ser vistos como uma projeção no plano. Nesse exemplo, o gráfico de velocidades do vento correspondendo a três estações meteorológicas são requisitados, primeiramente em um gráfico em 3D e a seguir em um gráfico de dispersão de várias variáveis.
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) s2 : read_matrix (file_search ("wind.data"))$ (%i4) /* 3D plot */ dataplot (submatrix (s2, 4, 5), 'pointstyle = 2, 'maintitle = "Pares de medidas de velocidades do vento em nós", 'axisnames = ["Estação A", "Estação B", "Estação C"])$ (%i5) /* Gráfico de dispersão de várias variáveis */ dataplot (submatrix (s2, 4, 5), 'nclasses = 6, 'threedim = false)$
Note que no último exemplo, o número de classes no histogramas da diagonal é escolhido para 6, e aquela opção 'threedim
for escolhida para false
.
Para mais que três dimensões somente gráficos de dispersão de várias variáveis são possível, como em
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) s2 : read_matrix (file_search ("wind.data"))$ (%i4) dataplot (s2)$
Essa função monta um gráfico de um histograma. Dados de amostras devem ser armazenados em uma lista de números ou em uma matriz de uma coluna. Fornecendo valores para as seguintes opções alguns aspéctos do gráfico podem ser controlados:
'outputdev
, o valor padrão é "x"
, indica o formato de arquivo da figura de saída; valores corretos são "x"
, "eps"
e "png"
, para a tela, formato de arquivo postscript e formato de arquivo png, respectivamente.
'maintitle
, o valor padrão é ""
, é o título principal entre aspas duplas.
'axisnames
, o valor padrão é ["x", "Fr."]
, é uma lista de nomes dos eixos x
e y
.
'picturescales
, o valor padrão é [1.0, 1.0]
, fator de proporcionalidade para o tamanho do gráfico.
'nclasses
, o valor padrão é 10
, é o número de classes ou o número de barras.
'relbarwidth
, o valor padrão é 0.9
, um número decimao entre 0 e 1 para controlar a largura das barras.
'barcolor
, o valor padrão é 1
, um inteiro para indicar a cor das barras.
'colorintensity
, o valor padrão é 1
, um número decimal entre 0 e 1 para estabelecer a intensidade da cor.
Nos próximos dois exemplos, histogramas são requisitados para os primeiros 100 dígitos do número %pi
e para velocidades do vento na terceira estação meteorológica.
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) s1 : read_list (file_search ("pidigits.data"))$ (%i4) histogram (s1, 'maintitle = "dígitos de pi", 'axisnames = ["", "Freqüência absoluta"], 'relbarwidth = 0.2, 'barcolor = 3, 'colorintensity = 0.6)$ (%i5) s2 : read_matrix (file_search ("wind.data"))$ (%i6) histogram (col (s2, 3), 'colorintensity = 0.3)$
Note tque no primeiro caso, s1
é uma lista e o segundo exemplo, col(s2,3)
é uma matriz.
Veja também a função barsplot
.
Similar a histogram
mas para variáveis estatísticas, numéricas ou divididas em categorias. As opções estão abaixo,
'outputdev
, o valor padrão é "x"
, indica o formato de arquivo da figura de saída; valores corretos são "x"
, "eps"
e "png"
, para a tela, formato de arquivo postscript e formato de arquivo png, respectivamente.
'maintitle
, o valor padrão é ""
, é o título principal entre aspas duplas.
'axisnames
, o valor padrão é ["x", "Fr."]
, é uma lista de nomes dos eixos x
e y
.
'picturescales
, o valor padrão é [1.0, 1.0]
, fator de proporcionalidade para o tamanho do gráfico.
'relbarwidth
, o valor padrão é 0.9
, um número decimao entre 0 e 1 para controlar a largura das barras.
'barcolor
, o valor padrão é 1
, um inteiro para indicar a cor das barras.
'colorintensity
, o valor padrão é 1
, um número decimal entre 0 e 1 para estabelecer a intensidade da cor.
Esse exemplo monta um gráfico de barras para os grupos A
e B
de pacientes na amostra s3
,
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) s3 : read_matrix (file_search ("biomed.data"))$ (%i4) barsplot (col (s3, 1), 'maintitle = "Grupos de pacientes", 'axisnames = ["Grupo", "# de indivíduos"], 'colorintensity = 0.2)$
A primeira coluna na amostra s3
armazena os valores das categorias A
e B
, também conhecidos algumas vezes como fatores. Por outro lado, os números inteiros positivos na segunda coluna sào idades, em anos, que se comportam como variável discreta, então podemos montar um gráfico as freqüências absolutas para esses valores,
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) s3 : read_matrix (file_search ("biomed.data"))$ (%i4) barsplot (col (s3, 2), 'maintitle = "Idades", 'axisnames = ["Anos", "# dos indivíduos"], 'colorintensity = 0.2, 'relbarwidth = 0.6)$
Veja também a função histogram
.
Essa função monta diagramas em caixas. O argumento data pode ser uma lista, que não é de grande interesse, uma vez que esses diagramas são principalmente usados para comparação entre diferentes amostras, ou uma matriz, eentão é possível comparar dois ou mais componentes de uma variável estatística de várias variáveis. Mas é também permitido data se uma lista de amostras com tamanhos diferentes de amostra, de fato essa é aa única função no pacote descriptive
que admite esse tipo de estrutura de dados. Veja o exemplo abaixo. Abaixo etão as opções,
'outputdev
, o valor padrão é "x"
, indica o formato de arquivo da figura de saída; valores corretos são "x"
, "eps"
e "png"
, para a tela, formato de arquivo postscript e formato de arquivo png, respectivamente.
'maintitle
, o valor padrão é ""
, é o título principal entre aspas duplas.
'axisnames
, o valor padrão é ["sample", "y"]
, é uma lista de nomes dos eixos x
e y
.
'picturescales
, o valor padrão é [1.0, 1.0]
, fator de proporcionalidade para o tamanho do gráfico.
Examples:
(%i1) load ("descriptive")$ (%i2) load ("numericalio")$ (%i3) s2 : read_matrix (file_search ("wind.data"))$ (%i4) boxplot (s2, 'maintitle = "Velocidade do vento em nós", 'axisnames = ["Estação do ano", ""])$ (%i5) A : [[6, 4, 6, 2, 4, 8, 6, 4, 6, 4, 3, 2], [8, 10, 7, 9, 12, 8, 10], [16, 13, 17, 12, 11, 18, 13, 18, 14, 12]]$ (%i6) boxplot (A)$