22. ESTATÍSTICA BÁSICA: CONCEITOS, ANÁLISE EXPLORATÓRIA DE DADOS, MEDIDAS DE POSIÇÃO, MEDIDAS DE DISPERSÃO.
ESTATÍSTICA - Parte da Matemática que organiza e apresenta informações numéricas, além de obter conclusões a partir dessas informações.
Dados, tabelas e gráficos
Distribuição de freqüência
Quando da análise de dados, é comum procurar conferir certa ordem aos números tornando-os visualmente mais amigáveis. O procedimento mais comum é o de divisão por classes ou categorias, verificando-se o número de indivíduos pertencentes a cada classe.
1. Determina-se o menor e o maior valor para o conjunto:
2. Definir o limite inferior da primeira classe (Li) que deve ser igual ou ligeiramente inferior ao menor valor das observações:
3. Definir o limite superior da última classe (Ls) que deve ser igual ou ligeiramente superior ao maior valor das observações:
4. Definir o número de classes (K), que será calculado usando . Obrigatoriamente deve estar compreendido entre 5 a 20.
5. Conhecido o número de classes define-se a amplitude de cada classe:
6. Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe (inferior e superior)
Distribuições simétricas
A distribuição das frequências faz-se de forma aproximadamente simétrica, relativamente a uma classe média
Caso especial de uma distribuição simétrica
Quando dizemos que os dados obedecem a uma distribuição normal, estamos tratando de dados que distribuem-se em forma de sino.
Distribuições Assimétricas
A distribuição das freqüências apresenta valores menores num dos lados:
Distribuições com "caudas" longas
Observamos que nas extremidades há uma grande concentração de dados em relação aos concentrados na região central da distribuição.
-Medidas de tendência Central
As mais importante medidas de tendência central, são a média aritmética, média aritmética para dados agrupados, média aritmética ponderada, mediana, moda, média geométrica, média harmônica, quartis. Quando se estuda variabilidade, as medidas mais importantes são: amplitude, desvio padrão e variância.
Medidas
Média aritmética
Média aritmética para dados agrupados
Média aritmética ponderada
Mediana 1) Se n é impar, o valor é central, 2) se n é par, o valor é a média dos dois valores centrais
Moda Valor que ocorre com mais freqüência.
Média geométrica
Média harmônica
Quartil
Sendo a média uma medida tão sensível aos dados, é preciso ter cuidado com a sua utilização, pois pode dar uma imagem distorcida dos dados.
Pode-se mostrar, que quando a distribuição dos dados é "normal", então a melhor medida de localização do centro, é a média.
Sendo a Distribuição Normal uma das distribuições mais importantes e que surge com mais freqüência nas aplicações, (esse fato justifica a grande utilização da média).
A média possui uma particularidadebastante interessante, que consiste no seguinte:
se calcularmos os desvios de todas as observações relativamente à média e somarmos esses desvios o resultado obtido é igual a zero.
A média tem uma outra característica, que torna a sua utilização vantajosa em certas aplicações:
Quando o que se pretende representar é a quantidade total expressa pelos dados, utiliza-se a média.
Na realidade, ao multiplicar a média pelo número total de elementos, obtemos a quantidade pretendida.
Medidas de dispersão
Um aspecto importante no estudo descritivo de um conjunto de dados, é o da determinação da variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra.
Supondo ser a média, a medida de localização mais importante, será relativamente a ela que se define a principal medida de dispersão - a variância, apresentada a seguir.
10.2- Variância
Define-se a variância, como sendo a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um.
10.3- Desvio-padrão
Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão:
O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados.
Algumas propriedades do desvio padrão, que resultam imediatamente da definição, são:
o desvio padrão será maior, quanta mais variabilidade houver entre os dados.
Assinar:
Postar comentários (Atom)
Nenhum comentário:
Postar um comentário