segunda-feira, 1 de fevereiro de 2010

ESTATÍSTICA BÁSICA: CONCEITOS, ANÁLISE EXPLORATÓRIA DE DADOS, MEDIDAS DE POSIÇÃO, MEDIDAS DE DISPERSÃO

22. ESTATÍSTICA BÁSICA: CONCEITOS, ANÁLISE EXPLORATÓRIA DE DADOS, MEDIDAS DE POSIÇÃO, MEDIDAS DE DISPERSÃO.


ESTATÍSTICA - Parte da Matemática que organiza e apresenta informações numéricas, além de obter conclusões a partir dessas informações.

Dados, tabelas e gráficos

Distribuição de freqüência

Quando da análise de dados, é comum procurar conferir certa ordem aos números tornando-os visualmente mais amigáveis. O procedimento mais comum é o de divisão por classes ou categorias, verificando-se o número de indivíduos pertencentes a cada classe.

1. Determina-se o menor e o maior valor para o conjunto:

2. Definir o limite inferior da primeira classe (Li) que deve ser igual ou ligeiramente inferior ao menor valor das observações:

3. Definir o limite superior da última classe (Ls) que deve ser igual ou ligeiramente superior ao maior valor das observações:

4. Definir o número de classes (K), que será calculado usando . Obrigatoriamente deve estar compreendido entre 5 a 20.

5. Conhecido o número de classes define-se a amplitude de cada classe:

6. Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe (inferior e superior)

Distribuições simétricas

A distribuição das frequências faz-se de forma aproximadamente simétrica, relativamente a uma classe média





Caso especial de uma distribuição simétrica

Quando dizemos que os dados obedecem a uma distribuição normal, estamos tratando de dados que distribuem-se em forma de sino.



Distribuições Assimétricas

A distribuição das freqüências apresenta valores menores num dos lados:





Distribuições com "caudas" longas

Observamos que nas extremidades há uma grande concentração de dados em relação aos concentrados na região central da distribuição.





-Medidas de tendência Central

As mais importante medidas de tendência central, são a média aritmética, média aritmética para dados agrupados, média aritmética ponderada, mediana, moda, média geométrica, média harmônica, quartis. Quando se estuda variabilidade, as medidas mais importantes são: amplitude, desvio padrão e variância.

Medidas

Média aritmética


Média aritmética para dados agrupados


Média aritmética ponderada


Mediana 1) Se n é impar, o valor é central, 2) se n é par, o valor é a média dos dois valores centrais

Moda Valor que ocorre com mais freqüência.

Média geométrica


Média harmônica


Quartil




Sendo a média uma medida tão sensível aos dados, é preciso ter cuidado com a sua utilização, pois pode dar uma imagem distorcida dos dados.

Pode-se mostrar, que quando a distribuição dos dados é "normal", então a melhor medida de localização do centro, é a média.

Sendo a Distribuição Normal uma das distribuições mais importantes e que surge com mais freqüência nas aplicações, (esse fato justifica a grande utilização da média).

A média possui uma particularidadebastante interessante, que consiste no seguinte:

se calcularmos os desvios de todas as observações relativamente à média e somarmos esses desvios o resultado obtido é igual a zero.

A média tem uma outra característica, que torna a sua utilização vantajosa em certas aplicações:

Quando o que se pretende representar é a quantidade total expressa pelos dados, utiliza-se a média.

Na realidade, ao multiplicar a média pelo número total de elementos, obtemos a quantidade pretendida.



Medidas de dispersão

Um aspecto importante no estudo descritivo de um conjunto de dados, é o da determinação da variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra.

Supondo ser a média, a medida de localização mais importante, será relativamente a ela que se define a principal medida de dispersão - a variância, apresentada a seguir.

10.2- Variância

Define-se a variância, como sendo a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um.





10.3- Desvio-padrão

Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão:

O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados.

Algumas propriedades do desvio padrão, que resultam imediatamente da definição, são:

o desvio padrão será maior, quanta mais variabilidade houver entre os dados.

Nenhum comentário:

Postar um comentário