Medidas Estatísticas – tendência central e de dispersão

Matemática


Nem todos os valores matemáticos para uma dada variável são determinísticos, ou seja, apenas um valor exato para tanto (como por exemplo a sua massa corporal). Muitos valores que dadas variáveis assumem são obtidos com base em análises matemático-estatísticas, para determinar um valor que represente bem um conjunto de dados, como por exemplo, uma nota do aluno para seu curso de graduação, ou a provável resistência de um material com pequena probabilidade de erro. Esse valor também é acrescido de outros que definem características da massa de dados que o originou, o quanto esta se distancia de um valor médio, etc. 

Estatística
[Imagem: Wikipedia]


As medidas de tendência central ou medidas de posição são feitas com base em uma distribuição de frequência, chamada comumente de função distribuição de probabilidade. São três: média (harmônica, ponderada, geométrica ou aritmética), mediana e moda.

A média aritmética é um valor tal que metade dos dados se apresenta logo abaixo e metade dos dados se apresenta em valor superior em um conjunto de dados. A média aritmética representa um valor de soma dos dados constante, ou seja, multiplicando a média aritmética pelo número n de dados, obtém-se a própria soma dos dados originais. Porém, só irá representar uma boa medida estatística se os dados não forem muito dispersos (veremos como saber a seguir). Sua expressão matemática é dada por:

xmed = (1/n) · n i = 1 (xi)

Já a média harmônica é aquela em que a soma dos inversos é uma constante, seja somada com os inversos dos elementos de uma amostra, seja por n vezes o inverso desta média. Assim, tem-se:
hmed = (n) · [ n i = 1 (1/xi)]

A média geométrica, por sua vez, é um número tal que, elevado ao número n de dados de uma amostra, resulta no mesmo produto que contenha os dados da amostra como seus fatores. Sendo assim, temos:
gmed = [n i=1 (xi)]1/n

A média ponderada é uma média aritmética em que são dados ‘pesos’ diferentes para cada dado da amostra. Ao invés de ser obtida uma média pela soma de termos pelo número de termos, obtém-se a soma dos produtos entre pesos e dados da amostra dividida pela soma total de pesos. Assim, tem-se:

pmed = [1/ n i = 1 (pi)] · n i = 1 (pi · xi)

Em alguns casos, as notas de vestibulares são exemplos de médias ponderadas. Pode-se ter um vestibular em que a nota da prova da universidade tenha peso 75 e que a nota do ENEM tenha peso 25, por exemplo. A soma dos pesos [1/ 2 i = 1 (pi)] é igual a 100. Porém, muitas pessoas se confundem com o significado dos pesos, dizendo que a nota do vestibular corresponde a 75% da nota final no nosso exemplo, o que só seria verdade em alguns casos específicos. Supondo que um aluno tire nota 90 neste vestibular e 83 no ENEM (apenas para exemplificar), tem-se que a nota dele (média ponderada) é de 0,75 · 90 + 0,25 · 83 = 67,5 + 20,75 = 88,25. Verificando a participação da nota advinda do vestibular na composição final tem-se que 67,5/88,25 = 76,49% e não 75% como algumas pessoas diriam. Se a diferença entre as notas fosse maior, esta diferença ficaria ainda mais nítida.

A mediana é uma medida de tendência central, onde distribuições próximas à igualdade em torno da média aritmética tendem a ser semelhantes à média aritmética. Ordenando os valores da amostra em ordem crescente, quando esta amostra tiver um número n par de valores, a mediana md será a média aritmética entre os valores (n/2) e (n/2 + 1), enquanto que se n for ímpar, md será o próprio valor central. Já a moda, que nas passarelas espelha aquilo que se verá nas ruas, com parte de seus conceitos, na estatística nada mais é do que o número que mais aparece na amostra, ou seja, o mais frequente.

Passando às medidas de dispersão, que nos auxiliam a avaliar o quanto os dados variam em torno do valor da média aritmética, temos a Amplitude, o Desvio Padrão, o Desvio Médio, a Variância e o Coeficiente de Variação. Começando pela Amplitude, conhecida por todo o mundo pelas previsões do tempo, nada mais é do que a diferença entre os valores máximo e mínimo da amostra.

Passando para a Variância, esta é um dado mais apurado de dispersão, abrangendo todo o conjunto de dados. Obtém-se a média aritmética e, para cada desvio da média, este é elevado ao quadrado e dividido ou pelo número de n de dados ou por (n -1) quando tivermos a chamada variância experimental ou amostral. Sua expressão é dada por:

s² = (1/n) · n i = 1 (xi – xmed)² ou  [1/(n - 1)] · n i = 1 (xi – xmed

O desvio padrão, por sua vez, é dado pela raiz quadrada da variância ou da variância experimental / amostral. Destarte:

s = [(1/n) · n i = 1 (xi – xmed)²]1/2 ou  {[1/(n - 1)] · n i = 1 (xi – xmed)²}1/2

Porém, pode não ser conclusivo ver um desvio padrão por si só, conforme afirmam alguns estudiosos na área da Estatística. Suponhamos ter um desvio de duas unidades com um valor médio de 1 ou com um valor médio de 0,75. Para solucionar este problema surge o Coeficiente de Variação (de Pearson), que é a razão percentual entre desvio padrão e média aritmética. Logo:

CV = s/xmed

Assim, pelos nossos valores-exemplo, temos CV = 2/1 = 200% e 2/0,75 = 266%, respectivamente. Por fim, ainda temos a medida de desvio médio, ou que também podemos chamar de média dos desvios (de cada valor e a média aritmética). Sua expressão matemática:
d = (1/n) · n i = 1 (xi – xmed)


E ainda mais para você: Valores máximos e mínimos




GOSTOU DESTA POSTAGEM? USANDO A BARRA DE BOTÕES, COMPARTILHE COM SEUS AMIGOS!

Nenhum comentário:

Seu comentário será publicado em breve e sua dúvida ou sugestão vista pelo Mestre Blogueiro. Caso queira comentar usando o Facebook, basta usar a caixa logo abaixo desta. Muito obrigado!

NÃO ESQUEÇA DE SEGUIR O BLOG DO MESTRE NAS REDES SOCIAIS (PELO MENU ≡ OU PELA BARRA LATERAL - OU INFERIOR NO MOBILE) E ACOMPANHE AS NOVIDADES!

Tecnologia do Blogger.