Estatística
Avaliada a existência de correlação linear
entre duas variáveis quantitativas, um passo a seguir é estabelecer uma relação
matemática entre essas duas ou mais variáveis, onde uma variável dependente irá
variar em função das outras independentes. Isso ajuda a perceber como uma
variável influencia a outra, quando a independente é alterada, ou estabelecer
índices únicos de desempenho.
[Imagem: MedStatWeb] |
O QUE ATENTAR?
➡ Bibliografia anterior pode apontar qual a relação matemática que deve reger o
que se deseja modelar. Quando isso não acontece, é conveniente usar um modelo
linear, mas ele deve atender aos pressupostos de uma regressão.
➡ Os
pontos da reta de regressão serão dados por:
Y =
A + ΣBiXi
e os experimentais por
Y =
A + ΣBiXi + Ei
onde Xi
são as variáveis independentes e E
o efeito aleatório de variáveis que não foram consideradas no modelo (e que não
seria conveniente considerar).
➡ Os
erros devem ser variáveis aleatórias (em regressão linear simples, isso é fácil
de ver), ou seja, os pontos experimentais estarão aleatoriamente distribuídos
no entorno da reta de regressão. Com isso, assumirão distribuição normal com
média zero e desvio-padrão constante (homocedásticos).
➡ Devemos
fazer predições com a reta de regressão apenas no limite dos pontos
experimentais. Veja mais nos posts sugeridos.
COMO FAZER?
Podem ser utilizados diferentes métodos para
determinar os coeficientes A e Bi’s. Um deles, quando você
trabalha com duas variáveis e em um papel reticulado (monolog ou dilog, ou
quadriculado), é fazer um ajuste usando o bom senso, não tentando conter os
pontos, mas minimizar o erro. Isso é útil em experimentos.
Mas, em aplicações maiores e com grande
massa de dados, não é útil descrever os pontos sobre o papel e estabelecer qual
seria a relação deles. É preciso usar algum critério matemático para isso,
muitas vezes calculado por um software de estatística. Um deles é o método dos
mínimos quadrados, que busca minimizar os resíduos do efeito aleatório em
relação à reta de regressão.
Com o método dos mínimos quadrados aplicado,
tem-se uma reta de regressão. É preciso testar se os coeficientes A e Bi
são significantes por testes de hipóteses na estatística t, ou seja, se há o coeficiente linear e se os coeficientes
angulares apontam variáveis que realmente contribuam para explicar o modelo.
Um último indicativo da qualidade da
regressão que iremos apontar aqui é a capacidade de explicar a variação entre o
ponto experimental e o de regressão. Essa variação é dividida em duas partes:
variação explicada, ou seja, aquela diferença entre o valor dado pela regressão
(estimado) e a média e a variação não explicada, a diferença entre a média e o
ponto experimental. O coeficiente de determinação
R² soma os quadrados das variações explicadas e divide pela soma dos
quadrados das variações totais (diferenças entre valores estimados e
experimentais). Quão maior esse percentual, dentro do bom senso no número de
variáveis, mais o modelo dado pela regressão é confiável.
□
👉 E ainda mais
para você: Testes
de Hipóteses
GOSTOU DESTA POSTAGEM ☺? USANDO A BARRA DE BOTÕES, COMPARTILHE COM SEUS AMIGOS 😉!
0 Comentários
Seu comentário será publicado em breve e sua dúvida ou sugestão vista pelo Mestre Blogueiro. Caso queira comentar usando o Facebook, basta usar a caixa logo abaixo desta. Não aceitamos comentários com links. Muito obrigado!
NÃO ESQUEÇA DE SEGUIR O BLOG DO MESTRE NAS REDES SOCIAIS (PELO MENU ≡ OU PELA BARRA LATERAL - OU INFERIOR NO MOBILE) E ACOMPANHE AS NOVIDADES!