Regressão linear: princípios

Estatística

Avaliada a existência de correlação linear entre duas variáveis quantitativas, um passo a seguir é estabelecer uma relação matemática entre essas duas ou mais variáveis, onde uma variável dependente irá variar em função das outras independentes. Isso ajuda a perceber como uma variável influencia a outra, quando a independente é alterada, ou estabelecer índices únicos de desempenho.

https://www.oblogdomestre.com.br/2018/09/RegressaoLinear.Principios.Matematica.html
[Imagem: MedStatWeb]



O QUE ATENTAR?


➡ Bibliografia anterior pode apontar qual a relação matemática que deve reger o que se deseja modelar. Quando isso não acontece, é conveniente usar um modelo linear, mas ele deve atender aos pressupostos de uma regressão.

Os pontos da reta de regressão serão dados por:

Y = A + ΣBiXi

e os experimentais por
Y = A + ΣBiXi + Ei

onde Xi são as variáveis independentes e E o efeito aleatório de variáveis que não foram consideradas no modelo (e que não seria conveniente considerar).

Os erros devem ser variáveis aleatórias (em regressão linear simples, isso é fácil de ver), ou seja, os pontos experimentais estarão aleatoriamente distribuídos no entorno da reta de regressão. Com isso, assumirão distribuição normal com média zero e desvio-padrão constante (homocedásticos).

Devemos fazer predições com a reta de regressão apenas no limite dos pontos experimentais. Veja mais nos posts sugeridos.

COMO FAZER?


Podem ser utilizados diferentes métodos para determinar os coeficientes A e Bi’s. Um deles, quando você trabalha com duas variáveis e em um papel reticulado (monolog ou dilog, ou quadriculado), é fazer um ajuste usando o bom senso, não tentando conter os pontos, mas minimizar o erro. Isso é útil em experimentos.

Mas, em aplicações maiores e com grande massa de dados, não é útil descrever os pontos sobre o papel e estabelecer qual seria a relação deles. É preciso usar algum critério matemático para isso, muitas vezes calculado por um software de estatística. Um deles é o método dos mínimos quadrados, que busca minimizar os resíduos do efeito aleatório em relação à reta de regressão.

Com o método dos mínimos quadrados aplicado, tem-se uma reta de regressão. É preciso testar se os coeficientes A e Bi são significantes por testes de hipóteses na estatística t, ou seja, se há o coeficiente linear e se os coeficientes angulares apontam variáveis que realmente contribuam para explicar o modelo. 

Um último indicativo da qualidade da regressão que iremos apontar aqui é a capacidade de explicar a variação entre o ponto experimental e o de regressão. Essa variação é dividida em duas partes: variação explicada, ou seja, aquela diferença entre o valor dado pela regressão (estimado) e a média e a variação não explicada, a diferença entre a média e o ponto experimental. O coeficiente de determinação R² soma os quadrados das variações explicadas e divide pela soma dos quadrados das variações totais (diferenças entre valores estimados e experimentais). Quão maior esse percentual, dentro do bom senso no número de variáveis, mais o modelo dado pela regressão é confiável.


👉 E ainda mais para você: Testes de Hipóteses



GOSTOU DESTA POSTAGEM ? USANDO A BARRA DE BOTÕES, COMPARTILHE COM SEUS AMIGOS 😉!

Postar um comentário

0 Comentários