Matemática & Tecnologia
A Estatística, parte da Matemática que
trabalha com distribuições de dados em conjuntos e regras de formação, possui
dois tipos básicos de variáveis, que são as quantitativas (dados numéricos) e
as qualitativas (que envolvem alguma característica, algo não expresso
numericamente). Ao criar um modelo matemático para expressar um dado fenômeno,
seria importante levar em conta também as variáveis qualitativas, mas como
fazer isso se só podemos inserir números nesse modelo?
[Imagem: Frikipedia] |
Uma
forma de fazer isso é atribuir valores associados a essas variáveis
qualitativas, através de 4 técnicas básicas:
- Variáveis dicotômicas: se a variável
qualitativa possui duas alternativas básicas, como sim ou não, maior ou menor
do que, com ou sem, acima ou abaixo, etc. – este é um modelo a ser usado para
quantificar. Podem ser atribuídos dois diferentes valores para esta variável na
sua forma dicotômica, e esta entrar em regressão linear com base nestes dois.
Por simplicidade, é recomendável adotar os valores 0 ou 1 para estas duas
opções.
Quando
se tem três opções possíveis ou mais, há outras formas de converter para
quantitativo, mas esta também pode ser adotada, com um valor para a opção
escolhida e outro para as demais opções – por exemplo: há três marcas diferentes
de queijo, e se quer modelar o preço segundo a marca. Em regressão linear, os
coeficientes angulares Bi devem ser consistentes com a variável
dicotômica (se uma opção sim aumentar um preço, por exemplo, em maior proporção
do que a outra, seu coeficiente deve ser maior).
É
importante lembrar que, em caso de regressão linear, serão considerados n - 1 valores no modelo resultante.
- Variáveis proxy: pode não haver um valor
para quantificar esta variável, mas pode haver outro valor quantitativo que
expresse indiretamente essa variável qualitativa, a ser inserido em um modelo
matemático. Por exemplo – uma variável qualitativa como a qualidade de vida é
algo até mesmo subjetivo, mas pode ser expresso por meio do IDH; ou o padrão
construtivo de um edifício pode ser expresso por uma classificação por padrão
(qualitativa), que pode ser convertida em termos do CUB.
- Códigos alocados: tem-se um conjunto de
características e, por mais que sejam qualitativas, você sabe quais são mais ou
menos importantes para aquilo que você está avaliando por um modelo matemático.
Cada item da variável qualitativa pode ser expresso por um número natural não
nulo, começando por 1, sem necessariamente haver dados na amostra em todos os
valores. Ao entrar com dados em uma regressão linear múltipla, não pode haver interpolação
de valores, tampouco no uso do modelo. Por exemplo – tenho uma Ferrari, um Fusca
estilo colecionador e uma moto, e para descrever o valor, posso usar os números
30, 26 e 5 como valores quantitativos correspondentes.
- Códigos ajustados: a magnitude definida
no método de códigos alocados pode levar a resultados não muito bons. Assim,
pode ser interessante fazer regressão linear para obter os valores dos
coeficientes que indicam uma ou outra variável. Usa-se variáveis dicotômicas
para a regressão destinada aos coeficientes, sendo necessários pelo menos três
dados para cada item qualitativo.
□
GOSTOU DESTA POSTAGEM? USANDO A BARRA DE
BOTÕES, COMPARTILHE COM SEUS AMIGOS!
0 Comentários
Seu comentário será publicado em breve e sua dúvida ou sugestão vista pelo Mestre Blogueiro. Caso queira comentar usando o Facebook, basta usar a caixa logo abaixo desta. Não aceitamos comentários com links. Muito obrigado!
NÃO ESQUEÇA DE SEGUIR O BLOG DO MESTRE NAS REDES SOCIAIS (PELO MENU ≡ OU PELA BARRA LATERAL - OU INFERIOR NO MOBILE) E ACOMPANHE AS NOVIDADES!