CÓMO UTILIZAR REGRESIÓN Y CORRELACIÓN EN INVESTIGAGICÓN DE
MERCADOS
José
Pérez Leal
Desde tiempos
inmemoriales el ser humano se ha interesado en conocer o predecir lo que le
espera en el futuro, lo que le ocurrirá o dejara de ocurrir si realiza u omite acciones
específicas y asocia empíricamente algunos sucesos con la ocurrencia de otros,
como por ejemplo; si cantan las chicharras pronto comenzará a llover, si hay
mucho calor (sensación térmica) hay peligro de temblor de tierra. Observaciones
que sin fundamento científico teórico pretende predecir lo que ocurrirá en un
aspecto o variable al evidenciarse el comportamiento de otra variable,
surgiendo la interrogante de si es esto posible:
¿Puede determinarse el comportamiento de un
fenómeno conociendo las pautas que sigue otro fenómeno relacionado? Y más aún
¿puede proveerse los que pasará con una variable de interés si se es capaz de
manipular de forma interesada otra?
Es así como en marketing
podría preguntarse ¿qué se espera que ocurra con el consumo de un producto o
servicio determinado si se interviene sobre los precios de adquisición o sobre
la frecuencia de exposición publicitaria, o se aumenta la cantidad de puntos de
ventas por ejemplo?
Es por esto que en Investigación
de Mercados con frecuencia existe interés en resumir la fuerza de la
asociación entre dos variables cuantitativas, como las siguientes situaciones:
¿Qué tan fuerte es la
relación entre las ventas y los gastos en publicidad?
¿Hay una asociación entre
la participación de mercado y el tamaño de la fuerza de ventas?
¿La percepción de calidad
de los consumidores está relacionada con su percepción de los precios?
Y de existir una relación
entre dichas variables de interés, cuál será el modelo matemático que mejor
describe dicha asociación, surgiendo así la Teoría de Regresión y Correlación
la cual establece que los fundamento científicos teóricos para establecer un
modelo que permite al investigador predecir lo ocurrirá a una variable si se
interviene sobre la otra, con un nivel de incertidumbre acordado, significación
o nivel de confianza.
Es bueno señalar que el
resultado predicho por un modelo de regresión es una esperanza o valor
esperado, siempre y cuando el resto de las condiciones continúen iguales.
El modelo de regresión
lineal
Existen muchos modelos
matemáticos que permiten predecir el comportamiento de una variable
cuantitativa con respeto a una o más variables predictoras que el investigador
puede manipular o fijar valores convenientemente. Así, puede establecerse el modelo
lineal de regresión lineal que establece que una variable puede ser proyectada
de acuerdo a una línea recta.
Sin embargo, puede ser
predicha mediante una parábola o ecuación de segundo grado, o mediante una función exponencial o cualquier otro tipo de
función que el investigador observe en el Comportamiento
de los Datos que se analizan. En este artículo nos centraremos solamente en
el Modelo de Regresión Lineal Simple, esto quiere decir que se relaciona una
variable dependiente o Variable Predictiva a otra variable independiente o Variable
Predictora. La variable independiente puede ser manipulada o fijada libremente
por el investigador mientras que la dependiente es quien reaccionará o tomará
valores de cuerdo al manejo que se haga de la variable independiente.
Así se establece el
modelo de regresión lineal con la ecuación de la línea recta:
Yi = a + bXi + ei
Donde b será la pendiente de la recta y se
interpreta como la variación esperada, de aumento o disminución de la variable
dependiente cada vez que la variable independiente sea incrementada en una
unidad.
Y a será el punto de corte de recta
cuando Xi toma el valor cero y se interpreta como el valor esperado
de la variable dependiente cuando la independiente es cero
Por ejemplo, se quiere
establecer el amento de la ventas con respecto a la inversión publicitaria. Entonces
b será el aumento esperado en Yi (las
ventas) por cada unidad monetaria adicional que se incremente la inversión en
publicidad que es Xi
Y por lo tanto a es el valor esperado en la ventas sin
no se invierte nada en publicidad.
La pendiente, b, se puede calcular en términos de la
covarianza entre X y Y (COVxy) y de la varianza de X como:
Y
a viene establecido por la fórmula:
Donde
X y Y, con la barra encima, se corresponde con la media aritmética de la
variable X y la variable Y respectivamente y n es el total de datos u
observaciones realizadas. Y la expresión ei corresponde al
error muestral
Esta la recta Yi = a + bXi + ei se
denomina Recta de Regresión de Mínimos
Cuadrados por ser la mejor línea recta para modelar los datos disponibles,
dados a que la suma de cuadrados de los errores es mínima
Más
adelante se presentará un ejemplo muy completo de aplicación para ayudar en la comprensión
mejor la teoría de regresión y correlación
El
coeficiente de correlación lineal
Existe una máxima en la
investigación científica que dice “si se parte de una premisa falsa o
equivocada, los resultados también serán falso” y en este contexto significa
que si partimos a hacer una predicción con dos variable utilizando el Método de
Regresión Lineal y las variables no se relacionan linealmente, entonces las
predicciones estarán equivocadas y cualquier decisión que se tome al respecto
tendrá una probabilidad muy alta de estar equivocada, siendo sus resultados
hasta desastrosos.
Es por esto que se
utilizará el Coeficiente de Correlación Lineal, el cual es un aporte de Karl
Pearson quien la propuso originalmente, también
llamado Coefiente Correlación de Pearson y viene dado por la fórmula:
Como se puede apreciar, en
estas ecuaciones, X y Y representan las medias muestrales; y Sx y Sy, las desviaciones típica de X y de Y
respectivamente.
Por otra parte Covxy, es la Covarianza entre X y
Y, mide el grado de relación entre X y Y. Ésta, la
covarianza, puede ser positiva o negativa. La división entre SxSy logra la estandarización, por lo que r viene a ser un valor que toma como mínimo menos uno y
como máximo más uno. Es decir que r oscila entre -1,00 y +1,00.
Además, se puede observar
que el coeficiente de correlación es un número absoluto y que no se expresa en
ninguna unidad de medida. El coeficiente de correlación entre dos variables
será el mismo, sin importar sus unidades de medida subyacentes.
Tomado en cuenta que el
objetivo del blog más que dar una demostración matemática teórica rigurosa es
mostrar la aplicación que puede hacerse en Investigación de Mercado y Estudios
de Opinión Pública los métodos y técnicas estadísticas más usuales.
Cabe destacar que en este artículo se trato de Regresión
Lineal Bivariada, porque solo intervienen dos variables o una variable
bidimensional y que existen la posibilidad de trabajar con tres o más variables
con la utilización de los Métodos
Multivariantes que permiten utilizar más de dos variables, donde se tiene
una variable dependiente y al menos dos independientes más un error.
Pasos para realizar un estudio de regresión y correlación
lineal
En forma sencilla y resumida se presenta a continuación los
pasos recomendados para hacer un análisis de regresión y correlación en un
estudio de mercado y opinión pública:
1. Una
vez recolectados los datos determinar las variables que quieren correlacionar,
de acuerdo con el problema de Investigación
de Mercados abordado
2. Realizar
el Diagrama de Dispersión de los datos, donde se visualiza en forma general si
existe algún tipo de asociación o correlación entre los datos.
3. Calcular
el Coeficiente de Correlación Lineal o Coeficiente de Pearson y determinar si
éste se encuentra cercano a -1 o a +1, de ser menor a -0,80 o mayor a +0,8 se
considera que la Correlación es alta
4. Una
vez determinado el coeficiente r
y verificar una buena correlación lineal se procede a los cálculos para obtener
la línea de Regresión de Mínimos Cuadrados que es la mejor línea recta que
expresa el modelo de regresión.
5. Interpretar
los resultados.
En Plepso Investigación utilizamos el software
estadísticos SPSS para el
procesamiento de datos y la generación de los distintos modelos matemáticos que
permiten interpretar los resultados
Recuerda suscribirte al blog y comparte con un Tweet, +1 o por Facebook
tus comentarios. Hasta una próxima entrega.
José
Pérez Leal
Director de Investigación y Proyectos
“En Plepso Investigaciones,
no le diremos lo que quiere escuchar, le mostraremos la realidad tal como la
encontramos”
Contáctenos hoy por: direccion@plepso.com.ve y jpleal@plepso.com.ve
Calle
Barbacoas, # P-342-D, sector Las Palmas, urb. Montaña Fresca, Maracay –
Venezuela
Tlf.:
0243 237.54.06 y 0412 439.25.85
Para
diseños de investigación de mercados, levantamiento de estudios de opinión
pública y de seguimiento electoral en Venezuela, no dude en contactar a Plepso Investigación, C. A. por sus
teléfonos 0243 237.54.06 y 0412 439.25.85, a sus sitio web http://www.plepso.com.ve o al correo
electrónico mercadeo@plepso.com.ve
y jpleal@plepso.com.ve
OTROS
ARTÍCULOS DE INTERÉS
|
|
REFERENCIABIBLIOGRÁFICAS Y
DOCUMENTALES
Chao
Lincoln, L. (1975) Estadísticas para
las Ciencias Administrativas. Editorial McGraw Hill. 2da Edición. México.
Rivas González,
E. (1975) Estadística Aplicada.
Colección Libros, Sección Obras de Estadística, División de Publicaciones. Facultad de Ciencias Económicas y Sociales, UCV,
2da Edición, Caracas 1975
Rivas González, E. (1979)
Estadística General. Ediciones de la
Biblioteca UCV, Sexta Edición,
Caracas 1979
Spigel, M. (1975) Estadística,
teoría y
875 problemas resueltos. Libros
McGraw Hill. Compendios Shaum, México
1975.
Kotler, P. y Arnstrong, G. (1996)
Administración de marketing México. Sexta edición. Editorial Prentice-Hall
Hispanoamericana, S.A Meucalpan de Juarez, Edo México
Malhotra, N (1997) Investigación de
mercado, un enfoque práctico. Naucalpan de Juárez México. Prentice Hall Segunda
Edición
No hay comentarios:
Publicar un comentario