PREPARACIÓN DE LOS DATOS
Después de definir el problema de
investigación y se desarrolla un enfoque apropiado, que se ha formulado un
diseño de investigación adecuado y que se realiza el trabajo de campo, el
investigador suele pasar a la preparación y el análisis de los datos, que es el
siguiente paso del proceso de investigación de mercados. Antes de que los datos
en bruto contenidos en los cuestionarios se sometan a un análisis estadístico,
deben convertirse a una forma apropiada para tal análisis.
La calidad de los resultados
estadísticos depende del cuidado que se tenga en la fase de preparación de los
datos. No prestar suficiente atención a la preparación de los datos pondría en
riesgo los resultados estadísticos, dando así lugar a resultados sesgados y a
una interpretación incorrecta.
En este artículo se describe el
proceso de recolección de los datos, el cual comienza con la revisión o control
de calidad de los cuestionarios para verificar que estén completos. Enseguida,
se analiza la depuración de los datos y se ofrecen lineamientos para manejar
las respuestas ilegibles, incompletas, incongruentes, ambiguas o
insatisfactorias. También se describe la codificación, trascripción y limpieza
de los datos, y se hace énfasis en el tratamiento de las respuestas faltantes y
en el ajuste estadístico de los datos. Se analiza la elección de una estrategia
de análisis de los datos y se clasifican las técnicas estadísticas. Se explican
los enfoques intracultural, pancultural y transcultural para el análisis de datos
en la investigación de mercados internacionales. Se identifican los problemas
éticos relacionados con el procesamiento de los datos, destacando la
eliminación de las respuestas insatisfactorias, el incumplimiento de las
suposiciones que subyacen a las técnicas de análisis de datos, y la evaluación
e interpretación de los resultados. Por último, se analiza el uso de programas
estadísticos para la preparación y análisis de los datos.
El proceso de preparación de los
datos
En la figura que se presenta a continuación
se muestra el proceso de preparación de los datos. El proceso completo es
guiado por el plan preliminar de análisis de datos que se formuló en la fase de
diseño de investigación. El primer paso consiste en verificar que los
cuestionarios sean aceptables, seguido por la verificación, codificación y
trascripción de los datos. Se depuran los datos y se recomienda un tratamiento
para las respuestas faltantes. Con frecuencia resulta necesario un ajuste
estadístico de los datos para que sean representativos de la población de
interés. El investigador debe entonces elegir la estrategia apropiada para el
análisis de los datos. La estrategia final de análisis de los datos difiere del
plan preliminar de análisis, debido a la información y los conocimientos obtenidos
desde que se formuló el plan original. La preparación de los datos debe empezar
tan pronto como se reciba el primer grupo de cuestionarios del campo, mientras
el trabajo de campo continúa. De este modo, si se detecta algún problema, es
factible modificar el trabajo de campo para incorporar alguna acción correctiva
oportunamente.

Control de calidad de los
cuestionarios recolectados
El paso inicial en la revisión del
cuestionario implica verificar todos los cuestionarios en cuanto a la calidad
de las entrevistas y a que estén terminados. A menudo estas revisiones se
realizan mientras el trabajo de campo sigue en proceso. Si se contrató a una
empresa de recolección de datos para realizar el trabajo de campo, el
investigador debe hacer una revisión independiente luego de que ésta ha
terminado. Un cuestionario que regresa del campo podría ser inaceptable por
varias razones:
1. Algunas partes del cuestionario
están incompletas.
2. El patrón de respuestas indica
que el encuestado no entendió o siguió las instrucciones. Por ejemplo, cuando
no se siguieron los patrones de salto.
3. Las respuestas muestran poca
varianza. Por ejemplo, un encuestado sólo marcó la opción número 4 en una serie
de escalas de calificación de 7 puntos.
4. Los cuestionarios entregados
están físicamente incompletos: faltan una o más páginas.
5. El cuestionario se recibió
después de la fecha establecida.
6. El cuestionario fue contestado
por alguien que no estaba calificado para participar.
Si se impusieron cuotas o el
tamaño de las células de trabajo, los cuestionarios aceptables deberán clasificarse
y contabilizarse de acuerdo con ello. Antes de revisar los datos, deben
identificarse los problemas para cumplir los requisitos del muestreo y tomar
las medidas correctivas pertinentes, como realizar entrevistas adicionales en
las células poco representadas.
Edición
La edición es la revisión de los
cuestionarios con el objetivo de incrementar su exactitud y precisión.
Consiste en examinar los
cuestionarios para identificar respuestas ilegibles, incompletas, incongruentes
o ambiguas.
Las respuestas pueden ser
ilegibles si se registraron mal, lo cual es muy frecuente en cuestionarios con
un gran número de preguntas no estructuradas. Los datos deben ser legibles para
codificarlos en forma correcta. Asimismo, los cuestionarios pueden estar
incompletos en diferentes grados. Las preguntas no respondidas pueden ser pocas
o muchas.
Hasta este punto, el investigador
hace una revisión preliminar de la congruencia. Es fácil detectar algunas incongruencias
evidentes. Por ejemplo, un encuestado reporta un ingreso anual de menos del
sueldo mínimo mensual, pero informa de compras frecuentes en tiendas por
departamento de prestigio.
Las respuestas a preguntas no
estructuradas pueden resultar ambiguas y difíciles de interpretar con claridad.
Tal vez la respuesta esté abreviada o quizá se utilizaron palabras ambiguas. En
el caso de las preguntas estructuradas, en ocasiones se marca más de una
respuesta en preguntas diseñadas para obtener una sola respuesta. Suponga que
un encuestado marca las opciones 2 y 3 en una escala de calificación de 5
puntos. ¿Significa esto que pretendía marcar 2,5? Para complicar más la
situación, el procedimiento de codificación sólo permite respuestas de un
dígito.
Tratamiento de las respuestas
insatisfactorias
El manejo de las respuestas
insatisfactorias por lo regular consiste en regresar el cuestionario al campo
para obtener mejores datos, asignar valores faltantes o descartar a los
encuestados insatisfactorios.
Devolución al campo, (revisitas): Los cuestionarios con respuestas
insatisfactorias pueden devolverse al campo, donde los entrevistadores vuelven
a hacer contacto con los encuestados. Este enfoque es atractivo sobre todo para
encuestas de mercados industriales y de negocios, donde los tamaños de las
muestras son pequeños y resulta sencillo identificar a los encuestados. No
obstante, los datos obtenidos en la segunda ocasión quizá sean diferentes de
los obtenidos en la encuesta original. Estas diferencias pueden atribuirse a
los cambios ocurridos al paso del tiempo o a diferencias en la forma de
aplicación del cuestionario (por ejemplo, entrevista telefónica o personal).
Asignación de valores faltantes: Si no es posible regresar los
cuestionarios al campo, el editor puede asignar valores faltantes a las
respuestas insatisfactorias. Este enfoque sería deseable si
1. El
número de encuestados insatisfactorios es pequeño
2. La
proporción de respuestas insatisfactorias para cada uno de estos encuestados es
pequeña
3. Las
variables con respuestas insatisfactorias no son las más importantes.
Descartar a los encuestados insatisfactorios: En este enfoque
simplemente se descarta a los encuestados con repuestas insatisfactorias. Dicha
estrategia resulta apropiada cuando
1. La
proporción de encuestados insatisfactorios es pequeña (menos del 10 por ciento)
2. El
tamaño de la muestra es grande
3. Los
encuestados insatisfactorios no difieren de los encuestados satisfactorios de
forma evidente (por ejemplo, en factores demográficos o características de uso
del producto),
4. la
proporción de respuestas insatisfactorias para cada uno de estos encuestados es
grande
5. Faltan
respuestas para las variables más importantes. Sin embargo, los encuestados
insatisfactorios pueden diferir de manera sistemática de los encuestados
satisfactorios y la decisión para designar a un encuestado como insatisfactorio
podría ser subjetiva. Ambos factores sesgan los resultados.
Si el investigador decide
descartar a los encuestados insatisfactorios, debería informar cuál fue el procedimiento
adoptado para identificarlos y cuántos fueron.
Codificación de cuestionarios
Codificar significa asignar un
código, por lo general un número, a cada respuesta posible de cada pregunta. El
código incluye una indicación de la posición en la columna (campo) y el
registro que ocupará el dato. Por ejemplo, el sexo de los encuestados se codifica
con 1 para las mujeres y 2 para los hombres. Un campo representa un solo dato,
como el sexo de los encuestados. Un registro consta de campos relacionados,
como sexo, estado civil, edad, tamaño de la casa, ocupación, etcétera.
A menudo, un solo registro
contiene todos los datos de un encuestado, aunque también es posible que se
utilicen varios registros para cada encuestado.
Los datos (todos los registros) de
todos los encuestados se guardan en archivos de computadora, como se ilustra en
la tabla siguiente. Esta tabla demuestra el caso más común de codificación,
donde puede utilizarse más de un registro para cada encuestado. En esta tabla,
las columnas representan los campos; y las filas, los registros.
Estos datos se codificaron de acuerdo
con el esquema de codificación especificado en la figura Las columnas 1 a 3
representan un solo campo y contienen los números de código de los encuestados
001 a 271. La columna 4 contiene el número de registro. Esta columna tiene el
valor de 1 para todas las filas, porque sólo se presenta el primer registro de
los encuestados. Las columnas 5 y 6 contienen el código del proyecto, que es
31. Las siguientes dos columnas, 7 y 8, muestran el código del entrevistador, que
varía de 01 a 55 porque se utilizaron 55 entrevistadores. Las columnas 26 a 35,
que representan cada una un campo, contienen las calificaciones de familiaridad
para las 10 tiendas, con valores que van de 1 a 6. Por último, la columna 77
representa la calificación de la tienda 10 en relación con los precios.
Advierta que las columnas 78 a 80 están en blanco. Hay 10 registros para cada
encuestado y 2,710 filas que indican que el archivo contiene los datos de los
271 encuestados.

Si el cuestionario sólo contiene
preguntas estructuradas o muy pocas preguntas no estructuradas, se realiza una
codificación previa. Esto significa que se asignan códigos antes de realizar el
trabajo de campo. Si el cuestionario contiene preguntas no estructuradas, los
códigos se asignan después de que el cuestionario se haya devuelto del campo (codificación
posterior).
Codificación de las preguntas
El código del encuestado y el
número de registro deben aparecer en cada registro de los datos. Sin embargo,
si sólo hay un registro para cada encuestado puede prescindirse del código de
registro.
Para cada encuestado tienen que
incluirse los siguientes códigos adicionales: código de proyecto, código del
entrevistador, códigos de fecha y hora, y código de validación. Es muy deseable
el uso de códigos de campo fijo, lo cual significa que el número de registros
para cada encuestado es el mismo y que para todos los encuestados aparecen los
mismos datos en las mismas columnas. De ser posible, deben usarse códigos
estándar para los datos faltantes. Por ejemplo, puede emplearse el código 9
para una variable de una sola columna, 99 para una variable de dos columnas y
así sucesivamente. Los códigos de los valores faltantes deben ser distintos de
los códigos asignados a las respuestas legítimas.
La codificación de las preguntas
estructuradas es relativamente sencilla porque las opciones de respuestas se
determinan con anticipación. El investigador asigna un código a cada respuesta
de cada pregunta, y especifica el registro y la columna adecuados en que deben
aparecer los códigos de la respuesta. Por ejemplo,
¿Tiene usted un pasaporte vigente?
1. Sí 2. No (1/54)
Para esta pregunta, la respuesta
“Sí” se codifica con el número 1 y la respuesta “No” con el número 2. Los
números entre paréntesis indican que el código asignado aparecerá en el primer
registro de este encuestado en la columna 54. Dado que sólo se permite una
respuesta y sólo hay dos respuestas posibles (1 o 2), basta con una columna.
Por lo general, una columna es suficiente para codificar una pregunta
estructurada con una sola respuesta, si las respuestas posibles son menos de
nueve.

En las preguntas que permiten un
mayor número de respuestas, debe asignarse una columna separada para cada
opción de respuesta posible. Dichas preguntas incluyen las que se refieren al
uso o propiedad de marcas, la lectura de revistas o la preferencia por
programas de televisión. Por ejemplo, Suponga que en este ejemplo un encuestado
marcó cuenta de ahorros, cuenta de cheques y cuenta de ahorros a plazo fijo. En
el registro N° 1, se anotará un número 1 en las columnas número 162, 163, y
168. En todas las otras columnas (164, 165, 166, 167, 169, 170, 171 y 172) se
anotará un 0. Como sólo hay un registro por encuestado, se omite el registro.
La codificación de preguntas
abiertas o no estructuradas es más compleja. En el cuestionario se registran
las respuestas literales. Luego se desarrollan y asignan los códigos para estas
respuestas.
En ocasiones, el investigador
puede basarse en proyectos anteriores o consideraciones teóricas, para desarrollar
los códigos antes de iniciar el trabajo de campo; no obstante, por lo general
esto debe esperar hasta que se reciban los cuestionarios llenos. A
continuación, el investigador hace una lista de 50 a 100 respuestas para una
pregunta no estructurada con la finalidad de identificar las categorías
apropiadas para la codificación. Una vez que se desarrollaron los códigos, debe
capacitarse a los codificadores para que asignen los códigos correctos a las
respuestas literales. Se sugieren los siguientes lineamientos para codificar
preguntas no estructuradas y cuestionarios en general.
Los códigos de las categorías
deben ser mutuamente excluyentes y colectivamente exhaustivos.
Las categorías son mutuamente
excluyentes si a cada respuesta corresponde un único código de categoría.
Las categorías no deben
traslaparse. Las categorías son colectivamente exhaustivas, si cada respuesta
corresponde a uno de los códigos de categoría asignados. Esto puede lograrse
agregando un código de categoría para “otro” o “ninguno de los anteriores”. Sin
embargo, en esta categoría deben caer muy pocas respuestas (10 por ciento o
menos). La gran mayoría de las respuestas deben clasificarse en categorías
significativas.
Deben asignarse códigos de
categoría a cuestiones críticas, aunque no se hayan mencionado.
En ocasiones es importante saber
que nadie ha mencionado una respuesta particular. Por ejemplo, a la administración
de una importante empresa de bienes de consumo le preocupaba el empaque de una
nueva marca de jabón de tocador. Por lo tanto, el empaque se incluyó como una
categoría separada en las respuestas codificadas a la pregunta “¿Qué es lo que
menos le gusta de este jabón?”.
Los datos deben codificarse de
forma que conserven tantos detalles como sea posible. Por ejemplo, si se han
obtenido datos sobre el número exacto de viajes hechos en aerolíneas
comerciales por viajeros de negocios, deben codificarse como tales en vez de
agruparlo en dos códigos de categorías como viajeros
poco frecuentes y viajeros frecuentes.
Obtener información sobre el número exacto de viajes permite al investigador
definir más adelante las categorías de viajeros de negocios de diferentes maneras.
Si las categorías se definieron de antemano, el análisis posterior de los datos
debe limitarse a estas categorías.
Libro de códigos
El libro de códigos contiene las
instrucciones para la codificación y la información necesaria sobre las variables
en el conjunto de datos. El libro de códigos orienta el trabajo de los codificadores
y ayuda al investigador a identificar y localizar adecuadamente las variables.
Incluso si el cuestionario se codificó de antemano, resulta muy útil preparar
un libro de códigos formal. Por lo general, un libro de códigos contiene la
siguiente información: 1. número de columna, 2. número de registro, 3. número
de variable, 4. nombre de la variable, 5. número de la pregunta, y 6.
instrucciones para la codificación. La figura siguiente es un ejemplo de la
codificación de un cuestionario, donde se muestra la codificación de datos
demográficos que suelen obtenerse en encuestas a los consumidores.
El cuestionario del siguiente
ejemplo fue objeto de una codificación previa.
Trascripción
La trascripción implica transferir
los datos codificados de los cuestionarios o de las hojas de codificación, a
discos o cintas magnéticas o directamente a la computadora por medio del
teclado. Si los datos se recolectaron usando CATI (Entrevista Telefónica Asistida por Computadora) o CAPI (Entrevista Personal Asistida por Computadora),
este paso sería innecesario ya que los datos se capturan directamente en la
computadora según se reciben. Además del teclado, los datos pueden transferirse
mediante los lectores ópticos, que capturan la información marcada (véase la figura).
Este tipo de captura de datos
requiere que las respuestas se registren en las formas con un lápiz especial en
un área designada para la respuesta que se codificó de antemano. Eso permite
que la máquina pueda leer los datos. El lector óptico implica que la máquina
lea los códigos de forma directa y los trascriba al mismo tiempo. Un ejemplo
común del lector óptico es la trascripción de los datos CUP (código universal
de productos) en los cajeros de los supermercados. Los avances tecnológicos han
dado por resultado el sistema computarizado de análisis sensorial que
automatiza el proceso de recolección de datos. Las preguntas aparecen en un
formato computarizado y un dispositivo sensorial registra las respuestas
directamente en la computadora. Además de estos existe también la modalidad
CAWI (Entrevista web asistida por
computador) que utiliza la red Internet para capturar los datos y llevarlos
directamente a una base de datos en el computador
Si se utiliza el teclado pueden
cometerse errores, lo cual haría necesario verificar el conjunto de datos o al
menos una parte de ellos. El segundo operador vuelve a teclear los datos de los
cuestionarios codificados. Registro por registro se comparan los datos
transcritos por ambos operadores.
Cualquier discrepancia entre ambos
conjuntos de datos transcritos se investiga para identificar y corregir errores
de tecleo. La verificación de todo el conjunto de datos duplicará el tiempo y
costo de la trascripción. Dadas las restricciones de tiempo y costos, así como
el hecho de que los capturistas experimentados suelen ser bastante precisos, es
suficiente verificar sólo entre 25 y 50 por ciento de los datos.
Cuando se emplean sistemas
computarizados como CATI, CAPI o CAWI, los datos se verifican conforme se
recolectan. En el caso de respuestas inadmisibles, la computadora lo indica al
entrevistador o al encuestado. En el caso de respuestas admisibles, el
entrevistador o el encuestado pueden ver en la pantalla la respuesta registrada
y verificarla antes de continuar.
La elección del método de
trascripción de datos depende del tipo de entrevista utilizado y de la
disponibilidad de equipo y recursos. Si se utilizan sistemas computarizados
como CATI, CAPI o CAWI, los datos ingresan directamente en la computadora. La
captura en un teclado con terminal CRT se utiliza más a menudo para entrevistas
telefónicas, en casa, en centros comerciales o por correo. Sin embargo, en las
entrevistas personales cada vez es más común el uso de sistemas computarizados
de análisis sensorial debido al incremento en el uso de las computadoras de
bolsillo (gridpads) y las computadoras laptops.
Los lectores ópticos pueden usarse en entrevistas estructuradas y repetitivas;
mientras que las formas de marcado sensorial se usan en casos especiales.
Depuración de datos
La depuración de los datos incluye
la verificación de la congruencia y el tratamiento de las
respuestas faltantes. Aunque
durante la edición se hizo una comprobación preliminar de la congruencia, en
esta etapa las verificaciones son más minuciosas y exhaustivas porque se
realizan por computadora.
Comprobación de la congruencia
La comprobación de la congruencia
identifica los datos que están fuera de rango, que son lógicamente incongruentes
o que tienen valores extremos. Los datos fuera de rango son inadmisibles y tienen
que corregirse. Por ejemplo, suponga que se pidió a los encuestados que
expresaran su grado de acuerdo, con una serie de enunciados de estilos de vida
en una escala de 1 a 5. Si se supone que se designó 9 para las respuestas
faltantes, los valores de 0, 6, 7 y 8 están fuera de rango.
Es posible programar paquetes de
cómputo como SPSS, SAS, EXCEL y MINITAB para identificar los valores fuera de
rango para cada variable, e imprimir el código del encuestado, el código de la
variable, el nombre de la variable, el número de registro, el número de columna
y el valor fuera de rango.
Esto facilita la revisión
sistemática de cada variable para detectar los valores fuera de rango. Para determinar
las respuestas correctas se regresa al cuestionario revisado y codificado.
Las respuestas llegan a presentar
diversas incongruencias lógicas. Por ejemplo, una encuestada que indica que
paga las llamadas de larga distancia con tarjetas prepagadas aunque no posea
una de esas tarjetas. O un encuestado que informa que no está familiarizado con
un producto pero también dice que lo usa con frecuencia. Puede imprimirse la
información necesaria (código del encuestado, código de la variable, nombre de
la variable, número de registro, número de columna y valores incongruentes),
para localizar tales respuestas y tomar acciones correctivas.
Por último, los valores extremos
deben revisarse de manera minuciosa. No todos los valores extremos son
resultado de errores, pero pueden indicar problemas con los datos. Por ejemplo,
una evaluación extremadamente baja de una marca sería resultado de que el
encuestado marca en forma indiscriminada la opción 1 (en una escala de calificación
de 1 a 7) para todos los atributos de esta marca.
Tratamiento de respuestas
faltantes
Las respuestas faltantes
representan valores de una variable que se desconocen, ya sea porque los
encuestados dieron respuestas ambiguas o porque sus respuestas no se
registraron en forma adecuada.
El tratamiento de las respuestas
faltantes plantea problemas, sobre todo si su proporción es mayor del 10 por
ciento. Se dispone de las siguientes opciones para el tratamiento de las
respuestas faltantes.
1. Sustituir con un valor neutro. Un valor neutro, por lo regular
la respuesta promedio a la variable, sustituye las respuestas faltantes. De
esta forma no cambia la media de la variable ni se afectan demasiado otras
estadísticas, como las correlaciones. Aunque este método tiene cierto mérito,
es cuestionable la lógica de sustituir con un valor promedio (digamos 4) para
encuestados que, de haber respondido, quizás hubieran asignado calificaciones
altas (6 o 7) o bajas (1 o 2).
2. Sustituir con una respuesta atribuida. Se usa el patrón de
respuestas de los encuestados a otras preguntas, para atribuir o calcular una
respuesta adecuada para las preguntas faltantes. A partir de los datos
disponibles, el investigador intenta inferir las respuestas que habrían dado los
encuestados si hubieran contestado las preguntas. Esto puede hacerse en forma
estadística, determinando la relación de la variable en cuestión con otras
variables a partir de los datos disponibles. Por ejemplo, al relacionar el uso
del producto con el tamaño de la casa para los encuestados que hayan
proporcionado datos de las dos variables. Luego se calcula la respuesta faltante
de un encuestado sobre el uso del producto con base en el tamaño de su casa.
Sin embargo, este enfoque requiere de gran esfuerzo y puede introducir sesgos
considerables. Se han desarrollado procedimientos estadísticos complejos para
calcular valores atribuidos para las respuestas faltantes.
3. Eliminación por casos. En la eliminación por casos, se descartan
del análisis los casos o encuestados con alguna respuesta faltante. Dado que
muchos encuestados podrían tener algunas respuestas faltantes, este enfoque
daría como resultado una muestra pequeña. No es recomendable desechar grandes
cantidades de datos porque su recolección es costosa y consume mucho tiempo.
Además, los encuestados con respuestas faltantes pueden diferir de manera sistemática
de los encuestados con todas las respuestas. De ser así, la eliminación por
casos introduciría un sesgo grave en los resultados.
4. Eliminación por pares. En la eliminación por pares, en vez de
descartar todos los casos con algún valor faltante, el investigador sólo usa
los casos o encuestados con respuestas completas para cada cálculo. Como
resultado, los distintos cálculos del análisis pueden basarse en muestras de
diferentes tamaños. Este procedimiento puede ser apropiado cuando 1. el tamaño
de la muestra es grande, 2. las respuestas faltantes son pocas y 3. no hay
mucha relación entre las variables. No obstante, el procedimiento puede
producir resultados poco atractivos o incluso poco verosímiles.
Los diferentes procedimientos para
el tratamiento de las respuestas faltantes darían lugar a resultados distintos,
sobre todo cuando la falta de las respuestas no se debe al azar y las variables
están relacionadas, de ahí que sea necesario reducir al mínimo las respuestas
faltantes. El investigador tiene que considerar con cuidado las implicaciones
de los diversos procedimientos, antes de elegir un método particular para el
tratamiento de la falta de respuesta.
Ajuste estadístico de los datos
Los procedimientos para el ajuste
estadístico de los datos son la ponderación, la redefinición de las variables y
las transformaciones de la escala. Estos ajustes no siempre son necesarios pero
pueden mejorar la calidad del análisis de los datos.
Ponderación: En la ponderación, a cada caso o encuestado de la base
de datos se le asigna un peso que refleje su importancia en relación con otros
casos o encuestados. El valor 1.0 representa el caso no ponderado.
El efecto de la ponderación es
incrementar o disminuir el número de casos de la muestra que poseen ciertas
características.
La ponderación se usa sobre todo
para hacer que los datos de la muestra sean más representativos de una
población meta en características específicas. Por ejemplo, se utiliza para dar
más importancia a casos o encuestados con datos de mayor calidad. Sin embargo,
otro uso de la ponderación consiste en ajustar la muestra para dar mayor
importancia a encuestados con ciertas características.
Si se realiza un estudio para
determinar qué modificaciones deberían hacerse a un producto existente, el
investigador quizá desee dar más peso a las opiniones de quienes consumen más
ese producto.
Esto puede lograrse mediante la
asignación de un peso de 3.0 a los usuarios frecuentes, 2.0 a los usuarios
medios y 1.0 a los usuarios esporádicos y a quienes no usan el producto. La
ponderación debe aplicarse con cautela porque destruye la naturaleza
autoponderada del diseño de la muestra.
Redefinición de las variables: La redefinición de las variables
implica transformar los datos para crear variables nuevas o modificar las
existentes. El propósito de la redefinición es crear variables que sean
congruentes con los objetivos del estudio. Por ejemplo, suponga que la variable
original era el uso de un producto, con diez categorías de respuesta, las
cuales podrían reducirse a cuatro: uso frecuente, moderado, esporádico o nulo.
O el investigador puede crear nuevas variables que sean combinaciones de muchas
otras.

Por ejemplo, el investigador puede
crear un índice de búsqueda de información (IBI) que sea la suma de la
información que buscan los clientes de los proveedores, materiales de
promoción, Internet y otras fuentes independientes. Asimismo, podría tomarse la
razón de las variables. Otras redefiniciones de las variables incluyen las
transformaciones logarítmicas y de raíz cuadrada, las cuales suelen utilizarse
para mejorar la utilidad del modelo estimado. Un importante procedimiento de
redefinición supone el uso de variables ficticias para la redefinición de
variables categóricas. Las variables ficticias (llamadas también variables
binarias, dicotómicas, instrumentales o cualitativas) son variables que sólo
pueden adoptar dos valores, como 0 o 1. La regla general es que para reespecificar
una variable categórica con K categorías, se requieren K – 1 variables ficticias.
La razón de tener K – 1 en vez de K variables ficticias es que sólo K – 1 categorías
son independientes. Dados los datos de la muestra, la información sobre la
categoría K-ésima puede derivarse de la información sobre las otras categorías
K – 1. Considere el sexo: como es una variable que tiene dos categorías, sólo
se necesita una variable ficticia. La información sobre el número o porcentaje
de hombres en la muestra puede derivarse con facilidad del número o el porcentajes
de mujeres.
Transformación de la escala: La transformación de la escala implica
manipular los valores de la escala para asegurar que sea comparable con otras
escalas o adecuar de otra manera los datos para el análisis. Con frecuencia se
emplean diferentes escalas para medir diferentes variables. Por ejemplo, las
variables de imagen pueden medirse con una escala de diferencial semántico de 7
puntos, las variables de actitud con una escala de calificación continua y las
variables de estilos de vida con una escala Likert de 5 puntos.
Por lo tanto, no tendría sentido
hacer comparaciones entre las escalas de medición de ningún encuestado.
Para comparar las calificaciones
de actitud con las calificaciones de estilos de vida o las de imagen, sería
necesario transformar las diferentes escalas. Incluso si se utiliza la misma
escala para todas las variables, diferentes encuestados pueden usar la escala
de manera distinta. Por ejemplo, algunos encuestados usan de manera sistemática
la parte superior de la escala de calificación; en tanto que otros utilizan de
manera constante la parte inferior. Tales diferencias pueden corregirse mediante
la transformación adecuada de los datos.
Si te gustó el artículo o tienes
alguna crítica constructiva coméntalo y
recuerda suscribirte al blog. Ah, y comparte con un Tiweet, +1 o por Facebook
tus comentarios. Hasta una próxima entrega.
OTROS ARTÍCULOS DE INTERÉS
|
|
|
|
|
FUETES BIBLIOGRÁFICAS Y DOCUMENTALES
Aaker, D. y
Day, G. S. (1989) Investigación de Mercados. México. Tercera Edición. Segunda
Edición en Castellano. Mc Graw-Hill
Malhotra, N
(1997) Investigación de mercado, un enfoque práctico. Naucalpan de Juárez
México. Prentice Hall Segunda Edición
Seijas, Félix
(2003) Investigación Electoral; encuestas electorales. 2da Edición. Caracas.
Ediciones del Rectorado - UCV
Zikmund, W
(1998) Investigación de Mercados. 6ta edición. Naucalpán de Juárez - México
Prentice-Hall Hispanoamericana, A. A.