ESTUDIOS DE MERCADOS Y DE OPINIÓN PÚBLICA: CÓMO SE REALIZA LA PREPARACIÓN DE LOS DATOS

PREPARACIÓN DE LOS DATOS

Después de definir el problema de investigación y se desarrolla un enfoque apropiado, que se ha formulado un diseño de investigación adecuado y que se realiza el trabajo de campo, el investigador suele pasar a la preparación y el análisis de los datos, que es el siguiente paso del proceso de investigación de mercados. Antes de que los datos en bruto contenidos en los cuestionarios se sometan a un análisis estadístico, deben convertirse a una forma apropiada para tal análisis.

La calidad de los resultados estadísticos depende del cuidado que se tenga en la fase de preparación de los datos. No prestar suficiente atención a la preparación de los datos pondría en riesgo los resultados estadísticos, dando así lugar a resultados sesgados y a una interpretación incorrecta.

En este artículo se describe el proceso de recolección de los datos, el cual comienza con la revisión o control de calidad de los cuestionarios para verificar que estén completos. Enseguida, se analiza la depuración de los datos y se ofrecen lineamientos para manejar las respuestas ilegibles, incompletas, incongruentes, ambiguas o insatisfactorias. También se describe la codificación, trascripción y limpieza de los datos, y se hace énfasis en el tratamiento de las respuestas faltantes y en el ajuste estadístico de los datos. Se analiza la elección de una estrategia de análisis de los datos y se clasifican las técnicas estadísticas. Se explican los enfoques intracultural, pancultural y transcultural para el análisis de datos en la investigación de mercados internacionales. Se identifican los problemas éticos relacionados con el procesamiento de los datos, destacando la eliminación de las respuestas insatisfactorias, el incumplimiento de las suposiciones que subyacen a las técnicas de análisis de datos, y la evaluación e interpretación de los resultados. Por último, se analiza el uso de programas estadísticos para la preparación y análisis de los datos.

El proceso de preparación de los datos

En la figura que se presenta a continuación se muestra el proceso de preparación de los datos. El proceso completo es guiado por el plan preliminar de análisis de datos que se formuló en la fase de diseño de investigación. El primer paso consiste en verificar que los cuestionarios sean aceptables, seguido por la verificación, codificación y trascripción de los datos. Se depuran los datos y se recomienda un tratamiento para las respuestas faltantes. Con frecuencia resulta necesario un ajuste estadístico de los datos para que sean representativos de la población de interés. El investigador debe entonces elegir la estrategia apropiada para el análisis de los datos. La estrategia final de análisis de los datos difiere del plan preliminar de análisis, debido a la información y los conocimientos obtenidos desde que se formuló el plan original. La preparación de los datos debe empezar tan pronto como se reciba el primer grupo de cuestionarios del campo, mientras el trabajo de campo continúa. De este modo, si se detecta algún problema, es factible modificar el trabajo de campo para incorporar alguna acción correctiva oportunamente.

Control de calidad de los cuestionarios recolectados

El paso inicial en la revisión del cuestionario implica verificar todos los cuestionarios en cuanto a la calidad de las entrevistas y a que estén terminados. A menudo estas revisiones se realizan mientras el trabajo de campo sigue en proceso. Si se contrató a una empresa de recolección de datos para realizar el trabajo de campo, el investigador debe hacer una revisión independiente luego de que ésta ha terminado. Un cuestionario que regresa del campo podría ser inaceptable por varias razones:

1. Algunas partes del cuestionario están incompletas.

2. El patrón de respuestas indica que el encuestado no entendió o siguió las instrucciones. Por ejemplo, cuando no se siguieron los patrones de salto.

3. Las respuestas muestran poca varianza. Por ejemplo, un encuestado sólo marcó la opción número 4 en una serie de escalas de calificación de 7 puntos.

4. Los cuestionarios entregados están físicamente incompletos: faltan una o más páginas.

5. El cuestionario se recibió después de la fecha establecida.

6. El cuestionario fue contestado por alguien que no estaba calificado para participar.

Si se impusieron cuotas o el tamaño de las células de trabajo, los cuestionarios aceptables deberán clasificarse y contabilizarse de acuerdo con ello. Antes de revisar los datos, deben identificarse los problemas para cumplir los requisitos del muestreo y tomar las medidas correctivas pertinentes, como realizar entrevistas adicionales en las células poco representadas.

Edición

La edición es la revisión de los cuestionarios con el objetivo de incrementar su exactitud y precisión.

Consiste en examinar los cuestionarios para identificar respuestas ilegibles, incompletas, incongruentes o ambiguas.

Las respuestas pueden ser ilegibles si se registraron mal, lo cual es muy frecuente en cuestionarios con un gran número de preguntas no estructuradas. Los datos deben ser legibles para codificarlos en forma correcta. Asimismo, los cuestionarios pueden estar incompletos en diferentes grados. Las preguntas no respondidas pueden ser pocas o muchas.

Hasta este punto, el investigador hace una revisión preliminar de la congruencia. Es fácil detectar algunas incongruencias evidentes. Por ejemplo, un encuestado reporta un ingreso anual de menos del sueldo mínimo mensual, pero informa de compras frecuentes en tiendas por departamento de prestigio.

Las respuestas a preguntas no estructuradas pueden resultar ambiguas y difíciles de interpretar con claridad. Tal vez la respuesta esté abreviada o quizá se utilizaron palabras ambiguas. En el caso de las preguntas estructuradas, en ocasiones se marca más de una respuesta en preguntas diseñadas para obtener una sola respuesta. Suponga que un encuestado marca las opciones 2 y 3 en una escala de calificación de 5 puntos. ¿Significa esto que pretendía marcar 2,5? Para complicar más la situación, el procedimiento de codificación sólo permite respuestas de un dígito.

Tratamiento de las respuestas insatisfactorias

El manejo de las respuestas insatisfactorias por lo regular consiste en regresar el cuestionario al campo para obtener mejores datos, asignar valores faltantes o descartar a los encuestados insatisfactorios.

Devolución al campo, (revisitas): Los cuestionarios con respuestas insatisfactorias pueden devolverse al campo, donde los entrevistadores vuelven a hacer contacto con los encuestados. Este enfoque es atractivo sobre todo para encuestas de mercados industriales y de negocios, donde los tamaños de las muestras son pequeños y resulta sencillo identificar a los encuestados. No obstante, los datos obtenidos en la segunda ocasión quizá sean diferentes de los obtenidos en la encuesta original. Estas diferencias pueden atribuirse a los cambios ocurridos al paso del tiempo o a diferencias en la forma de aplicación del cuestionario (por ejemplo, entrevista telefónica o personal).

Asignación de valores faltantes: Si no es posible regresar los cuestionarios al campo, el editor puede asignar valores faltantes a las respuestas insatisfactorias. Este enfoque sería deseable si

1. El número de encuestados insatisfactorios es pequeño

2. La proporción de respuestas insatisfactorias para cada uno de estos encuestados es pequeña

3. Las variables con respuestas insatisfactorias no son las más importantes.

Descartar a los encuestados insatisfactorios: En este enfoque simplemente se descarta a los encuestados con repuestas insatisfactorias. Dicha estrategia resulta apropiada cuando

1. La proporción de encuestados insatisfactorios es pequeña (menos del 10 por ciento)

2. El tamaño de la muestra es grande

3. Los encuestados insatisfactorios no difieren de los encuestados satisfactorios de forma evidente (por ejemplo, en factores demográficos o características de uso del producto),

4. la proporción de respuestas insatisfactorias para cada uno de estos encuestados es grande

5. Faltan respuestas para las variables más importantes. Sin embargo, los encuestados insatisfactorios pueden diferir de manera sistemática de los encuestados satisfactorios y la decisión para designar a un encuestado como insatisfactorio podría ser subjetiva. Ambos factores sesgan los resultados.

Si el investigador decide descartar a los encuestados insatisfactorios, debería informar cuál fue el procedimiento adoptado para identificarlos y cuántos fueron.

Codificación de cuestionarios

Codificar significa asignar un código, por lo general un número, a cada respuesta posible de cada pregunta. El código incluye una indicación de la posición en la columna (campo) y el registro que ocupará el dato. Por ejemplo, el sexo de los encuestados se codifica con 1 para las mujeres y 2 para los hombres. Un campo representa un solo dato, como el sexo de los encuestados. Un registro consta de campos relacionados, como sexo, estado civil, edad, tamaño de la casa, ocupación, etcétera.

A menudo, un solo registro contiene todos los datos de un encuestado, aunque también es posible que se utilicen varios registros para cada encuestado.

Los datos (todos los registros) de todos los encuestados se guardan en archivos de computadora, como se ilustra en la tabla siguiente. Esta tabla demuestra el caso más común de codificación, donde puede utilizarse más de un registro para cada encuestado. En esta tabla, las columnas representan los campos; y las filas, los registros.

Estos datos se codificaron de acuerdo con el esquema de codificación especificado en la figura Las columnas 1 a 3 representan un solo campo y contienen los números de código de los encuestados 001 a 271. La columna 4 contiene el número de registro. Esta columna tiene el valor de 1 para todas las filas, porque sólo se presenta el primer registro de los encuestados. Las columnas 5 y 6 contienen el código del proyecto, que es 31. Las siguientes dos columnas, 7 y 8, muestran el código del entrevistador, que varía de 01 a 55 porque se utilizaron 55 entrevistadores. Las columnas 26 a 35, que representan cada una un campo, contienen las calificaciones de familiaridad para las 10 tiendas, con valores que van de 1 a 6. Por último, la columna 77 representa la calificación de la tienda 10 en relación con los precios. Advierta que las columnas 78 a 80 están en blanco. Hay 10 registros para cada encuestado y 2,710 filas que indican que el archivo contiene los datos de los 271 encuestados.

Si el cuestionario sólo contiene preguntas estructuradas o muy pocas preguntas no estructuradas, se realiza una codificación previa. Esto significa que se asignan códigos antes de realizar el trabajo de campo. Si el cuestionario contiene preguntas no estructuradas, los códigos se asignan después de que el cuestionario se haya devuelto del campo (codificación posterior).

Codificación de las preguntas

El código del encuestado y el número de registro deben aparecer en cada registro de los datos. Sin embargo, si sólo hay un registro para cada encuestado puede prescindirse del código de registro.

Para cada encuestado tienen que incluirse los siguientes códigos adicionales: código de proyecto, código del entrevistador, códigos de fecha y hora, y código de validación. Es muy deseable el uso de códigos de campo fijo, lo cual significa que el número de registros para cada encuestado es el mismo y que para todos los encuestados aparecen los mismos datos en las mismas columnas. De ser posible, deben usarse códigos estándar para los datos faltantes. Por ejemplo, puede emplearse el código 9 para una variable de una sola columna, 99 para una variable de dos columnas y así sucesivamente. Los códigos de los valores faltantes deben ser distintos de los códigos asignados a las respuestas legítimas.

La codificación de las preguntas estructuradas es relativamente sencilla porque las opciones de respuestas se determinan con anticipación. El investigador asigna un código a cada respuesta de cada pregunta, y especifica el registro y la columna adecuados en que deben aparecer los códigos de la respuesta. Por ejemplo,

¿Tiene usted un pasaporte vigente? 1. Sí 2. No (1/54)

Para esta pregunta, la respuesta “Sí” se codifica con el número 1 y la respuesta “No” con el número 2. Los números entre paréntesis indican que el código asignado aparecerá en el primer registro de este encuestado en la columna 54. Dado que sólo se permite una respuesta y sólo hay dos respuestas posibles (1 o 2), basta con una columna. Por lo general, una columna es suficiente para codificar una pregunta estructurada con una sola respuesta, si las respuestas posibles son menos de nueve.

En las preguntas que permiten un mayor número de respuestas, debe asignarse una columna separada para cada opción de respuesta posible. Dichas preguntas incluyen las que se refieren al uso o propiedad de marcas, la lectura de revistas o la preferencia por programas de televisión. Por ejemplo, Suponga que en este ejemplo un encuestado marcó cuenta de ahorros, cuenta de cheques y cuenta de ahorros a plazo fijo. En el registro N° 1, se anotará un número 1 en las columnas número 162, 163, y 168. En todas las otras columnas (164, 165, 166, 167, 169, 170, 171 y 172) se anotará un 0. Como sólo hay un registro por encuestado, se omite el registro.

La codificación de preguntas abiertas o no estructuradas es más compleja. En el cuestionario se registran las respuestas literales. Luego se desarrollan y asignan los códigos para estas respuestas.

En ocasiones, el investigador puede basarse en proyectos anteriores o consideraciones teóricas, para desarrollar los códigos antes de iniciar el trabajo de campo; no obstante, por lo general esto debe esperar hasta que se reciban los cuestionarios llenos. A continuación, el investigador hace una lista de 50 a 100 respuestas para una pregunta no estructurada con la finalidad de identificar las categorías apropiadas para la codificación. Una vez que se desarrollaron los códigos, debe capacitarse a los codificadores para que asignen los códigos correctos a las respuestas literales. Se sugieren los siguientes lineamientos para codificar preguntas no estructuradas y cuestionarios en general.

Los códigos de las categorías deben ser mutuamente excluyentes y colectivamente exhaustivos.

Las categorías son mutuamente excluyentes si a cada respuesta corresponde un único código de categoría.

Las categorías no deben traslaparse. Las categorías son colectivamente exhaustivas, si cada respuesta corresponde a uno de los códigos de categoría asignados. Esto puede lograrse agregando un código de categoría para “otro” o “ninguno de los anteriores”. Sin embargo, en esta categoría deben caer muy pocas respuestas (10 por ciento o menos). La gran mayoría de las respuestas deben clasificarse en categorías significativas.

Deben asignarse códigos de categoría a cuestiones críticas, aunque no se hayan mencionado.

En ocasiones es importante saber que nadie ha mencionado una respuesta particular. Por ejemplo, a la administración de una importante empresa de bienes de consumo le preocupaba el empaque de una nueva marca de jabón de tocador. Por lo tanto, el empaque se incluyó como una categoría separada en las respuestas codificadas a la pregunta “¿Qué es lo que menos le gusta de este jabón?”.

Los datos deben codificarse de forma que conserven tantos detalles como sea posible. Por ejemplo, si se han obtenido datos sobre el número exacto de viajes hechos en aerolíneas comerciales por viajeros de negocios, deben codificarse como tales en vez de agruparlo en dos códigos de categorías como viajeros poco frecuentes y viajeros frecuentes. Obtener información sobre el número exacto de viajes permite al investigador definir más adelante las categorías de viajeros de negocios de diferentes maneras. Si las categorías se definieron de antemano, el análisis posterior de los datos debe limitarse a estas categorías.

Libro de códigos

El libro de códigos contiene las instrucciones para la codificación y la información necesaria sobre las variables en el conjunto de datos. El libro de códigos orienta el trabajo de los codificadores y ayuda al investigador a identificar y localizar adecuadamente las variables. Incluso si el cuestionario se codificó de antemano, resulta muy útil preparar un libro de códigos formal. Por lo general, un libro de códigos contiene la siguiente información: 1. número de columna, 2. número de registro, 3. número de variable, 4. nombre de la variable, 5. número de la pregunta, y 6. instrucciones para la codificación. La figura siguiente es un ejemplo de la codificación de un cuestionario, donde se muestra la codificación de datos demográficos que suelen obtenerse en encuestas a los consumidores.

El cuestionario del siguiente ejemplo fue objeto de una codificación previa.

Trascripción

La trascripción implica transferir los datos codificados de los cuestionarios o de las hojas de codificación, a discos o cintas magnéticas o directamente a la computadora por medio del teclado. Si los datos se recolectaron usando CATI (Entrevista Telefónica Asistida por Computadora) o CAPI (Entrevista Personal Asistida por Computadora), este paso sería innecesario ya que los datos se capturan directamente en la computadora según se reciben. Además del teclado, los datos pueden transferirse mediante los lectores ópticos, que capturan la información marcada (véase la figura).

Este tipo de captura de datos requiere que las respuestas se registren en las formas con un lápiz especial en un área designada para la respuesta que se codificó de antemano. Eso permite que la máquina pueda leer los datos. El lector óptico implica que la máquina lea los códigos de forma directa y los trascriba al mismo tiempo. Un ejemplo común del lector óptico es la trascripción de los datos CUP (código universal de productos) en los cajeros de los supermercados. Los avances tecnológicos han dado por resultado el sistema computarizado de análisis sensorial que automatiza el proceso de recolección de datos. Las preguntas aparecen en un formato computarizado y un dispositivo sensorial registra las respuestas directamente en la computadora. Además de estos existe también la modalidad CAWI (Entrevista web asistida por computador) que utiliza la red Internet para capturar los datos y llevarlos directamente a una base de datos en el computador

Si se utiliza el teclado pueden cometerse errores, lo cual haría necesario verificar el conjunto de datos o al menos una parte de ellos. El segundo operador vuelve a teclear los datos de los cuestionarios codificados. Registro por registro se comparan los datos transcritos por ambos operadores.

Cualquier discrepancia entre ambos conjuntos de datos transcritos se investiga para identificar y corregir errores de tecleo. La verificación de todo el conjunto de datos duplicará el tiempo y costo de la trascripción. Dadas las restricciones de tiempo y costos, así como el hecho de que los capturistas experimentados suelen ser bastante precisos, es suficiente verificar sólo entre 25 y 50 por ciento de los datos.

Cuando se emplean sistemas computarizados como CATI, CAPI o CAWI, los datos se verifican conforme se recolectan. En el caso de respuestas inadmisibles, la computadora lo indica al entrevistador o al encuestado. En el caso de respuestas admisibles, el entrevistador o el encuestado pueden ver en la pantalla la respuesta registrada y verificarla antes de continuar.

La elección del método de trascripción de datos depende del tipo de entrevista utilizado y de la disponibilidad de equipo y recursos. Si se utilizan sistemas computarizados como CATI, CAPI o CAWI, los datos ingresan directamente en la computadora. La captura en un teclado con terminal CRT se utiliza más a menudo para entrevistas telefónicas, en casa, en centros comerciales o por correo. Sin embargo, en las entrevistas personales cada vez es más común el uso de sistemas computarizados de análisis sensorial debido al incremento en el uso de las computadoras de bolsillo (gridpads) y las computadoras laptops. Los lectores ópticos pueden usarse en entrevistas estructuradas y repetitivas; mientras que las formas de marcado sensorial se usan en casos especiales.

Depuración de datos

La depuración de los datos incluye la verificación de la congruencia y el tratamiento de las

respuestas faltantes. Aunque durante la edición se hizo una comprobación preliminar de la congruencia, en esta etapa las verificaciones son más minuciosas y exhaustivas porque se realizan por computadora.

Comprobación de la congruencia

La comprobación de la congruencia identifica los datos que están fuera de rango, que son lógicamente incongruentes o que tienen valores extremos. Los datos fuera de rango son inadmisibles y tienen que corregirse. Por ejemplo, suponga que se pidió a los encuestados que expresaran su grado de acuerdo, con una serie de enunciados de estilos de vida en una escala de 1 a 5. Si se supone que se designó 9 para las respuestas faltantes, los valores de 0, 6, 7 y 8 están fuera de rango.

Es posible programar paquetes de cómputo como SPSS, SAS, EXCEL y MINITAB para identificar los valores fuera de rango para cada variable, e imprimir el código del encuestado, el código de la variable, el nombre de la variable, el número de registro, el número de columna y el valor fuera de rango.

Esto facilita la revisión sistemática de cada variable para detectar los valores fuera de rango. Para determinar las respuestas correctas se regresa al cuestionario revisado y codificado.

Las respuestas llegan a presentar diversas incongruencias lógicas. Por ejemplo, una encuestada que indica que paga las llamadas de larga distancia con tarjetas prepagadas aunque no posea una de esas tarjetas. O un encuestado que informa que no está familiarizado con un producto pero también dice que lo usa con frecuencia. Puede imprimirse la información necesaria (código del encuestado, código de la variable, nombre de la variable, número de registro, número de columna y valores incongruentes), para localizar tales respuestas y tomar acciones correctivas.

Por último, los valores extremos deben revisarse de manera minuciosa. No todos los valores extremos son resultado de errores, pero pueden indicar problemas con los datos. Por ejemplo, una evaluación extremadamente baja de una marca sería resultado de que el encuestado marca en forma indiscriminada la opción 1 (en una escala de calificación de 1 a 7) para todos los atributos de esta marca.

Tratamiento de respuestas faltantes

Las respuestas faltantes representan valores de una variable que se desconocen, ya sea porque los encuestados dieron respuestas ambiguas o porque sus respuestas no se registraron en forma adecuada.

El tratamiento de las respuestas faltantes plantea problemas, sobre todo si su proporción es mayor del 10 por ciento. Se dispone de las siguientes opciones para el tratamiento de las respuestas faltantes.

1. Sustituir con un valor neutro. Un valor neutro, por lo regular la respuesta promedio a la variable, sustituye las respuestas faltantes. De esta forma no cambia la media de la variable ni se afectan demasiado otras estadísticas, como las correlaciones. Aunque este método tiene cierto mérito, es cuestionable la lógica de sustituir con un valor promedio (digamos 4) para encuestados que, de haber respondido, quizás hubieran asignado calificaciones altas (6 o 7) o bajas (1 o 2).

2. Sustituir con una respuesta atribuida. Se usa el patrón de respuestas de los encuestados a otras preguntas, para atribuir o calcular una respuesta adecuada para las preguntas faltantes. A partir de los datos disponibles, el investigador intenta inferir las respuestas que habrían dado los encuestados si hubieran contestado las preguntas. Esto puede hacerse en forma estadística, determinando la relación de la variable en cuestión con otras variables a partir de los datos disponibles. Por ejemplo, al relacionar el uso del producto con el tamaño de la casa para los encuestados que hayan proporcionado datos de las dos variables. Luego se calcula la respuesta faltante de un encuestado sobre el uso del producto con base en el tamaño de su casa. Sin embargo, este enfoque requiere de gran esfuerzo y puede introducir sesgos considerables. Se han desarrollado procedimientos estadísticos complejos para calcular valores atribuidos para las respuestas faltantes.

3. Eliminación por casos. En la eliminación por casos, se descartan del análisis los casos o encuestados con alguna respuesta faltante. Dado que muchos encuestados podrían tener algunas respuestas faltantes, este enfoque daría como resultado una muestra pequeña. No es recomendable desechar grandes cantidades de datos porque su recolección es costosa y consume mucho tiempo. Además, los encuestados con respuestas faltantes pueden diferir de manera sistemática de los encuestados con todas las respuestas. De ser así, la eliminación por casos introduciría un sesgo grave en los resultados.

4. Eliminación por pares. En la eliminación por pares, en vez de descartar todos los casos con algún valor faltante, el investigador sólo usa los casos o encuestados con respuestas completas para cada cálculo. Como resultado, los distintos cálculos del análisis pueden basarse en muestras de diferentes tamaños. Este procedimiento puede ser apropiado cuando 1. el tamaño de la muestra es grande, 2. las respuestas faltantes son pocas y 3. no hay mucha relación entre las variables. No obstante, el procedimiento puede producir resultados poco atractivos o incluso poco verosímiles.

Los diferentes procedimientos para el tratamiento de las respuestas faltantes darían lugar a resultados distintos, sobre todo cuando la falta de las respuestas no se debe al azar y las variables están relacionadas, de ahí que sea necesario reducir al mínimo las respuestas faltantes. El investigador tiene que considerar con cuidado las implicaciones de los diversos procedimientos, antes de elegir un método particular para el tratamiento de la falta de respuesta.

Ajuste estadístico de los datos

Los procedimientos para el ajuste estadístico de los datos son la ponderación, la redefinición de las variables y las transformaciones de la escala. Estos ajustes no siempre son necesarios pero pueden mejorar la calidad del análisis de los datos.

Ponderación: En la ponderación, a cada caso o encuestado de la base de datos se le asigna un peso que refleje su importancia en relación con otros casos o encuestados. El valor 1.0 representa el caso no ponderado.

El efecto de la ponderación es incrementar o disminuir el número de casos de la muestra que poseen ciertas características.

La ponderación se usa sobre todo para hacer que los datos de la muestra sean más representativos de una población meta en características específicas. Por ejemplo, se utiliza para dar más importancia a casos o encuestados con datos de mayor calidad. Sin embargo, otro uso de la ponderación consiste en ajustar la muestra para dar mayor importancia a encuestados con ciertas características.

Si se realiza un estudio para determinar qué modificaciones deberían hacerse a un producto existente, el investigador quizá desee dar más peso a las opiniones de quienes consumen más ese producto.

Esto puede lograrse mediante la asignación de un peso de 3.0 a los usuarios frecuentes, 2.0 a los usuarios medios y 1.0 a los usuarios esporádicos y a quienes no usan el producto. La ponderación debe aplicarse con cautela porque destruye la naturaleza autoponderada del diseño de la muestra.

Redefinición de las variables: La redefinición de las variables implica transformar los datos para crear variables nuevas o modificar las existentes. El propósito de la redefinición es crear variables que sean congruentes con los objetivos del estudio. Por ejemplo, suponga que la variable original era el uso de un producto, con diez categorías de respuesta, las cuales podrían reducirse a cuatro: uso frecuente, moderado, esporádico o nulo. O el investigador puede crear nuevas variables que sean combinaciones de muchas otras.

Por ejemplo, el investigador puede crear un índice de búsqueda de información (IBI) que sea la suma de la información que buscan los clientes de los proveedores, materiales de promoción, Internet y otras fuentes independientes. Asimismo, podría tomarse la razón de las variables. Otras redefiniciones de las variables incluyen las transformaciones logarítmicas y de raíz cuadrada, las cuales suelen utilizarse para mejorar la utilidad del modelo estimado. Un importante procedimiento de redefinición supone el uso de variables ficticias para la redefinición de variables categóricas. Las variables ficticias (llamadas también variables binarias, dicotómicas, instrumentales o cualitativas) son variables que sólo pueden adoptar dos valores, como 0 o 1. La regla general es que para reespecificar una variable categórica con K categorías, se requieren K – 1 variables ficticias. La razón de tener K – 1 en vez de K variables ficticias es que sólo K – 1 categorías son independientes. Dados los datos de la muestra, la información sobre la categoría K-ésima puede derivarse de la información sobre las otras categorías K – 1. Considere el sexo: como es una variable que tiene dos categorías, sólo se necesita una variable ficticia. La información sobre el número o porcentaje de hombres en la muestra puede derivarse con facilidad del número o el porcentajes de mujeres.

Transformación de la escala: La transformación de la escala implica manipular los valores de la escala para asegurar que sea comparable con otras escalas o adecuar de otra manera los datos para el análisis. Con frecuencia se emplean diferentes escalas para medir diferentes variables. Por ejemplo, las variables de imagen pueden medirse con una escala de diferencial semántico de 7 puntos, las variables de actitud con una escala de calificación continua y las variables de estilos de vida con una escala Likert de 5 puntos.

Por lo tanto, no tendría sentido hacer comparaciones entre las escalas de medición de ningún encuestado.

Para comparar las calificaciones de actitud con las calificaciones de estilos de vida o las de imagen, sería necesario transformar las diferentes escalas. Incluso si se utiliza la misma escala para todas las variables, diferentes encuestados pueden usar la escala de manera distinta. Por ejemplo, algunos encuestados usan de manera sistemática la parte superior de la escala de calificación; en tanto que otros utilizan de manera constante la parte inferior. Tales diferencias pueden corregirse mediante la transformación adecuada de los datos.

Si te gustó el artículo o tienes alguna crítica constructiva coméntalo y recuerda suscribirte al blog. Ah, y comparte con un Tiweet, +1 o por Facebook tus comentarios. Hasta una próxima entrega.

Para diseños de investigación de mercados, levantamiento de estudios de opinión pública y de seguimiento electoral no dude en contactar a Plepso Investigación, C. A. por sus teléfonos 0243 237.54.06 y 0412 439.25.85, a sus sitio web http://www.plepso.com.ve o al correo electrónico mercadeo@plepso.com.ve y jpleal@plepso.com.ve

OTROS ARTÍCULOS DE INTERÉS
SUPERVISIÓN DEL TRABAJO DE CAMPO	MARKETING INFANTIL Investigación del Segmento Infantil
LA INVESTIGACIÓN POLÍTICA Y DE OPINIÓN PÚBLICA	INVESTIGACIÓN DE MERCADO: NATURALEZA E IMPORTANCIA

FUETES BIBLIOGRÁFICAS Y DOCUMENTALES

Aaker, D. y Day, G. S. (1989) Investigación de Mercados. México. Tercera Edición. Segunda Edición en Castellano. Mc Graw-Hill

Malhotra, N (1997) Investigación de mercado, un enfoque práctico. Naucalpan de Juárez México. Prentice Hall Segunda Edición

Pérez Leal, J. (2015) OPERACIONES DE CAMPO PARA ENCUESTAS EN HOGARES [Artículo en línea] disponible en: http://plepso.blogspot.com/2015/07/operaciones-de-campo-para-encuestas-en.html [Consulta: 2015, agosto 23]

Seijas, Félix (2003) Investigación Electoral; encuestas electorales. 2da Edición. Caracas. Ediciones del Rectorado - UCV

Zikmund, W (1998) Investigación de Mercados. 6ta edición. Naucalpán de Juárez - México Prentice-Hall Hispanoamericana, A. A.

ESTUDIOS DE MERCADOS Y DE OPINIÓN PÚBLICA

sábado, 5 de septiembre de 2015

CÓMO SE REALIZA LA PREPARACIÓN DE LOS DATOS

No hay comentarios:

Publicar un comentario

CÓMO ES UNA JORNADA TÍPICA DE COMPRAS DEL SHOPPER