You are on page 1of 180
capitate capitate Capitulo Capitulo Capitulo Capitulo caso 541 caso 52 caso 53 caso 54 caso 55 a0 56 mOiNnCco ___ ANALISIS DE DATOS Y ELABORACION DE INFORMES SOBRE LOS HALLAZGOS DE LA INVESTIGACION 17 Procesamiento de datos 1 Anis unanado de eatos 19 Anal bivariado de datos 20, Analisi movin de datos I: métodos de interdependency 21 Andis mulsatiao de datos It métodos de dependencia 2 Elaboracén de iformes sobre los haliazgos de a investigacién The Ano Aros Met Ties Mhvest Marketing Research Associ (8 stan Food Cooperate (8) Catteries de Bernie Souter Minis Medical Center ‘The Sophisticated Research Group _ Capitulo 1 4 PROCESAMIENTO DE DATOS INVESTIGACION DE MERCADOS EN ACCION LOS DATOS DE SATISFACCION DEL CLIENTE DE XEROX REQUIEREN ANALISIS Xe1ox Corporation exd comprometdo con un programa pata med responder a nivel de ‘alsfecn en sus clentas. ste propiama comprende una sre de cues, cide una pedica los ints de Nerx yun aos clientes de a camoetenca de Xerox para deter Rat el pasconamiento compete de Yer departamenta de investigatin de meteados de ator recbesadedor de 10.000 eneuesastermnadas al mes, cada una con cuca de 38 respuestas to signifies que akededor de 30,000 porcones de datos lagan cada mes. Obvi- ‘mente, ene Is necceiéad de planer el maneo de todos esos datos de ura maers tl que pueden aalzane con facided por computador. Enos encuets de sfeccin del lenie ee frmulan muchos tos de preg incdat cas de actin de 5 punns preguntas sabre el uso de produc, compaacin pacada de Imatas, descipores demogfins y por nus ypregurias de respuesta ablerta La area os Invesigadores de marking aspnados alanis Ge ess dos requee lus de paquces de anal do datos dponles eel comercal coro SPSSPC (que representa Sissel Package fot the Socal Scencas PaquctoEtdiico pr ls Cnces Soils pra compares posorals) 5S. Anes ce mfr os cvesionrios de satfoccon dal lente ls encoertados, cxf roca dad le eer un esquema comple 2rd representa los datos para el ans computcions. Fvidentemeonte, el analistaasgnado a este proyecto tlene la necesdad de comprender el enfoque adecuado para asignar aloes naméricas ala respuerne que ds el encuestada 3 {tema de este capitulo es a cescrpciin dels Tunciones necesvias parm prepara fos frmatos de ecoleecion le datos en bruto, lames irsimentos, para el anise datos. Comenzamas con una ‘deseripisn de algunos de los tnninas y concepts hascos dl pracesamiento de dates, tal como se ‘aplcan a a investigacion de mercados. Luego, se analiza la decisin sobre sl deberin prepararse 0 Uh instumento del encuestaca particular para el anlss de datos. Es posble que no hava sido lenado ten fort apropieds, y por tanta na queramecs tiara, En olras secciones analizaremos a edicin de Insramentos de recoleccion de dates, codiieacén, depuracién de datos, ceacion de nuevas variables ¥ ponderaciin de datos, ALGUNOS CONCEPTOS BASICOS ‘Nuestia tarea basica en el procesamiento de datos consiste en comertir los datos en bruto del instrumento de recoleccién de datos en una forma legible por e! computador. Luego podiemos hacer uso de procedimientos computarzados de andlsis de datos para extrae informacién de los Gatos. Antes de ver como se hace esto, ensten algunos concepios y tézminos que necestamos comprender. (Caso Un caso es una unidad espectica de andss para el estudio. Con bastante frecuencia, a unidad de andss eof encuestado de un cuestianaro, por tanto, cada encvesado se consderarfa un caso yel mero tla de asos es igual a amano de a muestra Representacin computarizada de datos Los datos suministados por un instrumento de investiga cn deben converse a una forma legible pore computaear Histonicameate a fareta de computa ea el instumento basica utizado para este propésito. En la actuaiad, cas siempre los datos se ingresan drectamenteal compitador en el mamenta en que se eeolectan en las entrexistas teefén- ‘cas {u6areel capo 16) os dgtandeclaments en el computalor dese eliasrumento de ecoleccidn ‘de datos, sin uizar una tarjeta de computador como paso interme, Ei sltimo enfoque es comin en las entreisias por careo ¥ personales. Sin embargo sin imporiar cual enfoque se alc, Ia igica Isica esl misma. Los datos se mgreson en un archiva sélo numérico, Tamado archiva ASCII (ASCIt significa American Standaal Code fot Information Interchange, Cela Americano Fstndar para ler ‘Cambio de lnformacién, que tenela estructura de una hoa calculo 0 matri, Uilzaremos ls analogia tea ja de caleulo para explicar esta estructura de datos. Una haja de cielo © matria se dive en celelas por files horizontals y columnas vetcales. Cada fila de a oj de calcula representa una uniadl de andliss 0 un casa, con frecuencia comespande 2 respucsts dal cuestionaro, Se asignan una o msde las columnas verticales dela hoa de ealeulo pare ‘epresenar las respuestascaponibles para una variable nica en el esto, como edad 0 ingreso. Lalego se coloca un numero o ndmerasUnicos en la cela defiida po aia del caso y la colurmna © columns dea variable. ste admero (0 ndmeres) puede representarlarespuesia queda un encuestalo ‘en paticula a una pregunta, 0 puede ser un deseipto, por ejemplo, del maf ee una deteminacla tmpres, Si representa fa respuesta de un encuestado, el aha que curse la persona en a universidad podria asignrse ala colina 7 en la hoja de call, i el encuestaca es un alurmo del ima ao, podria ingresarse un en la columna I; si ef encuestado es un alum de! pendhimo af, podria Ingresarse un? en a columna Izy asfsuceshamente Si se ests utlizanda un formato ASCI directo, y siuna variable contiene mas de 10 categorias 0 requiere dos 0 mie digitos para representar los datos, ala varie especfica en cuestion debe asignavsele tantas columnas como sea necesari para representar los datos. En una hoja de céleulo ‘comercial, coma Lotus 123 6 Excel, los datos pueden ingesarse en una columna, si ésta ha sido — previamente defnida com sficentemente ampla para contene el nimero o los nimerosrequer: {dos para representa los datos Pr ejemplo, el puniaje de un encuestatla en cada parte dea Prucha tde Aptitud Escolar (SAT Scholastic Apsude Tes) requeia tes dios. ya que el puntaje maximo posible es 800, En un formato ASCII directo éte requeria tres columnas en la hoja de cdleulo. Las olumnas 2 a4 podrianasignarse a esta variable, vel puntaje wsacio se ngresaria en fas cokumnas Stel puntaje fuera 625, lb se ngresara en la coloma 2, el 2 en la columna 3 y el 5 en la columna 4,SiSeestaba ulizando Lotus 123» Excel, entonces In calumna 2 poda establecerse can un ancho fe tes cigs y uttzarse jaa los tes digits Ena figura 17-2 se dusran el formate ASCH directo vfs estrctuas dehojns de cleo comerciales pararepresenar datos numéscos La epresentacin ASCII dela parte Ada igura 17-2 eanlene slo fos ndmeros del a9 en cada column, pera represen exactamtente los mismos dats, tal como se ‘mosiraron en la representacion de Ia hoja de eslelo de la parte 8. Natese que la columna 1, que presenta el ao que cursd en a uversdad es ieléica ens dos formatos. Eto se debe 2 que so se Feces una columna para las respuesis petinentes ala pregunta. El puntaje SAT require tes colar fs en formato ASCII pero sola una eniaestuctua de hola de clculo comercial. Los datos de a parte ‘Ancesitan cinco columinas pero represenan slo res variables, Las tes variables de datos de Ia parte { requisen slo tres columnas de un ancho aprepiad cela hoja de calcul, Mattie de datos La base de datos estindar poral ovestigaciin de mercado se forma en una mate de dates n» mn por par elas ce datos La hoje cle eSlculo ata mais de datos pede ser tan frande como se feqier, sequin el rimera de encuestados fins fas) y el ndmero de warble (as Ccolumnas. El nimero de casos y wrables en una matiz de datos est lmitado por la capacidad del ‘naquete de sofnvare computacional para el andl de datos que sees utitzando. En la prdctica no es ‘aro tener una matte de das de 2,500 » 200 © incluso mas grande. Todo To que se require es que tuna fila especiica dentro de fa mati de datos se le asgne a un caso determina, y que una cierta ‘colurina se le asigne a una variable especie, Luegn el computador puede hacer uso de la represen tacida numérica de los dato. ‘Almacenamiento de datos Una vez que los datos se han ingresado al computador, el investigador puede uiizarlas capacidades del computador para almacerarlos datos en un eiqueteo en una cin ‘a as, son Faces de aceesar para el andlsis posterior de los datos. Con sistemas directs de ingreso de datos al computador, la respuesta 2 culquiee pregunta espect fica silentfiea como aquela sess en una ubieacien particular en el archivo de dalos del computador, dela misma manera que se le da una ubicacién espectica en la hoja de calulo de computador. Teniendlo en mente estos concepts bisicas, ahora examinaremos los pasos indviuales en el fyjo del pracesamionto de datos. FLUJO DEL PROCESAMIENTO DE DATOS Ea igua 17-3 se presenta na vsin general de la secuencia tradicional de as funeiones a recat cen el procesamiento de datos. a incliven: 1) decidir sb dehe utizarse © no el insumento de ecoleccin de datos para el ans, 2} edtarlos dates, 3) codiiear los datos, 4) ingresar los datos al, ‘computador y vencalas, 5} convert el archivo de datos a una forma levible por o sofware de computador para su anslss, 6) depurar el conjunto de datos, 7) gonerar nuevas variables en la mecha que sea neces, 8) pondera los datos de acuerda con el plan de muestreoy ls resulta tlos v9) almacenar el canjanta de caos en dsquete 0 en cinta. En a seccida siguiente se presenta ide cada una de esas fonciones Parte A Forma ASCH Parte 8 Formato de hoja de aeuo comers ee Con sternas dvecos de ingeso de dates a conspotado, algunos de estos pasos son imecesarios pueden teazaise simelnesmente con el ingresa de datos. Sn embargo, Ia fuori veakzatla on «aula paso es necesaia en los sisters basados en compitaor, as cosmo su compen, Identiicacién de instrumentas aceptables Al reabirun nstumento de recoleccin de dates de campo el investigator debe esaminarle para deter nina ws acepiable para wiza en estudio. Los estos exdcks aa jugar Uh nso com n> aceplable vara lun esata a ota, pero aquellos que se enumeran a commuackn soo caractersticus Cptuio H:enccesawenroccomos 597 cai ei ae 1. Una parte signiicativa del nsitumento se dea sin contestar 0 os elementos cave se dejan sin respuesta 2, Esch com ass en las espuestas dads, que el encuestado no comrendks lo tarea ener al complet el nsrumento, 3._Las rxpuesas muzstran may poca vaianza, Por ejemplo, las respuestas a una see ce pre suns acl son tds Ben una escala de 7 puntos. st es esdenca de que clencuestalo fo ess tomando la area con seria, 4. Un elemento equivocado dela mucsta ha camel ef instrument Por ejemplo, eles “espe queles encuesiados sean eres erty un hanna camped el instrument, oe 5. Elinstumento est isicamenteincompleto Por eemplo, es pose que no se haya inluido una pégina a que tase haya elminado en el compo. 6. Elinsumenta se recibe después de una fecha de cove esablcida. Si se espera que todos los Instrumentos se devuelan del compo, es probable que el estudio no se complete a tiempo. Si elinvestigaor considera que el etecto particular en cvesibn poekia crreirse dentro de reste cones razonables de tiempo Y costo, et nstumenta de recoleccin de datos puede devolves al ‘campo. De lo cantar el instrument se elimina “Tados los instrumentos de recoleccién ce datos deberian estar suet a este tipo de examen prelim nar antes de ser enviados através del resto del flujo de procesariento de datos. Ane todo, deen ‘stablecerse los citeros pars aceplor 0 rechazar un msrumento antes de recibir, Edicion Edicidn significa revisor las instrumentos de recoleccién dle datos para asegura’ la maxima exact tud y minima ambiguedad. Es importante que la ediciin se realice en forma consistent. Er un estudio pequeti, una persona puede realizar la funcién de eign, es probable que la consis fencia sea alla, Er un estudio grande que require muchos ediiores, es necesaro un supervisor de tediciGn para asegurar que se mantenga la cansstencia entre los eitores sta persona tendra que ‘eilicar las muestras de dierentes ediores en diversas secciones cll insrumenta. Akernativamen: te, cada editor pada hacerse responsable de una seccion diferente det instrumentoyerftar todos los instrumentos para esta secci. AV realizar a funcicn de edcin, el editor deberia ocuparse de las dreas que se describen @ comtinuaci: 1. Legibilidad Pare que posteriomente se cotliquen en forma apropida, los datos deben ser legibes.Algunas veces una respuesta lewble puede correpese contacanco ala persona que la registra, y algunas veces la respuesta corecta puede dleducirse de aras partes del insu ‘mento. Sino hay una respuesta definiva, esta debe clasicarse coma dato faltante. Pare ‘esumir el editor elimina la ambigiela de los datos resisvados, de manera que el codiicador Sepa exactamente que hacer. 2. Integrdad Las pretuntas que no se contestaron pueden tatarke de res maneras, Primero, e edit puede contatar al enttevsiador par tatar de determina i el encuestado no respons {a pregunta o's el enttevistador simplemente na teaists la respuesta. AV hacer eso, evi riesgo de que el entevstador no recuerde comtectamente esta entrevista en particulates Tamente es posible voher a contact al enevesiada para una respuesta 3 una prezuta espe ‘ica El segundo enfonue consist en clasificsr ese dato en paniulae como iaante. Por th Imo, i elector considera que faltn demasiados clementos cle datos, puede volver a enviar totko tf instumenta al campo 0 elimina del esto. 3. Consistencia En este punta se hace una vercacién preliminar sobre It consistencia dle los datos, Posteriormente, ef computador relizaei wna vedticacion mas ctallada. Por ejemplo, te eior poeta veriiear que los enevestados que afrman que campran gasoline Con tare tle credit i tengantarota de eréeta Elector puede sobciar al entresisiada que resuoha tualguierinconsstencia,expecique Ins espuesas estas preganias como datos flantes 0 tlmine el instrmento del estud 44 Exactilud El edlior necesita estar atento 9 cualquier evidencia de inesacitd en fos datos. En tests cas, el Svea mas important se relaciona com el posible sesgo 0 vampa del entrvitadoe copuleenvoceeuseironscimee 538 Tales actividades pueden detectarse buscando un pation comin de respuesas en ls ins rmentos de un determinada enievistadlor 0 repstador de datos, Clarifcacién de respuesta Alganas veces las respuesas a preguntas abietas son dies de Iniempreay con clara. Es posible que las palabras dela persona que sepa las respuestas hhayan abreviado demasiado la respuesta © que alaunas palabras sean ambiguas. edo puede ‘specifica un signiieado para la respuesta a preguntar al enlreistador que. quiso decic riesgo de enor es alto en amos casos. Obviamtenie, un buen trabajo de campo incl puede eilar que srjan muchas problemas. También se preserianelicultals cuando ls pregunias no se espandken en a erm en la cualla ecie. ren las instuccones del instumenta. Epecalent,éte ex un problema en lis encuesas pot come. Por emplo, aun encuestado puede solicitscle que say un mimena en una escala de clasieain ce ? unos Supanaamos que subraya los mimeros 45, Signs esta quel respuesta que intra da es 4.5? lector debe decir s va a casticar a respuesta como 4 6 5 03 debe repr como dat fant, Coaitieseién La coulifeacién comprende Ia asignacn de un sinbolo numérico a una determina colurna dela hoa de cileulo, 0 columns del archivo ASC, para reresentar una respdesta expecficn en un insta ment de recaleccién de datos. Anteriormente en el capi vimos ejemplos de esto, Los ejemplos de caticacibn que se presenian a continscion utizan el formate ASCH, (También vase is adelante fen este capitulo a seccion Dinsmica dela investigacion de mercados slob. Preguntas de respuesta cerrada y abierta Para preguntas esruclradas 0 de respuesta eowada, usualmente el esquema de codficacisn se especitica anes ke emmprenler el trabajo de campo. Esto Duele extendere hasta fa inpresin de fos cédigos actuales en los instmentos de recleccion de Hates, Por ejemplo, una clasicacién por sexo puetle aparecer en el nsrumenta coma Los mimeras a lado izquieido dela pregunta indcan ef esquema de cafcacin, En este caso, 31 indica que la respuesta a ésta aparece enlacolunma 31 de archiva ASCII de este encuestado, Unt fen esa columna designa a una molery un 2, aun hombre. ste mismo enfoque puede utizase para aticar datos numércos qu no van a coccarse en categoria o que tienen especiicaas sus tate soras petinenes La edd del encuestado puede slctareey cokficarse coma (Cua os su casa —_ TE} icustes sv essen 2] tos 5] 3680 4) majorde 50 En ambos casos, los cigs pueden expecticarse antes del wabsjo de campo. Silos cigs sees ben en todas ls peegunas, se dice que el cuestionaro ests completamente precodiicado. La anteriar representacién requiee dos colurmnas ASCIl a ima, slo una Laspregunias de respuesta abeta reresenian un problema mis come para su coticacion. En este ‘aso, entistador regia ls respuesta del encueslado al pede aera. Cm se converte es po ‘de datos en una representacion numerct Exiten dos cefonucs generals parse problem El primero es la preparacon de un esquema de caicacionralvamente ben desir gates de teins e abajo de campo. Paa poder hacer eso, linvesador debe guise por los resultados de ess anteriores 0 por algunas consideraciones tecrics ominanes, Por consiguent Ia rincipal are de inestigdor con Ste en capaciar alos cocadores de manera que convertan la rexpuests al pe de Ia feta en as catego coects de c6dlians El segundo enfoque consise en esperar hasta que ls insrumentos regresen del campo para des. role esquema ds ceieacion, En este cas, el nvestigador hace una lisa, Por eempo, entre 50-3 100 de las respuestas ala pregunta especfca,Posterormente examina esa lisa y decide cules cae goris son apropiadas para resumirlos datos. Despus el invesigadorcapacta ls codfiadores con hase en este esquema y ademas los arta para que estén atentos 2 otras respuestas que se presenter ‘com alguna recuencia. Sesto sucede es posible que sea necesaro vor ats yrevisarel esquema de Couicacin y, por lat, volver 8 adler los instumtentos de esta pregunta, Regls y convenciones para Ia construecin de cédigos Evse una serie de regas © convenciones ‘que nacen que a funeién dle eodfcacin fancione ben 1. Establecer categoris de cédigos mutuamente exclayentes y colectivamente exhausts. ‘cil elabororcategovas colecivamente enhaustias al agregar, por ejemplo, la categorta de Ccdigo saros, «sin informacion. o sningunor als principales categoris para la vaiable en ‘cuesin, Mutvamenteexcliventes significa que cada respuesta debe encajar en un y slo ‘una categoria de codigo, Las categorias no deben superponerse;ésta es la regla sin excep ‘ion de tad cociicacion, Los oltos semen esta Selec se descaiben mejor como com Yenciones dls, no retlas 2. Siexiste incertidumbre sobre los posibles usos para una vasiable particular bajo ani os datos deben caslficarse de maneta que conserven una gran cantdad dle deta. Es posible combinar categorias de cvigos en el momento del ands sno se requiee tal deta. Sin ‘embargo, esimposible samplar los cdg pars el ansliss i stos sean reisvado con muy’ Poco detalle, Por tanto, e posible que se qulea cadficar en mis dete defo que se preten {de usar en el anaiss. Un ejempl sera cocificar lo edad exacta del encuestaclo huego com bina as edades en cateporas al momento del ana 3. Siga estas conmenciones cel esquem: 8. Lice slo un némero ASC por column, b.Uilice solo cigs mumeicos, no empleecaractresesperiaes o expacios en blanc. 6 La posicién del archivo ASCII para una variable puede incur Lamas colurmas como sean recess, pero na pitedeasignarse mas de una variable aun sola colonia. 4 Sies posible, uiice codigos estinelar para fs datos fallantes Por ejemplo, algunos investgn- lores siempte san el pars esperiicar una vatable de una cola faa v 99 para uns ‘arable de dos columnas falta, y as/sucesivamente El imestgaar puede tener una xara ‘le clferentestipos de datos fltantes, coma sna 36, «no se aplicasy ete rehGs0 2 respon ders, Si quiere preserarse este delle, debe fjarse un cdg estindar para cada un. Fa faclta la codicaciny Ta posterior intepeetacin del andi de dat, Cceptule 72 fncesAwenTO DENS SHH 4. Alescoger los puntos limite para as variables cantinuas,considere la siguientes preguntas. 2. 8 cunas categoria debe dis l varsle, dado al plon de ans que se ha desanalado? by, {Deben as categoras tener intervalosiguales (0.9, 1019, 20-28, ete} deben constaicee de ‘manera que cada eategoria tenga aproximavlamente el mismo wimero de casos? {6 :Deben esta abieras las categaras extemas (menos de US89,000; USS60,000 y mis} para Inclir up ampiorango de puna extremos 0 los intevalos deben sr ost Al toinar esas deciiones, el investizador debe reconocer que 0 uso de itervalosiguales lene en cuenta un andlsis estado posterior mas faci y que el nimera de categoriss selec ‘ianads afecia el detale de I informacion retenida de los insrumentos. Cvanias mas catego rias se tengan, mayor serd ef detalle. A le lvga, ol numero yl definicin de les categorise seleccionads debe satsacer al usuario de la investigacin. El invesigadar debe consular con el gerente sobre este tema 5. Coloque ol niimero de idensficacién de un encuestado en cada fila en a mate de datos. Can las las identiicadas de esta forma, usted puede ondenar al compulador que verique si el ‘nimero de casos requerido est en Ia mat de datos. Los nimeros de identfieacin de los ‘casos tambin fcitan la posterior depuraian de datos, Respuestas miiples E problems de as respuestas multiples surge en dos contextos. El primera se presenta cuando el invesigadr espera recs una sola respuesta En este cas, la decision podtia ‘consist en selectionar una dela respuestas sabre alguna base de prioidadestablecd, por eiemplo, la respuesta que se escibié primer. Altorativamente es postle desarofar categorie de codigos para representarcombinaciones de respuesas. For eiemplo, el? puede representa aquellos encuesadas fue devon que el sabor y tempo de coccion son arbutos importantes en la mezela de Bizcocho. Finalmente, es posible clasficar esta respuesta canva dato flan, {En stuaciones donde el ivestigair espera mas de una respuesta, exten dos procedimienos. sbvimero consisteentatar cada respuesta posible como una variable separads, en una columna dilere: te. Por ejemplo, una pregunta puede pedir qué deportes practica un encuestado. En catia deporte pota responderse con un sf 0 un no y se asignara a una colurnna unica. La segunda opcion se encuentra disponible cuando ol inesigador ene un nimiero expectic de respuestasesperadas.E investizador pod asignar una colunsa separads para primera respuesas, otra column pats $8 sundas respuesta, y as/'sucesiamente, Los cédigos dentro de cada columna seian los mismos representando as aciones disponibles. Por ejemplo, un 1 en la primera columna de respugsas paca indcar que el aor ie la primera respuesta de este encuesaco como un auto importante ara la mmezca de bizcocho. Un 1 en la segunda columma de espuestasindicara que el saber ue a senda respuesta como un atbuto importante para la mezely de bizcocho, En el ands, el invetizador podria examninor cada colomna de respuesias por separaclo 0 combinar las colurmnas para abtcner el ‘otal de espuesias. Debe tenerse cuidado al combina datos de este tino es posible que un alrbuto colocado en segundo o tercer ugar. asi sucesivamente, por una ran canided de encuestados pueds tener mis menciones otales que ora avibuto que ko mis menciones ela primers respuests. Une simple suma de las menciones a waves de las colummnas podria confundir a las gerentes, Debe ‘onsutisees en cuanto a aimpavtanca que fe atshuyen als iveles de segunda o tercera mencio, felc, antes de desaallar un esquema de combinacion, Debe reconocerse que la codificacién es una tarea porencialmente aburida, Después de tra jar con intensidad y creatidlad para desayalle el esquema de codiicacion, el procesa real de Codhficacién puede parecer bastante tedioso. Adams, con frecuencia esta funcion no es bien Femunerada, lo cual genera problemas con la calidad del personal. A menu, las ersores de codificacién ocurren a menos que ol investigador mantenga una estrecha supervision sobre la #2 Part anise 08 ouro8V LABORA ORO SRE LOS WHLLAZEOS CELA ESTO cotificacidn, Se puede estar alerta con el trabajo de los cosliadores, soliciandoles que mus tren como se codified una muesta dle nsumentos. Este tipo de verifeacion tambien dard une ‘pinign general del informe que realizarsn posteriosmente 1 detalle del esquema de coficacn necesita estar documenta, yest dacumenaciin se colo. ca en fo que se lm libro de eédiyos. Libro de céigos Un lia de célios es el gar donde se documenta toda la inoxmacidn necesara ‘cerca de los variables ene conjnto de datos. st Evo tiene tes funciones. Primer sive convo und §ula para los calficadaes; eunclo, ayuda alos investgadores a loclizar ls vaables que desean tilzar en un determinada tino de ans de daisy, teres, lene en cuon la ientilleacion apropos tla de categorias de variables a medila que se interpreta el resultado del computador. El invetigador testoriateralmente perdido sin un buen Horo de cig. {contenido dellibco de egos varia. Para un estudio may simple, sa se puede escribir el dimer dela column pertinent yefndmero dela respuesta en el instrument Un cuesfonaro completamene te precodficaco puede ses como su propio bro de coco En eetuios mis complejos, es il tener un libro de egos que contenga ms inormacion. Con frecuencia, el ivestigador desea que los detalles dels preguatas de respuesta abierta estén doce mentados, odeseatsace referencias variables par ndmero parasu dasieacin en el procesaminta or computador. Par tanto un lb de codigos puede contener: I) nimero de a pregunia, 2} name ro dela variable, 3) colummnae pertinentes 3 ASCII ) formato (cualquier poscin decimal implica), St nombre de fa variable y 6} definiciones de la categowa. La iabla 17-1 presenta una parte de un Ivo de codigos strativn Ina rips mala al ira de fdigossursinsta informacion sobre cme aparecen exaetamente ls variables (sexo, ead y promedio cle notas de grado PNG} en la marc fle datos ASCII y imo nas referiemos 2 ests en el ansisis posterior. Por ejemplo, el PNG se tienommina variable 121, ert en las eolumnas ASC 91 a a 93 y ene un lugar decieal implicto das {ARLAT-1_UiLUIERO DE condos WuSTRATWO Peon wrasse ““tinates " pormatot —umble Bains ze etaor ea 6 n See 1 =tomenine 2 masculine 9 dates ‘atartes 8 a S954 2 Edad Niraro 0098 do dos tes 90> dato iatanes 7 se ores Faz PNG Wimere 000-40 dees ages can ‘egar decmal dos posioones a ‘usta onal camp dao copie rr: rvoceenaewrovenwres $19 posiciones ala izquierda del final del campo, es dec, entre hs columnas 91 y 92. Nunca se inserta Ia pascian decimal silo se necesita da al computador Is insruccdn de formato. E] PNG se obiuvo ‘en a pregunta 74 del nstnamento. Parana pregunta de respuesta aberta compli, [a descrncion de as categoria le ciigo puede ser bastante larga {Una dle las ventajos de los sistemas basados en computador es que una vez que a estuctura de cocifeacin se ha establecido en of computadar, el sistema auiomaticamente puede crear e imp ‘iran oracle cohgos, Codifcacién real Una ver esialecidas las categorias de cdg, se reali la caficacin cea. En teste cas, fas coificadoresescriben los eliza apropos en el to indicado del papel con colum- fas © en una sho de cligos especial La hoja de cdigos puede consderarse como una versin en panel dena mii de dans ASC Una vez hecho esto la eodieacion ess erminada, Ingreso on el computador y veriticacion Las hos de coifcacin terminadas se enregan al personal para su ingreso al computador; ellos inresan ls uimeros exactos que aparecen en las hojas en un archivo ASCII del computador. ego archivo est lito para ser contertda en una hoja de cileulo 0 una matt de datos. Por supuesto, 8 posible ingresar los datos dectamene en una hoja de calculo desde las hojes de codkicacon, pero debe tenerse cuidada con este métado porque es Fall eometer un error en el inareso de datos, Por tanto aconsejable veriicar los datos a vez que se han ingresado pero antes de convert el arch vo. Elresliado de este proceso debera ser una base de datos exact, CConversidn det archivo de datos en un formato legible por el software para su anslisie {archivo de datos debe intraductse en el computador de una manera tal que lo puedlan us los programas computacionales de andisis de datos. La mavoria de los programas con mayar probaliidad de uso par parte de un investigadar estan cantenidos dentro de un paquete de pro trams, Los datos de hojas ee caleulos pueden ser la informacida generada para archivos ASCIE logibles por la mayaria de los paquetes estadisics. Ademés, ahora ewsten muchos paqueles esla- Histicos que leen farmatos comures de hojas de edlcul. Por ota parte, ls programas de sofaeare He hojas de caleulo y bases de datos estén en la actualidad aumentando sus capacidades de analiss estate, Como se menciond, uo de estos paquetes de programas es el SPSS-PC. Eislen muchos ottos, pera uillzaremos ul SPSSPC para dustrar In estructura de estos paquetes. En la igura 17-1 56 Iesenta una viskn general de Io que debe hacerse para elaborar un archiva de datas SPSS-PC a parle del archivo de datos en brut. El archivo de datos se carga en el camputador junto con un numero de descripciones, ineuyend: 1) numeros y rombces de las vaiabes, 2) formato de las variables, 3) cogians de los datos faliantes y 4) descsiptores de Ia categorta de variable (si el usuario desea que aparezcan en las impresiones par computador). H resultado de esta es un Stchivo le datos SPSS-PC listo para el anil. En esencia, a partir del pacuete de datos se ha labarado una matiz de datos legible or el SPSS-PC, y todas los programas de anlisis del SPSS PC pucden utzar este archivo de datos. Podemos realizarun proceso de anliss sn preocuparnos por lalocaizacion y definiciin adecuadas de las codigos de ls datos fatantes para as variables Ale interés en nuesra vecificacian de datos. Tado fo que necesitamos hacer es remitirnos 2 los ruimeros de las variales deseadas en el archivo de datos SPSSPC. Este proceso conduce a una tran eticienciaen el anlisis de datos. | | L_. | Un elemento que debe incite coma una variable en el archivo de datos es el ndimero de ini ‘cacién del caso. sto ayudar Tacitar el siguiente paso de la depuracin de datos, Depuracién del conjunto de datos Ara tenemos un conjunto de datos estucturado como un archivo de datos de computador, pero ain ‘debemos talar de depurr el conjunto de datos ce poxiblesexrores, Se realizan tres pos de veiica ‘ones en el conjnto de datos. a saber 1) verficacion de c&dgos anormaes, 2) verifiadion de “consistency 5} vericacon de caso extreme, Veriticacin de cédigos anormales Los prmeros elementos que deseamos elimina de nuestro com Junta dle datos son los lamados edlgosanormales, es ec, os que no estin defiidos enol Ebvo de ‘bdigos para una determinada varable, Par ejemplo, avaiable ssexo» puede tener res codigos legit ‘mas (donde el tercero sera para dats flantes). El numero 4 0 mayor para esta variable seria un cidigo anormal, probablemente ol resultado de un ertor en la eodiicacion 0 el ingreso de datos al ‘computador sta veicacion puede lograrse hacienda que el compitadr relacione los meas ce respuesta en cada categoria de cada variable, lo que nos dias existe @:90 un eéigo anormal. Pro, fen qué caso se presenta esto? Fsto no representa un problema se ruimera del caso es una variable, Toda le que hacemos es orden al computador que imprima los nmeras de caso para aquellos casos {que tienen un codigo anormal, nego examinamos los instrumentos de recolecidn de datos para estos ‘casos y realzamos las correccionesaproplaces en el archivo de datos. La mayaria de los paquetes de andliscomputacional nas permiten hacer esto con faciac, Verificacin de consistencta El siguiente paso consste en vrificar a consstenca dels espues tas dentro ce cada caso. Durantela trea de edi hicimos una veificacion de consstencia prekininax pero la que realiza el computador puede ser mucha mas completa. Por ejemplo, pdfamos verficar Silos encuestados que enen una hipoteca, lambin son propetaias de una casa. Eisen dos pas de verficaciones de consistenci: de une entrada y de dos entradas. En una stuacin de consistercia ‘de una entrada, A es verdadero s 8 es verdadero, pero el inverso no iene que ser verdadero. En una situacion de consistencia de dos entradas, A es verdadero sy slo x es verdadero y Niceversa. E Snterior ejemplo sobre la casa la hipoteca seria un ejemplo de una vericacion de consisencia ce tuna entada, & deci, el encuestado que tenga una hipoteca debe tener una casa, pero es posible ‘que algunos propietarios de una casa na tengan una hjpoteca,Podria hacerse una veriicacién de Consistencia de dos envadas en un estudlo sobre estudiantes univesiarias.Podria hacerse una veifieacin entre horascréios obtenias y e afo unversitario que cursan en la universidad (timo ato, pendtimo afo, etc). Stun estudlante de peniikimo afo tiene ent 60 y 90 horascrédios, boda hacerse una veriicaion de dos enradas enre horas-eédiosy el af universiaria que cuss. deci, se veriicarfan ls personas que tiesen ene 60 y 90 horascrédtos para ver que se cls. ficaron como estudiantes de penta ao, y se verfiaran ls peeonas clasicadas como estciantes de pensltimo ano para vers! poseen el nmero adecuado de horas-rédios. Un buen paquele de aniliss de datos debe tener los comandos necesaries para hacer este tino de verficacon, Nueva: mente, una vez enconteado un error, se imprime el nimero del caso, se examin el instromento de recolecciin de datos y se esiza la correccin, \Veriicacién de caso extremo Un caso esteme se define como una respuesta a una variable, que ‘ests muy po fuera de Io comin. Por ejemplo, un puntaje SAT registrado como 796 en el archivo de {datos puede ser sustancialmente ms alto que todos los dems puniaes. Podemos ordenatle al comp tacor que imprima del toal de casos los nimeros de casos con puntajes SAT por encima de 775. Luego, veifcariames si estos puntaes fueron los coractos. sta es ota forma de ientiatlos pos bles enores de codiicacion a ingreso de datos al computador, Goneracién de nuevas variables Una ver depurado el conjunto de dates origalmente codcado, podemos praceder a agregar nuevas ‘viable a este conjunto de datos cue se utilzari posterarmente en el ansise.De nuevo, las capacles ‘del computador hacen ms simple exa area, Exsten vars cicunstancse elas cles podkan generarse ues variables 1&5 poste que queramos agregar datos no recolectados en la entrevista, Por ejemplo es prabs- ble que queramos agregar informacion de un censo sobre el rea en la cual vive un encuestad, 2. Es posible que queramos dividr una variable de interval, coma ingeso, en categorias, 0 ue ‘ueamos combinarlascategorias de algunas variables para que nos dé una variable con menos categoria, Es posible que queramos formar una variable que se defina mediante combinaciones de ote variables. Por ejemplo, la variable vetapa del ilo de vida dela familias se forma utizando ‘edad, estado civil presencia de his, ee 44. FS posible que queramos crear un nize para repesentar un nero de variables, Por ejamp, povlemos simplemente agregar un conjunto de medidas a eseala acerca de un producto para formar un ince relacionada con el interés en el producto, También es posible elaborar indices mis compejos. Estas nucta variables se colocan en e conjunt de datos para cada caso y se les asigna un ime de variable. También debenIncuitse en el br de cédigos nto con una descripcion detallada de lo ‘manera como se frmaren. Ponderacién Hay una ire que puede ser neces realizar en el archivo de dats, a saber, a pondleracién de los datos dle acuerdo con el plan de moesteo,« debido a resdtados muestales inesperadoe. (La ponderacin se analizédetalladarrente en el captul 15). isicamentenecestamos ponderar la prbabiidad de selec: ‘inde elementos varia a tavés de subgrupos,y si deseamos hacer un ands can toda la muesva. Le ‘otdenamos al computador que asgne las ponderaciones aropiaas als casos. 5 deseamas reali un nis de subgrupos, simplemente ordenamos al programs de andlss que ignore a poreracién, #48 Parle SALI 08 DOSY ELARORAIE OE WFORUS BORNE LOS HALAZaCS NE LAAWVESTIONCS ‘Almacenamionto Alora tenemos un conjunto de datos completamente preparado para ans Por lo yoneal se almace ‘na en un disqueleo cinta, con una copia hecha en ove disqueteo cinta para guardara en un usar ‘seguro. Ahora estamos Istos pata hacer el anlss de dates. DESAFIOS DE LA CODIFICACION INTERNACIONAL Incuso una actividad tan aparentemente diecta coma la codtiacin iene una dindmica especil axociada 9 ta cuando se emprende una invesigacion de mercads intemacional. La codiicacion ‘esempeha un papel importante en la calidad de as encuestas internacionales. Es especialmente com> pleja cuando se trata de preguntas de respuesta abieta. A pesar das dficultadesinvelurads en la Codiicacion de extas repuestas, las preguntas e respuesta abieta son una parte valiosa en estas fencuesas, ya que por Io general no hay empo sient para evar a cabo una invesigacin cuit tiva en todos los paises imolucrados. Es posible que la experiencia conjuna cl investigador de la Agencia el clentey el gerente de producto no sea suiciente pa permis redactar una lta comple {a de respuestasprecocficalas. uso de preguntas de espuesiaabertafambien pete alinvestizador interpreta ls respuestas con base en ls palabras exacas del encuestado, en gar de tener que ependor de la interpretacién del encuestado 0 de! entrevistador. sto produce mis contol y consis tencia. En la seccién Dinamica de la investigacisn de mercados glabal se analzan cinco enfoques bésicos con respect ala codticacdn de estuios internacionales. qj —.—-—-- CCOMPLESNDADES DE LA CODIFICACION PETERNACIONAL usden defines cinco métodosbiscos de codicacin inieraciona, cada uno con su ela as veto ydesventlas. Estos cinco métodos pueden expcarse en el context de una er ues de médicos sobre dogs y dlagnésios £l pals see para ests encvesta so Reno Unio (2) los os pate estyiador son Fanci Aleman «tla. El primer metodo asume que todo el mundo piensa dels misme manera como piesan los ingleses fo a manera en gue piersan ls alemanes, ls fanceses oI tare) El baba de ‘anpo s lara a cabo sipulénearene on todos ls pate, pro ol tabao de campo del pas Sede, 0 sea el RU, probablemente se competard primo, Eivesigador lca rebels custo ‘alos dl pat sae, hace ura ead as respuests, gorea fs mareos de ios y los env bal sede, donde se volverna Yaduial oma del pa sede ys codcarin. Aunque see ‘néiodo mis rp, y com tl quid el es econo, carece de cooly calad ide del ‘royecta tiene poco conio sobre Is codcaion de lt respucsas fos marcos da céigns se {rvlan dese lo ofcina pineal y 3 cambio sl se rectben os eueslonaios codicados. La “dae ineron ya que eno enfoque shame que an médco alah pets coo up medio ‘rglny dais as espuesias del mec alemn con base ene aba de codigo generado en RU, er opr de hace enelidams gue realmente uso el encuesado. El segundo métodoasume que todo el mundo pions en ings. Toda ls espuests de cada pals tarhicen 5! ingle, Lt rexpuestaswaducldas se devaehn a le ofa pcpal y se ‘captuse 7 pnocesauenz0 06 ox08 compl, los coifeadores que habla inglés desarlon un marco de cies con bare on fa tadcelin dees respuesta hace que ese métode sea mis leno ms costs, pera ‘cont ya caad seo mejores, que una rnayor pate dl proceso se vel en a cna Principal donde ie dal proyacta puede cntoar mejor la codfiacn de is espuestas Si rat, se saciia alo de cal, ye que ese metodo asuneInconectamente que nada se Dade ose alters ena tadvccdn dels rspuestas dal lem, del aneds 0 de lis al Ines toe, después de procesas, nuova del inglés aller, al fanctso al alana, Porle general no es esa. Etercer métado permite que les agen locales hagan una fats de us reapussas, reac ten sus proplos marcos de eGalgos y codiquen las preguntas de respuesta abies a nivel loca Luega ls ofcinsprncpal tsbaleconjantamente en oe resultados eo etpe de and sis Tse metodo ofece eflincia en cuanto a velocidad y costs. Con codleadores locales de ala calidad, pueden obteerse resultados vidos pare eada pals. aun y comparr fos resultados de encuesas realiadss por cuatro agencies lerentese& una trea dl en el mejor de os casos lo que Race que a comparacion de as mismas aun prodlara imporar te. Adem, no hay contel desde ln cfcna princi de manera quel caltdad de los resulta os tambien se pone en dd, cuario método sola respuesas de os primero 50 2 100 médleas en cada pat. La ‘ficna pica liza esas respuosas para dessolar maeos de etdlgos que sean vais {en todos los pales, aro fos cuss se expresan ene iioma de cad ply auger da uilzar ‘reducconesdelingls Lego or coeadores Fancere lemane eaonos evan 3 cabo is codiicacién nvel cena en ls fica pincoal la realizan coticadores medias expe fimentados en as agencis locales, Aunque ese mstogo es més lento mis costo que los ‘todas anteriores a elminaclon de la badcion tae ao wa Us procure cer {alle da una calidad y un cont superiors Eliguinio método sala coxsicacn computrizad, es fiaz para encuesascuantha- as, como seals de codfcaion y cracteriticas do productos simles. Aunque el andiss omputarisado de respestsabiertas pusde arvana enn idenifeaisn do galas clave pure propos del andi de contenido, tales come la casieni6n y receracn de lot plata exacias de am medio, se debe tener culdado de no exaperar evar exptcnconet pa nell ierpretacton de as respucss verbles. Por ejemplo, cuando se pide duce Ie tase rojas que no ven corazén gue o slenes un programa computactonel la educa oma sists insensto, ra program taduci wate huis como cava Nonedar ‘Aunque fa intrpetacionsupercial de las palabras er coreca en cada caso la lnerret. ‘an mis profunda y contevtual era completamanie ence, ‘Aunque el enfaque de codiiacisn ideas para una determinada sivacin quede varie Aependlendo del temoo disponible, presupuest y el ae! de deale neces par Int Fespuests abies, deben conidera‘e tes eileos principals El Fae dl proyecto debe ‘ener contol sabre todas les etapar del proceso de codilcacén y debe ivolucar 3 los ‘hunt cada vez que se pose, Ls calla de os resultados debe daince expresanga on erat as palabras y los senimientos de los encuestads, en exe casa los mecca. Lis respuesta no deben aleruarseo dstosionarse par med dele taduced. Coma en {dos os estudios da milipes pases, debe loprarse la compatacin. La invesipacin debe Ser exacts a nivel local, permitendo que les taanos vean lo que el mésicolalano dj, pera también al permit que lo resultados se comparan a vaves de dvesos pasos, con el. Nine mostrar sites y dlerencas Fu 8 Oven, Aopen Cesing eran Rs, uaa Mating Rese See 3, rar tepp 33531080 HO Parte 5: ALI 06 708 ¥ EABORACION OE NFORUES SOBRE LOS HMLAZGOS OLA YESTUGON FLUJOS ALTERNATIVOS DE PROCESAMIENTO Aunque el fio de procesamiento de datos presentado en la seccén anterior representa el enfogue ‘lsico, existen formas alternativas para transfer los datos desde insirumentos aceptables de recolec ‘in de datos al computador. Procesamiento tipo uno: Tradicionalfste es el métoda que acabamos de presentar. En resumen, sus pasos son: 1} codiicar los insteumentos, 2) transfer los eédigos a hojas de codicacion y 3) Ingresa al computador yvetificw. Este tpo se uiliza especialmente en las encuestas por corre. Procesamiento tipo dos: Codificacién marginal Es posible elimina el paso que exige qve los cédligos se wansfieran @ hojas de codiicacién mediante aquello que se senomina codicacisn ‘marginal. El margen externo de cada pagina de! instrumento de recoleccldn de datas se marea can espacios que representan las columnas de una tarjeta de computador. fl codifieador escribe los cédigos pertinentes en estos expacios en vez de hacerlo en ls hojas de codicacin. Lueg, los instcumentos con codificacion marginal se entregan al personal de ingreso de datos pata su ingre se al computador y a verificacién Procesamiento tipo tres: Entrada de marca detectable Fs posible elimina ef ingresoy la veri - ‘Gn de las ats expects sobre la stuacién que enrenta el comercializador. Hay Wes preguntas feneales que ayulan a comercaizador para que empece a identical técnica apropiada: 1) cus las wrables van a analizarse smulténeamente, 2} queremos contestar preguntas desciptvas 0 de inierenciasy 3 cual ese nivel de medicidn (nominal orcnal ode intervaos) disponible en la variable fo varables de interes? Numero de variables a analizar 1 pimer aspecto espectco de la siuactén que se debe aclarar se relaciona con los abjetvs del nals. Este aspecto se refere al nimero de variables que el comecializador desea analizarsimelts heamente, La igua 18-2 muestra esta pregunta de decisicn, sus posbles resutados y en qué parte del Noro se anaizan ls tGcrias relevantes. Siclosea examina el ans de una variable indvdualnente, te recbe el nombre de ands uniariado de dios, que consttuye el tema de est cat. L relscibn de dos variables smultaneas se examina por ‘medio del ans bivanado de dats, tema del capitulo 18. Las eaciones de mis de ds variables simul reas regen ef anilss multvarad de datos tema que se tataré en los captulos 20 y 21. (56 Part Sans oe bAT0$V LASCRACEW DE AFORNES EERE LOS HALLAZGOS BELA MVEETGACO scien 6 keenly Una 102 van eal Descripcién versus inferencla La segunda pregunta que debemos responder es si estamos ineresados © 90 en la descrpcin de ‘musta enhacerinferencis acer dela poblaci dela cual se omé la muestra La estadisca deserp- tives una rama de la estadsice que proporcionaalosinvestigadores medidas resumidas de los datos en susmuestas.Suminstra respuesta a preguntas tales como: 1) cu esa edad promedio en a mest, 2) cul es la dispersin de fas edades en la muestra? y 3) sual es el nivel de asocaciin entre edad e ingreso en la muestra? La esadstcainferencil es una rama de le esas que permite que los invest fgadores hagan julcios acerca dela poblacicn total, basadas en los resultados generados por ls musta. Se basa en la teria de las probabiidades. Suminisa respuesas a pregunla tales como: 1) edad promedio de a poblacién es 25 aos 2) el nivel de asociacicn ene edad e ingreso de la poblacin es ‘mayor que cer, 3) Jas metas de tratamiento dela poblacion en un experiment son iguales entre Tanto estaisica descptiva coma la nferencialienen aplicaciones importantes en la investiacion de ercados. Los comerciaizadores deben saber qué tipo de ands es interesa vet de medicion La tercera pregunta que debemos sponser essa variable o las variables 2 analzar se han medido a ‘un nivel de eseala nominal ordinal ode ntervalos. Tanto las ecricas deseriptvas como ls inferences ‘ran seg e nivel de la escalainherene a la variable 0 a las variables que se estan analizando. ‘alo despair de mere Por geen imvxiaon de can mals cai dato Ge roporcones ‘Sess poedimunox prs p ks oy Se rls

You might also like