1 CAPTULO I: LA ESTADSTICA Y SU APLICACIN La Estadstica es una manera de pensar y tratar una problemtica que plantea la realidad de manera ms elaborada, consciente y exacta que el pensamiento ingenuo, dando criterios de decisin. La mayor aplicacin de la Estadstica se basa en la posibilidad de contar con obser!aciones repetidas o reali"ar experimentos en condiciones id#nticas. Cuando las obser!aciones resultan di$erentes a pesar de %acerlas en condiciones id#nticas existe una inseguridad !inculada a la obser!acin del $enmeno. Esto lle!a al problema central de la Estadstica, la teora de la inseguridad, estudio de la tendencia de los resultados a !ariar cuando se %acen obser!aciones en condiciones id#nticas desde el punto de !ista del obser!ador Definicin: Estadstica es un con&unto de m#todos cient$icos con los cuales podemos recolectar, resumir, presentar y anali"ar datos num#ricos de un con&unto de indi!iduos, que permiten extraer conclusiones y tomar decisiones seg'n dic%o anlisis. (plicamos estadstica cuando tenemos gran cantidad de obser!aciones cuya aparicin se rige por las leyes del a"ar. )ule* datos cuantitati!os $uertemente in$luenciados por m'ltiples causas. +ini* t#cnica adecuada al estudio cuantitati!o de $enmenos colecti!os cuya medicin requiere obser!aciones de $enmenos indi!iduales Historia Estadstica deri!a de status que en el latn medie!al signi$icaba estado poltico. Se us por primera !e" en ,amlet de S%as-espeare, luego en tratados de poltica econmica y signi$icaba la exposicin sistemtica y ordenada de las caractersticas del estado, los censos, que se mencionan en textos egipcios, en la .iblia %ec%os por /ois#s y 0a!id, en C%ina por Con$ucio, en +recia y 1oma. La iglesia y su Concilio de 2rento introduce la inscripcin de matrimonios, nacimientos y muertes. ,acia el siglo 3455 adquiri autonoma y organi"acin con Cnning, $undador de la estadstica en (lemania, estadstica uni!ersitaria descripti!a. El nombre de estadstica le $ue dado por (c%en6ald. 2ambi#n en el siglo 3455 surgen en 5nglaterra los arit!ticos "o#$ticos que pretendan una estadstica in!estigati!a. +raunt $ue de los primeros en reali"ar estadsticas de la poblacin, anali"aba la in$luencia de las estaciones del a7o sobre la mortalidad, la a$luencia de poblacin rural a la ciudad. 0e esta escuela deri!aron dos* La encic#o"e%icoate&tica que entronca con la aparicin del clculo probabilstico. 1epresentantes* ,uyg%ens y su tratado sobre la probabilidad de #xito y $racaso en las cartas y los dados. Pascal y 8ermat y sus principios $undamentales del clculo de probabilidades. .ernouilli que lo aplic a lo social. 0e /oi!re y la $ormulacin matemtica de la cur!a de probabilidad integral. Laplace y +auss demostraron el !alor practico de la cur!a tpica de la distribucin de errores cometidos en las obser!aciones. 9uetelet aplic esta cur!a a datos de tipo social y biolgico originando la (ntropometria. +alton, precursor de la Psicometra en psicologa, extendi la estadstica a datos de tipo gen#tico para el estudio de la %erencia de los caracteres somticos y sus di$erencias indi!iduales. 0e #l procede la escuela inglesa de estadsticos y biometristas* Pearson, )ule, Spearman, Student, 2%urstone. La otra tendencia es la %eo'r&fica con S:ssmilc% y sus leyes de mo!imiento de la poblacin (aria)#es En la realidad obser!amos gran cantidad de distinciones sensibles, sobre las que podemos reali"ar operaciones psicolgicas de clasi$icacin, seriacin, y relacin. El obser!ador debe decidir cuales sern sus entidades de estudio, las propiedades que quiere estudiar, las operaciones psicolgicas que quiere reali"ar. Esas operaciones se reali"an sobre las propiedades de las entidades. Como estas propiedades pueden !ariar, se llaman !ariables Si en un caso particular no !aran, se llaman constantes ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ; La o)ser*acin La descripcin cient$ica se pone en marc%a con la obser!acin, que consiste en la percepcin de un dato sensible. Sobre los datos se pueden reali"ar las operaciones psicolgicas de clasi$icacin, relacin y seriacin que permiten establecer distinciones entre los estados de las !ariables La matemtica por medio de la cuanti$icacin establece distinciones entre los estados de las !ariables asignando n'meros a los estados. El recuento es muy utili"ado en las ciencias sociales cuando interesa saber el n'mero de %abitantes de una localidad, n'mero de !eces que en un tiempo determinado interact'an entre si dos indi!iduos. La estadstica tambi#n tiene muc%as !eces como materia prima operaciones de recuento Posi)i#i%a% %e e%icin en #as ciencias socia#es + %e #a con%,cta <2odo lo que existe, existe en cierta cantidad=. En la in!estigacin cient$ica es esencial la medicin de $enmenos porque permite !er si %ay !ariaciones, si son concomitantes, si se relacionan. Cuando un $sico mide, asigna n'meros a las obser!aciones, los n'meros pueden anali"arse por manipulaciones como contar o medir, seg'n ciertas reglas. El psiclogo intenta %acer lo mismo midiendo !ariables de comportamiento, pero para operar con los n'meros que asigna a las obser!aciones, la estructura de asignar n'meros debe ser isomr$ica. Para eso %ay que entender la naturale"a de la matemtica. 2oda rama de las matemticas comien"a con un con&unto de postulados. Un postulado es un &uicio que establece relaciones entre ob&etos. Un postulado es 'til por las conclusiones que podemos sacar de el. En un sistema de postulados no debe %aber dos que se contradigan y no deben repetirse. Las deducciones lgicas que se sacan de los postulados son los teoremas Postulados y teoremas estn en el reino de las ideas, no re$ieren al mundo real. La $uncin de las matemticas es pro!eer modelos con!enientes para describir la naturale"a, pero esta no puede ser descripta exactamente por modelos matemticos, toda descripcin es una aproximacin. La naturale"a no obedece a leyes matemticas pero su estructura posee propiedades que son similares, paralelas a la estructura de los sistemas lgicos matemticos. Existe un isomor$ismo o equi!alencia de estructuras. La esta%$stica + #a in*esti'acin en #as ciencias socia#es + %e #a con%,cta La estadstica permite conocer y medir indi!iduos u obser!aciones ba&o dos puntos de !ista* -. En f,ncin a caracter$sticas %e# 'r,"o + no a c,a#i%a%es "artic,#ares/ %an%o: a> Conocimiento preciso de la composicin del grupo por rele!amiento de la caracterstica medida b> Conocimiento de cualidades abstractas ligadas al grupo mediante el clculo resumido en* 1. La media o !alor central tpico del grupo ;. La des!iacin estndar, grado de !ariacin de las obser!aciones respecto de la media ?. La $orma de distribucin de las obser!aciones* simetra o asimetra @. El error estndar que permite conocer la cantidad de casos que deben tomarse para obtener un determinado grado de seguridad o en que medida pueden ser generali"adas las conclusiones c> 0a el grado de asociacin que puede existir entre dos !ariables 0. Se e"#ea con e# fin %e "re%ecir o estiar ,na sit,acin "ro)a)#e Por eso #a Esta%$stica ",e%e %i*i%irse f,n%aenta#ente en: Estadstica 0escripti!a* Parte de un con&unto de datos y obtiene conclusiones de los mismos pero no rebasan el con&unto de conocimientos que proporcionan esos datos. Estadstica 5n$erencial* Parte de un con&unto de datos pero las conclusiones obtenidas rebasan los lmites del grupo y permiten in$erir !alores para indi!iduos o grupos dentro de ciertos lmites ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ? CAPITULO II: PRESENTACIN DE O1SER(ACIONES Y SISTE2ATI3ACIN DE DATOS Etapas de una in!estigacin estadstica 1. Elaboracin del 0ise7o de 5n!estigacin* Ser distinta si es de tipo descripti!a o explicati!a. ,ay que planear que instrumentos se utili"arn Aencuestas, censos, test>B como se utili"arn los resultados, sistema de codi$icacin, tipo de tabulacin Amanual o mecani"ada> ;. Compilacin de los datos* rele!amiento de la poblacin o muestra. 0atos primarios y secundarios. Listado de la poblacin y seleccin de la muestra. Enumeracin de los datos ?. Sistemati"acin de los datos* 2abulacin, preparacin de cuadros y gr$icos, presentacin gral @. (nlisis estadstico* %allar los estadsticos relati!os a la tendencia central, !ariabilidad asimetra, error estndarB in$erencias para la poblacin respecti!a, estimaciones, decisiones respecto al margen de error aceptable etc. Para reali"ar el (nlisis es necesario conocer la $recuencia que corresponde a cada categora de la !ariable, para ello se compilan y ordenan las obser!aciones. 0eterminada la $recuencia es necesaria su presentacin en alg'n sistema simblico* tabular, gr$ico, o $rmulas matemticas. Constr,ccin %e #as ta)#as %e %istri),cin %e frec,encias La presentacin tabular consiste en presentar en dos columnas, las categoras de las !ariables de obser!acin y las $recuencias correspondientes, de manera que en cada %ilera se indica una categora y su $recuencia correspondiente. Un problema pre!io reside en la construccin de las categoras que tiene por ob&eto destacar la in$luencia por parte de cada categoras en las !ariaciones de $recuencia. Esto obliga a establecer un n'mero de categoras no muy grande, para que se destaquen las !ariaciones de $recuencias, ni muy peque7o para que no resulten absorbidas las di$erencias que queremos destacar. Escala Cominal* La !ariable de obser!acin corresponde a una escala nominal Los miembros de una categora deben ser id#nticos respecto de la propiedad medida. Con estas escalas podemos obtener $recuencias, expresarlas en t#rminos de porcenta&es, !er cual es la categora de mayor $recuencia Amodo> y obtener algunas medidas de correlacin. En un cuadro, la primera columna corresponde a las categoras de clasi$icacin de la !ariable y la segunda a la $recuencia correspondiente a cada categora. En una $ila particular, al comien"o o al $inal, se coloca la $recuencia total. El orden de sucesin de las categoras nominales no corresponden a una caracterstica de medicin, sino a ra"ones de presentacin. Escala Drdinal* Los elementos de una categora no solo son distintos de los de otra categora, adems estn en alguna relacin con ellos que se da en cierto orden. La medida de tendencia central mas apropiada en estas escalas es la mediana. Se construyen con igual criterio que las nominales pero la sucesin de las categoras del cuadro est dada por el criterio de la escala seg'n un orden de sucesin Escalas de inter!alos iguales y cocientes* La de inter!alos iguales se caracteri"a por una unidad de medida constante que asigna un n'mero real a cada par de ob&etos del con&unto ordenado. La de cocientes es id#ntica pero tiene en su origen tiene realmente un punto cero. Estas son realmente escalas cuantitati!as y a ellas pueden aplicarse todas las medidas estadsticas excepto el coe$iciente de !ariacin a la de inter!alos iguales. Se deben distinguir !ariables discretas de continuas. Una !ariable es continua cuando entre dos !alores sucesi!os existen !alores intermedios. Permite cualquier grado de subdi!isin Atallas, edades>. 0iscreta es aquella en la que entre !alores sucesi!os no %ay intermedios AnE de %i&os>. Los punta&es de los test son discretos pero se traba&an como continuas pues la aptitud subyacente se considera continua ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. @ En la !ariable discreta se agrupan !alores en una categora, en la !ariable continua no %ay un criterio para separar dos !alores sucesi!os porque entre ellos siempre se puede %aber otro. Para resol!er esto usamos dos criterios, uno para las !ariables continuas en general y otro para la edad. Si la ci$ra es muy larga, tomaremos la cantidad llamada ci$ra signi$icati!a* si la ci$ra real siguiente a la 'ltima signi$icati!a es F se desprecia la cantidad residual A@,?;@ ser @,?;> si la ci$ra siguiente a la 'ltima signi$icati!a es F se aumenta en una unidad la 'ltima ci$ra signi$icati!a A@,?;G ser @,??>. Para la edad %ay otra $orma de construir inter!alos, la in$ormacin de que alguien tiene 1G a7os puede corresponder a una edad real entre 1G a7os,Hmes,Hda,H%ora, %asta 1G a7os,11meses, ;Idas,;?%oras, por lo que si se indica un inter!alo de 1HJ1I a7os sus limites reales sern 1Ha7os,H mes,Hda,H%ora y 1I a7os,11meses, ;Idas. La cantidad de inter!alos como regla general no debe ser menor de lH ni mayor de ;H. Se toman los datos en bruto, se los ordena y luego se agrupan obser!ando cuantas obser!aciones corresponden a cada inter!alo Para ello se construye una tabla, la de distribucin de $recuencias Distri),cin %e frec,encias: Si tenemos datos agrupados a cada !alor de la !ariable la llamamos clase, y la distancia entre sus lmites, inter!alo de clase. El tama7o del inter!alo de clase depende de la amplitud que abarcan los !alores de la !ariable y la cantidad de obser!aciones. Con pocos inter!alos desperdiciamos in$ormacin, con muc%os agregamos traba&o Con!iene utili"ar igual tama7o de inter!alos El ",nto e%io, cuando el mdulo es impar, es siempre un n'mero entero, lo que $acilita los clculos. Para %allarlo se suma el lmite in$erior y superior, y se di!ide por dos. Por el agrupamiento se pierde in$ormacin, ya que una !e" tabuladas las obser!aciones no se puede saber exactamente en que !alor dentro del inter!alo cae cada obser!acin, se supone que es el punto medio. Esto es el error "or a'r,"aiento que se compensa cuando el numero de obser!aciones es grande y cuando el mdulo es peque7o. E#eentos "ara e# an&#isis %e %istri),ciones %e frec,encias El ob&eti!o es anali"ar la relacin entre las categoras de la !ariable y las $recuencias correspondientes. 1> Un anlisis consiste en relacionar cada $recuencia respecto al total de obser!aciones. La $orma mas elemental es establecer que proporcin del total de $recuencias es la $recuencia de esa categora, para ello se di!ide la $recuencia de la categora por el total de $recuencias, dando como resultado Ap K $ L C> la $recuencia relati!a de la categora cuya suma da igual a 1.2iene el incon!eniente de que las cantidades que resultan son menores a la unidad, por ello muc%as !eces se expresan en $orma de porcenta&es, que se obtiene multiplicando por 1HH el producto de las proporciones. Se llama $recuencia relati!a $rK$ L Cx1HH ;> Dtro anlisis consiste en encontrar la relacin entre $recuencias correspondientes a dos categoras. Para eso di!idimos las dos $recuencias ra"n entre $recuencias rK$iL$&. La ra"n puede ser mayor que 1. Distri),ciones %e frec,encias ac,,#a%as En escalas de ni!eles ordinales de inter!alos o ra"ones, se puede establecer un nue!o anlisis que consiste en determinar para cada categora, la cantidad de obser!aciones menores o mayores que ella. ( tra!#s de las operaciones de suma y resta relacionamos una categora con la in$erior o superior. 0ada una categora, la cantidad de obser!aciones que son menores o mayores que ella se llama <$recuencia acumulada ascendente o descendente=. Su presentacin se puede reali"ar de modo tabular o gra$icoB en el 'ltimo caso la presentacin se llama o&i!a y la $igura geom#trica correspondiente es un polgono de $recuencias acumuladas que se utili"a para escalas de inter!alos o ra"ones. ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. F CAPITULO III: REDUCCIN DE LAS O1SER(ACIONES Y 2EDIDAS DE POSICIN 1educir las obser!aciones signi$ica presentar en lugar de toda la distribucin, caractersticas que indiquen aspectos $undamentales de esa distribucin de $recuencias. Existen @ caractersticas que de$inen una distribucin* tendencia central, dispersin, asimetra y curtosis. En escalas nominales y ordinales solo se determina tendencia central. El poder de reduccin est relacionado con el ni!el de la escala utili"ado. 2e%i%as %e ten%encia centra# La experiencia indica que para las escalas ordinales, de inter!alos y ra"ones, las obser!aciones de las distribuciones de $recuencia tienden a concentrarse alrededor de un sector de la !ariable. Existen criterios para representar con un !alor o categora de la distribucin esa tendencia de las obser!aciones que se llama tendencia central Amodo, mediana, media aritm#tica, otras> /odo Se de$ine como el !alor o categora de la !ariable que presenta la mayor $recuencia en la distribucin. Se puede utili"ar como medida de tendencia central de distribuciones cuyas obser!aciones se %an medido con cualquier ni!el. Se encuentra rpidamente a tra!#s de una simple inspeccin ocular de la distribucin, pero en realidad no da la tendencia de todas las obser!aciones, sino que indica que la categora de mayor $recuencia es una determinada. Para usarse como medida de tendencia debe presuponerse que la distribucin es conocida, se sepa que relacin guarda con el resto de la distribucin o bien el resto tenga $recuencias que no sean signi$icati!as respecto a la que tiene la mayor $recuencia. El modo para datos agrupados, no es un !alor exacto pues !aria con las di$erentes maneras de agrupar una distribucin. Se pueden presentar casos de distribuciones bimodales, con dos modos y %asta mas /ediana Es una medida de tendencia central de un con&unto de obser!aciones. Es la categora o !alor de la distribucin que posee el orden medio cuando las obser!aciones se ordenaron seg'n los !alores o categoras de las !ariables. Esto %ace suponer que se utili"a en escalas ordinales, de inter!alos o ra"ones. En los datos sin agrupar medidos con escala ordinal, si el numero de obser!aciones es impar, se ordenan los datos de mayor a menor y la categora que ocupa el orden medio es la mediana. Si el n'mero de obser!aciones es par, la mediana es la obser!acin cuya categora es mayor de las dos obser!aciones. En datos agrupados ya ordenados, se determina el orden medio de las obser!aciones que es la mitad del total de obser!aciones. Para datos agrupados en escala inter!alar, la mecnica del clculo es igual a la de escalas ordinales con la di$erencia que se determina, dentro del inter!alo la ubicacin exacta de la mediana /edia (ritm#tica 0enominamos media de la distribucin a un !alor 3 tal que si todas las obser!aciones tu!ieran ese !alor, la suma total de ellas sera igual a la suma de las obser!aciones de la distribucin original. Si todas las obser!aciones estu!ieran concentradas en un solo !alor de la !ariable, el !alor de la media, mediana y modo coincidiran en ese !alor. Pero si las obser!aciones se !an distribuyendo en $orma sim#trica, a la i"quierda y derec%a de ese !alor central manteniendo la mayor parte de las obser!aciones en el, media, mediana y modo siguen coincidiendo en ese !alor. La media es ms sensible a las asimetras que la mediana y el modo, pero tiene el incon!eniente que cuando las asimetras son muy grandes, no de$ine tan bien la tendencia central como la mediana, siendo pre$erible utili"ar esta 'ltima. La media es una medida de resumen mas poderosa que las anteriores ya que tiene en cuenta las distancias que existen entre las di!ersas obser!aciones. Solo se puede utili"ar en escalas de inter!alos. ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. M Los !alores de tendencia central en las distribuciones asim#tricas Las distribuciones empricas son le!emente asim#tricas, y la media tiende siempre a situarse %acia las obser!aciones ms extremas. Con $recuencia, la mediana suele estar a las ;L? partes de la distancia entre el !alor del modo y de la media. Una distribucin asim#trica puede ser negati!a y positi!a. Es positi!a cuando la mayora de las obser!aciones estn a la i"quierda de la proyeccin de la media y es negati!a cuando la mayora de las obser!aciones estn a la derec%a dc la proyeccin de la media. Re'#as "r&cticas "ara ,sar #as e%i%as %e ten%encia centra# Nsese la media cuando 1 2enemos una escala de inter!alos iguales o cocientes ;. 9ueremos mayor con$iabilidad o queremos establecer in$erencias de una muestra o poblacin ?. Se desean obtener otras medidas en la distribucin, des!iacin estandar, correlaciones etc. Nsese la mediana cuando 1. 2enemos una escala ordinal, de inter!alos iguales o de cocientes. ;. Cuando existen clases de inter!alos abiertas Nsese el modo 1. En escalas nominales Aaunque tambi#n puede usarse en todas las otras> ;. Si deseamos tener una idea aproximada de donde est la mayor concentracin de obser!aciones CAPITULO I(: REDUCCIN DE O1SER(ACIONES Y 2EDIDAS DE DISPERSIN (mplitud total* Es la di$erencia entre el !alor mas alto y mas ba&o de una serie, entre el imite superior real y el lmite in$erior real de una distribucin de $recuencias. Es la medida mas simple y se usa cuando solo queremos una comparacin rpida entre dos distribuciones. Co in$orma nada de sus $ormas. Co es muy con$iable sobre todo cuando se traba&a con pocos casos o cuando existen inter!alos de $recuencia nula, solo se basa en dos obser!aciones extremasB el resto no inter!iene en su determinacin 0es!iacin media* Es la media aritm#tica de todas las des!iaciones respecto de la media sin tener en cuenta los signos Asu !alor absoluto> pues teni#ndolo en cuenta la suma de los des!os da siempre H. La barra indica el !alor absoluto 0es!iacin standard* Es la ra" cuadrada de la media de los cuadrados de los des!os respecto de su media. Siempre es positi!a. Se indica con una S. Es el ndice de !ariabilidad ms com'n y de mayor con$ian"a, aquel que !ara menos cuando se calcula para distintas muestras extradas de la misma poblacin o uni!erso. Es un !alor simple, un ndice que representa las di$erencias indi!iduales de las obser!aciones respecto a un punto de re$erencia com'n, que es la media aritm#tica. Cuando este !alor es ms c%ico las di$erencias de los !alores respecto a la media, o sea, los des!os son menores, y por lo tanto el grupo de obser!aciones es ms %omog#neo que si el !alor de la des!iacin standard $uera ms grande. ( menor dispersin mayor %omogeneidad en el con&unto y a mayor dispersin menor %omogeneidad Coe$iciente de !ariacin* Sir!e para comparar las dispersiones de dos o ms distribuciones cuyas obser!aciones %an sido medidas con escalas de ra"ones 'nicamente. La idea de esta medida surge de pensar que exista cierta tendencia en las distribuciones de manera que cuanto mayor sea su medida mayor ser su des!iacin standard
ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. O TEORA DEL 2UESTREO 4C,&# es #a %iferencia entre ,n esta%$stico + ,n "ar&etro5 La Estadstica descripti!a describe !alores que se %allan considerando todas las obser!aciones del grupo de$inido que se llama poblacin, para una determinada !ariable. Pero casi nunca se puede medir a todos los integrantes de la poblacin, generalmente se extrae una muestra representati!a y calculamos en ella los !alores que la describen. Cuando se puede traba&ar con toda la poblacin de obser!aciones, los !alores descripti!os %allados se llaman parmetros, cuando se traba&a con muestra, los !alores descripti!os %allados se llaman estadsticos. Los estadsticos son estimadores de los parmetros. 46,! i"#ica e# s,",esto %e in%e"en%encia %entro %e ,na ,estra a#eatoria5 La muestra simple al a"ar cumple el requisito probabilstico de la independencia dando a cada elemento de la poblacin, o a toda combinacin de ellos, igual probabilidad de ser elegidos para la muestra. Esto ocurre siempre que la probabilidad de extraer un elemento sea independiente de la probabilidad de extraer otro, o sea que si se trata de una poblacin $inita e$ectuemos el reempla"o. Si no lo e$ecturamos la probabilidad de cada extraccin sucesi!a no sera independiente. La cantidad de unidades del uni!erso puede ser $inita o in$inita. Cuando se reali"a muestra de un uni!erso $inito se traba&a con muestra sin reempla"o, en cambio cuando se traba&a con reempla"o se traba&a con un uni!erso in$inito. 4En 7,! casos no es tan i"ortante efect,ar e# ree"#a8o en e# ,estreo a# a8ar si"#e5 E9e"#o Co es tan importante %acer el reempla"o cuando la di$erencia entre el n'mero de elementos de la poblacin y el numero de elementos de la muestra es grande. Es ms importante %acer el reempla"o en una poblacin de 1HHH elementos cuya muestra es ?HH que en una poblacin de FHHH cuya muestra es @HH. 4Se ",e%e o)tener ,na ,estra re"resentati*a 7,e no sea "ro)a)i#$stica5 4Por7,!5 Co es posible obtener una muestra no probabilstica que sea representati!a, pues si %ablamos de representati!idad, esta debe interpretar $ielmente a la poblacin, y la muestra no probabilstica suponen un procedimiento de seleccin in$ormal y arbitrario, y como no puede calcularse el error estandar no puede generali"arse a la poblacin, solo se usa como una primera aproximacin y en traba&os de tipo piloto 4En 7,! teor$a se )asa e# ,estreo5 4Por7,!5 El muestreo se basa en la 2eora de las /uestras, ya que su ob&eto es obtener, por camino in$erencial, conclusiones !alidas para la poblacin, partiendo de la obser!acin de una parte, denominada muestra. (l decir in$erencial nos re$erimos a que a partir de los !alores %allados en las muestras in$erimos los !alores ms probables para las poblaciones de las cuales pro!ienen dic%as muestras. 4Para 7,! se ,estrea5 Se recurre a una muestra cuando no se cuenta con recursos econmicos, %umanos, etc. ( !eces la muestra es el 'nico recurso. El traba&o sobre una muestra se llama muestreo y las conclusiones obtenidas a partir ellas permiten* (> Probar %iptesis !alidas para la poblacin, con la in$ormacin de la muestra .> Estimar caractersticas de la poblacin, denominadas parmetros, a partir de los estadsticos
ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. G 46,! es e# error %e ,estreo o error ,estra#5 Los resultados que se obtienen cuando se calcula algo a partir de la muestra son di$erentes a los obtenidos si se traba&a con el 1HH P de los in!olucrados. La di$erencia es el error de muestreo, siempre que los datos se re'nan empleando m#todos id#nticos. Para calcularlo se debe conocer la poblacin 2encione + e:"#i7,e otros ti"os %e errores 7,e ",e%en coeterse a# ,estrear; Errores de in$ormacin y procesamiento* Los datos bsicos pueden ser mal proporcionados, acentados, copiados, codi$icados, u omitidos. (lguien podr llegar a dar distintas ci$ras para el mismo tem Aedad>. Errores por $alta de respuestas* Son los que se dan por utili"ar datos pro!istos solo por algunas personas que responden a un cuestionario. Co se puede suponer que los ausentes o quienes no responden tienen la misma caracterstica y en el mismo grados que los que contestan y estn. Error en la seleccin de las muestras* Se dan cuando la seleccin de las unidades de la muestra es incorrecta y anticient$ica. Entra en esta categora las muestras parciales Aelegidas por ra"ones de con!eniencia>, las muestras dirigidas y la muestra por cuotas 46,! son #as ,ni%a%es "riarias %e ,estreo + 7,! son #as ,ni%a%es e#eenta#es %e ,estreo5 Co es $recuente %acer muestreo de grupos completo. Se suele seleccionar el uni!erso en dos o ms etapas. En una muestra de dos etapas, los grupos se seleccionan al a"ar, luego se toma una submuestra al a"ar en cada grupo. Los primeros son las unidades primarias de muestreo y las submuestras, unidades elementales 46,! es e# es7,ea + con 7,! otro no)re #o %enoinan #os a,tores5 Para poder seleccionar una muestra debemos tener el uni!erso <al alcance de la mano=B a !eces esto es sencillo, otras no. Lo ms con!eniente es contar con un con&unto de in$ormacin escrita que permita indi!iduali"ar el uni!erso, indi!iduo por indi!iduo, y as elegirlos seg'n un m#todo. La in$ormacin escrita se denomina esquema o marco de re$erencia y puede presentarse como listado, mapa, registro. 2encione + e:"#i7,e )re*eente #os "asos %e# ,estreo/ se'<n S#oni 1> 0eterminar con toda la precisin posible la poblacin o uni!erso que se %a de estudiar. ;> 0eterminar el marco de re$erencia de la muestra reuniendo en una lista todas las unidades del uni!erso. ?> 0e$inir con exactitud y claridad los datos que se pretenden obtener en el estudio. Si no se especi$ica esto, puede que los cuestionarios arro&en resultados distintos de los que en realidad se espera. ) antes de a!an"ar con!iene a!eriguar si los datos que se buscan no $ueron ya obtenidos por otro y cerciorarse de que los datos que se enumeran sean absolutamente necesarios para dar cumplimiento a los $ines del estudio. @> Especi$icar el grado de precisin que desean obtener los usuarios de los datos de la muestra F> 5n!estigar la e$iciencia relati!a de distintos tipos de muestra seg'n el grado de precisin especi$icado. Acosto, e$iciencia, $actor tiempo y administrati!o> M> En caso que en el estudio se emplee cuestionario o $ormulario con!iene pensarlos de antemano para que se obtengan respuestas correctas para las preguntas que se $ormulan. ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. I O> (plicar un ensayo preliminar con los $ormularios, cuestionarios e instrucciones, procedimiento barato e indispensable. Los $ormularios e instrucciones $inales me&oran como consecuencia del ensayo. G> Explicar con la mayor sencille" posible los lmites de los resultados de la muestra al presentarlos 4De 7,! factores %e"en%e #a a'nit,% %e ,na ,estra5 La magnitud de la muestra depende del grado de precisin que se requiera, de la !ariabilidad entre los datos que se muestrean A%eterogeneidad>, del m#todo de muestreo que se utilice y del procedimiento de estimacin que se use. Se examina cada m#todo de muestreo administrati!amente $actibles, y se selecciona el que proporcionase el grado deseado de precisin a menor costo. Esto podra entra7ar la seleccin de un m#todo que requiere una muestra ms grande que otra, pero con un costo mas ba&o. 4Para 7,! se ,ti#i8a e# ,estreo no "ro)a)i#$stico5 Las muestras no probabilsticas no tienen carcter cient$ico, pero pueden ser de ayuda en estudios de naturale"a preliminar, $recuentes en sociologa y psicologa o cuando no se cuenta con el listado del uni!erso. Los muestreos no probabilsticos mas usados son muestreo por cuotas y muestra autogenerada.. 4C,&# es #a %iferencia entre ="recisin> + =e:actit,%> en e# c&#c,#o5 En la pro$esin estadstica se acostumbra aludir a la precisin y no a la exactitud de los clculos basados en muestras. La exactitud de un calculo es el grado en que este se aproxima a la ci$ra real, mientras que la precisin, re$le&a el grado en que se aproxima la ci$ra que se obtendra con un anlisis del 1HH por ciento, si se empleasen m#todos id#nticos de recoleccin de datos. 4C,&#es son #os e#eentos 7,e es"ecifican e# 'ra%o %e "recisin 7,e se %esea %e ,na estiacin5 La especi$icacin del grado de precisin consta de dos elementos* un lmite de error que se llama grado de tolerancia y un lmite de riesgo que se llama grado de con$ian"a que es el porcenta&e de seguridad que existe para generali"ar los resultados obtenidos, un porcenta&e del 1HHP equi!ale a decir que no existe ninguna duda para generali"ar tales resultados, esto implica estudiar toda la poblacin. 4Co se ",e%e coeter ,n )ias en #a ,ti#i8acin %e# arco %e referencia %entro %e# ,estreo5 Se comete un bias cuando el marco de re$erencia de las unidades de muestreo no comprendi a todas las unidades de la poblacin Esto sucede en el estudio real, cuando las di$erencias entre los datos del marco de re$erencia y los datos del uni!erso no son desde7ables, all %ay un bias Aerror sistemtico> en los resultados de la muestra. 4C,&#es son #as #iitaciones %e# ,estreo/ se'<n S#oni5 E:"#i7,e; Las limitaciones del muestreo es que no siempre es 'til, por e&emplo si se requiere conocimiento acerca de cada unidad del uni!erso estadstico o cuando la poblacin presenta un altsimo grado de !ariabilidad Amuy %eterog#nea> 4C,&#es son #as *enta9as + %es*enta9as %e# ,estreo "or con'#oera%os5 El ob&eto del m#todo por conglomerados consiste en di!idir la poblacin en sectores llamados conglomerados, cuya caracterstica $undamental es que las entidades sean lo mas %eterog#neas ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. 1H entre si dentro de cada conglomerado y que lo mas %omog#neos posibles entre conglomerados. La !enta&a es que las entre!istas se reali"an en distancias cortas, es mas econmica en tiempo, dinero y recursos %umanos. La des!enta&a es que en general, el error de muestra por conglomerado es mayor que en el m#todo al a"ar simple, es mayor cuanto mas grande es el tama7o del conglomerado. Se pueden obser!ar dos errores principales* tama7o del conglomerado y la %eterogeneidad dentro de el. 4Co %e)e ser #a ?oo'enei%a% + ?etero'enei%a% en ,estreos estratifica%os + "or con'#oera%os5 En los muestreos por conglomerado los resultados mas precisos se obtienen cuando dentro de cada grupo %ay una me"cla lo mas !ariada posible y cuando cada grupo es lo mas similar posible a los dems. Para una muestra estrati$icada e$ica" los estratos deben ser lo mas %omog#neos posibles, y lo mas distinto A%eterog#neo> que se pueda entre s E#a)ore ,n e9e"#o "ara ca%a ,no %e #os c,atro ti"os %e ,estreo "ro)a)i#$sticos: (. /uestreo al ("ar Simple* Si en un curso de FH alumnos, necesitamos elegir ; personas para que sean las representantes $rente a las autoridadesB podramos poner en una bolsa FH papelitos de igual tama7o, y doblarlos de la misma manera escribiendo en ellos los nombres de cada alumno. Una persona que no este dentro de las FH, elegir dos papeles al a"ar. Estas personas tendrn la misma posibilidad de ser elegidas. Una !e" elegida la persona CE 1 se la debe !ol!er a introducir en la ca&a o bolsita, es decir se debe reali"ar el <reempla"o= para que %aya independencia entre un papelito Aelemento> y otro. .> /uestreo Sistemtico* Si se desea muestrear QCuntas personas de primer a7o de psicologa Aconsiderando que existen ? comisiones de 1HH alumnos cada una>, tienen el libro de neuropsicologaR Podramos tomar una muestra de MH personasB en este caso deberamos $i&ar el inter!alo, que se saca, di!idiendo la cantidad total de elementos que componen el listado por la cantidad de elementos que componen la muestraB entonces aqu deberamos %acer ?HH Acantidad total> di!idido MH Amuestra>, que dara un total de F, as se debe tomar un elemento cada F personas. En este caso al primer indi!iduo se lo elige por el m#todo del muestreo al a"ar simpleB es decir se saca un numero del 1 al FAlimite superior del primer inter!alo> supongamos que sea ?, el prximo numero elegido ser G y as sucesi!amente. C> /uestreo Estrati$icado al ("ar* Si queremos saber el porcenta&e de materias aprobadas en alumnos de la carrera de Psicologa, este procenta&e est en estrec%a relacin, en la mayora de los casos con el a7o que se encuentra cursando cada alumno. Por eso debera %acerse un muestreo estrati$icado, tomando, alumnos de 1E a7o de la carrera, alumnos de ;E a7o de la carrera, y as sucesi!amente. Luego puede obtenerse una submuestra por a"ar simple 0> /uestreo por Conglomerados al ("ar* Este lo podramos utili"ar supongamos si nosotros queremos saber QCuntas personas de entre ? y G a7os y cuantas de entre @H y MF a7o !i!en en cada casa del el barrio el 2ribunoR (qu deberamos di!idir la poblacin Atodo el barrio el 2ribuno> en conglomerados por e&emplo cada man"ana del barrio. (s se elegir una muestra de conglomerados y se obser!an todas las entidades dentro de cada uno de ellos. Para que esto suceda las entidades dentro de los conglomerados deben ser lo mas %eterog#neas posible y los conglomerados lo mas %omog#neos posible.
ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. 11 ESTADSTICA IN@ERENCIAL CAPTULO I A INTRODUCCIN Un tema central de la estadstica es la 5n$erencia Estadstica. Esta se interesa en* la estimacin de los parmetros de la poblacin y las pruebas de %iptesis. Le interesa sacar conclusiones de un gran n'mero de %ec%os basndose en las obser!aciones de una parte. Los procedimientos de la in$erencia estadstica introducen orden en una in$erencia a partir del testimonio muestral. ,ay condiciones en que los testimonios deben reunirse y las pruebas estadsticas determinan cun grandes deben ser las di$erencias obser!adas antes de con$iar que representarn di$erencias reales en el grupo mayor. Los procedimientos de la in$erencia estadstica permiten determinar, en t#rminos de probabilidad, si la di$erencia entre dos muestras est dentro del rango en el que podra aparecer $cilmente por a"ar, o si es tan grande que indica que las muestras son, probablemente, de dos poblaciones di$erentes. Dtro problema es determinar la probabilidad de que una muestra de punta&es sea de una poblacin espec$ica y otro el de decidir si podemos in$erir legtimamente que !arios grupos di$ieren entre s. )a que los !alores de poblacin son parmetros, estas t#cnicas estadsticas se llaman param#tricas. Estas t#cnicas conducen a conclusiones con limitaciones, <Si las suposiciones respecto a la $orma de la poblacin son !lidas, entonces podemos concluir que...=. 2ambi#n se desarrollaron t#cnicas de in$erencia que no %acen suposiciones numerosas ni se!eras acerca de los parmetros. Estas nue!as distribuciones libres o t#cnicas no param#tricas permiten sacar conclusiones con menos reser!as. ( (lgunas pruebas no param#tricas se las llama <pruebas de rango= o <pruebas de orden= Las t#cnicas param#tricas solo se usan con punta&es realmente num#ricos, las no param#tricas se $i&an en el orden o rango de punta&es, no en sus !alores num#ricos, otras se pueden utili"ar con datos que ni siquiera presentan orden. /ientras una prueba param#trica pondr su atencin en la di$erencia entre las medias de dos con&untos de punta&es, la no param#trica se $i&ar en la di$erencia entre las medianas. Calcular la media requiere operaciones aritm#ticas, calcular la mediana solo exige contar CAPTULO II B USO DE LAS PRUE1AS ESTADSTICAS EN LA IN(ESTIGACIN Para decidir con ob&eti!idad si una %iptesis es con$irmada por un con&unto de datos, se precisa un procedimiento que lle!e a un criterio ob&eti!o para rec%a"ar o aceptar esa %iptesis. El procedimiento ob&eti!o debe basarse en la in$ormacin obtenida al in!estigar y en el margen de riesgo que estemos dispuestos a aceptar si el criterio de decisin respecto a la %iptesis resulta incorrecto. Pasos* 1> 8ormulacin de la %iptesis de nulidad A,o> ;> Eleccin de una prueba estadstica para probar ,o. 0e las pruebas que pueden usarse en un dise7o dado %ay que escoger aquella cuyo modelo se aproxima mas a las condiciones de la in!estigacin y cuyos requisitos de medicin satis$acen las medidas usadas en la in!estigacin ?> Especi$icacin del ni!el de signi$icacin y del tama7o de la muestra C @> Encuentro Ao suposicin> de la distribucin muestral de la prueba estadstica con$orme a ,o F> 0e$inicin de la regin de rec%a"o M> Clculo del !alor de la prueba estadstica con los datos de la muestra. Si el !alor desciende a la "ona de rec%a"o, se rec%a"a ,o, si el !alor cae $uera de la regin de rec%a"o ,o no puede rec%a"arse -. Hi"tesis %e n,#i%a%* La ,iptesis nula es una %iptesis de di$erencias nulas. Es $ormulada con la intencin de ser rec%a"ada. Si se rec%a"a puede as aceptarse la %iptesis alterna ,o. La %iptesis alterna es la ase!eracin operacional de la %iptesis de in!estigacin. La %iptesis de in!estigacin es la prediccin que deri!a de la teora a probar. La naturale"a de la %iptesis de in!estigacin determina como debe ser $ormulada ,o. Si la %iptesis de in!estigacin solo dice que los dos grupos di$ieren respecto a las medias, entonces ,o ser 1 ;. Pero si la teora predice la direccin de la di$erencia, que un grupo espec$ico tiene una media mayor que el otro, entonces ,o puede ser 1S; o que 1T; ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. 1; 0. E#eccin %e #a "r,e)a esta%$stica* La estadstica cuenta con pruebas estadsticas susceptibles de usarse alternati!amente para tomar decisiones acerca de las %iptesis. C. Ni*e# %e Si'nificacin + TaaDo %e #a 2,estra* (ntes de recoger los datos, se especi$ica el con&unto de todas las posibles muestras que se encuentran si ,o es !erdadera. 0e este con&unto se extrae un subcon&unto de caractersticas tan extremas que reducen muc%o la probabilidad, si ,o es !erdadera, de que la muestra que se obser!a est# entre ellas. Por tanto, si en la in!estigacin se obser!a una muestra incluida en ese subcon&unto, se rec%a"a ,o. El procedimiento es rec%a"ar ,o para aceptar ,1 si una prueba estadstica produce un !alor cuya probabilidad de ocurrencia ba&o ,o es igual o menor que una peque7a probabilidad . Esta peque7a probabilidad se llama Ci!el de signi$icacin. (s, si la probabilidad asociada con lo que ocurre en ,o del !alor particular producido por una prueba estadstica es igual o menor que , rec%a"amos ,o y aceptamos ,o. Como el !alor de &uega un papel crucial al determinar el rec%a"o de ,o o su aceptacin, la ob&eti!idad exige que el !alor de se indique antes de recoger los datos. El ni!el que se elige para debe determinarse por la estimacin que se %aga de la incidencia de los descubrimientos. 0os tipos de errores pueden cometerse acerca de ,o. 1> Error tipo 5* rec%a"ar ,o siendo !erdadera. ;> Error tipo 55* aceptar ,o siendo $alsa. La probabilidad de cometer el error tipo 5 est dada por . Cuanto mayor sea , mas probable es que ,o sea rec%a"ada equi!ocadamente, mas probable que se cometa error tipo 5. El error tipo 55 se representa con . y indican tipo de error y probabilidad de cometerlo. En condiciones ideales y determinan que tama7o de muestra C escoger para calcular la prueba estadstica que se %aya elegido. Pero en la prctica es com'n que y C se especi$iquen por adelantado. Una !e" que y C se especi$icaron queda determinada . Como %ay una relacin in!ersa entre las probabilidades de cometer ambos tipos de errores, al decrecer se incrementa para cualquier C. Si se desea reducir la posibilidad de ambos errores, se debe incrementar C. Potencia de una prueba* Probabilidad de rec%a"ar ,o cuando es realmente $alsa. PK1Upr. error tipo55 PK1J . Las probabilidades de cometer un error tipo 55 A> disminuye a medida que el tama7o de la muestra C se incrementa, de modo que la potencia aumenta al crecer el tama7o de C Conc#,siones: a> El ni!el de signi$icacin comprende la probabilidad de obtener en una prueba estadstica un !alor que implica el rec%a"o de ,o, siendo !erdadera. indica la probabilidad de cometer error tipo 5 b> La probabilidad de que una prueba estadstica produ"ca un !alor con$orme al cual ,o ser aceptada cuando en realidad es $alsa, es . se7ala la probabilidad de cometer error tipo 55 c> La potencia de una prueba, 1 J , mide la probabilidad de rec%a"ar acertadamente ,o d> La potencia est relacionada con la naturale"a de la prueba estadstica elegida e> La potencia de una prueba estadstica se incrementa al aumentar C E. Distri),cin 2,estra#: La distribucin muestral es una distribucin terica. la obtendramos al tomar al a"ar todas las muestras posibles de un mismo tama7o, extradas de una misma poblacin, es la distribucin, con$orme a ,o, de todos los !alores posibles que una estadstica Acomo la media> puede tomar cuando es calculada con muestras de igual tama7o tomadas al a"ar. F. Re'in %e Rec?a8o: Es una regin de la distribucin muestral, incluye todos los !alores posibles que una prueba estadstica puede tomar seg'n ,o. Es un subcon&unto de estos !alores de manera que la probabilidad de ocurrencia de una prueba estadstica seg'n ,o, cuyo !alor est# en ese subcon&unto sea . Es un con&unto de !alores posibles tan extremos que cuando ,o es !erdadera, es muy peque7a la probabilidad de que la muestra obser!ada produ"ca un !alor que est# entre ellos. La probabilidad asociada con cualquier !alor de la regin de rec%a"o es igual o menor que . ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. 1? La locali"acin de la regin de rec%a"o es e$ectada por la naturale"a de ,o. Si ,o indica la direccin predic%a de la di$erencia se requiere una prueba de una cola. Si ,o no indica la direccin de la di$erencia se requiere una prueba de dos colas. Las pruebas de una y dos colas se distinguen en la locali"acin, no en el tama7o, de la "ona de rec%a"o. En una de dos colas, la regin de rec%a"o est en ambos extremos de la distribucin muestral. En una de una cola est en un extremo. El tama7o de la "ona de rec%a"o se expresa por que es el ni!el de signi$icacin. Si K H.HF entonces el tama7o de la regin de rec%a"o es el F P del rea total comprendida ba&o la cur!a de la distribucin normal. G. La %ecisin* Si la prueba estadstica da un !alor que est en la regin de rec%a"o se rec%a"a ,o. El ra"onamiento en que se apoya este proceso es simple. Si es muy peque7a la probabilidad asociada con la ocurrencia con$orme a ,o de un !alor particular en la distribucin muestral, podemos explicar la ocurrencia e$ecti!a de ese !alor de dos maneras* suponiendo que la ,o es $alsa o que un e!ento raro e improbable sucedi. Se elige el primer ra"onamiento, aunque a !eces el segundo puede ser correcto. La probabilidad de que la segunda opcin sea correcta est dada por pues el rec%a"o de ,o cuando es !erdadera es error tipo 5. Cuando la probabilidad asociada con un !alor obser!ado de una prueba estadstica es menor o igual que el !alor pre!iamente determinado de , concluimos que ,o es $alsa. El !alor obser!ado es llamado <signi$icati!o=. La %iptesis en prueba, ,o, se rec%a"a siempre que ocurra un resultado <signi$icati!o=. por tanto, se llama !alor <signi$icati!o= a aquel cuya probabilidad asociada de ocurrencia de acuerdo a ,o es menor o igual que CAPTULO III B ELECCIN DE LA PRUE1A ESTADSTICA ADECUADA Cuando se disponen de !arias pruebas estadsticas para un dise7o de in!estigacin dado, se debe emplear un criterio de eleccin, ya se !io el de potencia, a%ora se !ern otros. Una prueba estadstica es buena si es peque7a la probabilidad de rec%a"ar ,o siendo !erdadera y grande la probabilidad de rec%a"ar ,o siendo $alsa. Pero otras consideraciones adems de la potencia determinan la eleccin de la prueba estadstica. En la eleccin debemos considerar la manera en que la muestra de punta&es $ue obtenida, la naturale"a de la poblacin de la que se sac la muestra y la clase de medicin o escala que se emple en las de$iniciones operacionales de las !ariables usadas, es decir, los punta&es. E# 2o%e#o Esta%$stico (l %aber a$irmado la naturale"a de la poblacin y el m#todo de muestreo, %emos establecido un modelo estadstico. Cualquier prueba estadstica implica un modelo y un requisito de medida. Las condiciones del modelo estadstico de un a prueba se llaman <suposiciones de la prueba=. ( menores o mas d#biles suposiciones %abr conclusiones generales. Pero las pruebas mas poderosas son las apoyadas por suposiciones mas $uertes y amplias. Potencia B Eficiencia ( menores o mas d#biles suposiciones de un modelo particular, mas generales son las conclusiones deri!adas al aplicar la prueba estadstica asociada con #l, pero menos poderosa es la prueba de ,o. Esta a$irmacin es generalmente !erdadera para cualquier tama7o de muestra, pero no se sostiene al comparar dos pruebas estadsticas que se aplican a dos muestras de tama7o desigual. El concepto de Potencia U E$iciencia se re$iere al incremento en el tama7o de la muestra necesario para %acer la prueba . tan poderosa como la (. (l ser la prueba (, la mas poderosa de su tipo Acuando se usa con datos que satis$acen sus condiciones> al ser la prueba ., que se presta al mismo dise7o de in!estigacin, tan poderosa con Cb casos como la pruena ( con Ca casos, tenemos que* PotenciaJ E$iciencia de la prueba . K A1HH> CaLCb P
ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. 1@ 2e%icin La medicin es la asignacin de n'meros a obser!aciones, de modo que los n'meros sean susceptibles de anlisis por medio de manipulaciones u operaciones de acuerdo con ciertas reglas. La relacin entre los ob&etos que se estn obser!ando y los n'meros es tan directa que mediante la manipulacin se los n'meros se obtiene nue!a in$ormacin acerca de los ob&etos. El cient$ico social que toma la $sica como modelo, para %acer operaciones con los n'meros asignados a las obser!aciones, no debe pasar por alto la estructura del m#todo de correspondencia de los n'meros a las obser!aciones sea isomr$ica con respecto a alguna estructura num#rica que incluya estas operaciones. La teora de la medicin est $ormada por un con&unto de teoras, cada una re$erida a un ni!el di$erente de medicin. Las operaciones permitidas con un con&unto de punta&es dado dependen del ni!el de medida que se logre. Cuatro ni!eles de medida son* nominal, ordinal, de inter!alo y de proporcin. Cada ni!el tiene estadsticos y pruebas permitidas. Escala Cominal* La medicin se da en un ni!el elemental cuando los n'meros o smbolos se usan para la clasi$icacin de ob&etos, personas o caractersticas. Cuando se usan con el $in de distinguir entre s los grupos a que pertenecen !arios ob&etos, los n'meros o smbolos constituyen una escala nominal. E&* las tipologas esqui"o$r#nico, paranoico, manacoJdepresi!o, psiconeurtico. Propiedades $ormales* En estas escalas la operacin de escalamiento consiste en partir de una clase dada y $ormar un con&unto de subclases que se excluyen mutuamente. La 'nica relacin implicada es de equi!alencia, los miembros de cualquier subclase deben ser equi!alentes en la propiedad medida. La relacin de equi!alencia es re$lexi!a, sim#trica y transiti!a. Dperaciones admisibles* Como en toda escala nominal la clasi$icacin se representa por cualquier con&unto de smbolos, es <'nica %asta una trans$ormacin de uno a uno=. Los signos que designan a los di$erentes grupos pueden intercambiarse sin alterar la in$ormacin de la escala, por eso las 'nicas estadsticas descripti!as posibles son las que no se alteran en este proceso* modo, $recuencia, conteo. En ciertas condiciones podemos probar las %iptesis usando la prueba no param#trica 3V, o la basada en la $rmula binomial, apropiadas para datos nominales. La medida de asociacin mas com'n es el coe$iciente de contingencia C, una estadstica no param#trica. Escala ordinal* Puede que los ob&etos de una categora de la escala no sean precisamente di$erentes a los de otra categora, sino que estn relacionados entre s. 1elaciones tpicas entre clases son las que comparan altura, di$icultad, madure". 2ales relaciones pueden $ormularse con el signo S, que puede usarse como mayor que, mas pre$erible, mas di$icil. En un grupo de clases equi!alentes Aescala nominal>, si la relacin S se sostiene entre algunos pares de clases, tenemos una escala parcialmente ordenada. Si la relacin S se sostiene en todos los pares de clases que modo que sur&a un rango ordenado completo, tenemos una escala ordinal. /uc%os in!entarios de personalidad o %abilidades arro&an punta&es que tienen $uer"a de rangos Propiedades 8ormales* La di$erencia entre escala nominal y ordinal es que esta incorpora no solo la relacin de Equi!alencia sino tambi#n la relacin <mayor que=. Es irre$lexi!a, asim#trica, transiti!a. Dperaciones admisibles* Como cualquier cambio que conser!e el orden no altera in$ormacin de una escala ordinal, esta es <'nica %asta una trans$ormacin monotnica=, o sea, no importa que n'meros demos a una pare&a de clases siempre que el mayor sea dado a los miembros de la clase <mayor=. La estadstica mas apropiada para describir la tendencia central de los punta&es en una escala ordinal es la mediana porque no es a$ectada por los cambios de punta&e por encima o por deba&o de ella, siempre y cuando el n'mero de ambos punta&es sea el mismo. Con esta escala, las %iptesis pueden probarse por numerosas pruebas estadsticas no param#tricas llamadas <estadsticas de orden= o de rango. Los coe$icientes de correlacin basados en rangos, de Spearman o Wendall son adecuados. ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. 1F El 'nico supuesto necesario para algunas pruebas de rango es que los punta&es tengan como base una distribucin continua. Las pruebas param#tricas tambi#n $uncionan con este supuesto. Una !ariable continua puede tomar cualquier !alor del inter!alo. Una discreta toma un n'mero $inito de !alores. Para algunas t#cnicas no param#tricas que requieren medicin ordinal, debe %aber un continuo como base de los punta&es obser!ados. Los punta&es reales pueden caer en categoras discretas. La rude"a de los instrumentos de medida suele representar pobremente la continuidad base que puede existir. Si una !ariable est !erdaderamente distribuida en $orma continua la probabilidad de que tener punta&es iguales es cero. Si ocurren, estos re$le&an la $alta de sensibilidad de los instrumentos de medida Las pruebas estadsticas param#tricas, que usan media y des!iaciones estandar no deben usarse con datos de escala ordinal. Las propiedades de esta escala no son isomr$icas al sistema aritm#tico. Cuando solo se conoce orden de punta&es, las medias y des!iaciones estandar dan lugar a errores, en la medida en que los inter!alos sucesi!os de la escala no son iguales. Cuando se emplean t#cnicas param#tricas de in$erencia estadstica con esos datos, las decisiones de las %iptesis son dudosas. Las declaraciones de probabilidad deri!adas de la aplicacin de pruebas param#tricas a datos ordinales son errneas si la estructura del m#todo de recoger datos no es isomr$ico respecto a la aritm#tica. Escala de inter!alo* Cuando una escala tiene caractersticas de una escala ordinal y adems conocemos la distancia entre dos n'meros cualesquiera tenemos una consideracin mas $uerte que la ordinal. La medicin se e&ecut en el sentido de una escala de inter!alo. Si la asignacin de n'meros a !arias clases de ob&etos es tan precisa que sabemos la magnitud de los inter!alos Adistancias> entre todos los ob&etos de la escala, tenemos una medida de inter!alo. Una escala de inter!alo se caracteri"a por una unidad de medida com'n y constante que asigna un n'mero real a todos los pares de ob&etos en un con&unto ordenado. En esta clase de medida, la proporcin de dos inter!alos es independiente de la unidad de medida y del punto cero. En una escala de inter!alo, el punto cero y la unidad de medida son arbitrarios. Una suposicin necesaria de los cient$icos de la conducta es que la !ariable que se est su&etando a escala se distribuye normalmente. (s quien elabora la escala manipula sus unidades %asta que obtiene la supuesta distribucin normal a partir de punta&es indi!iduales. Dtra suposicin es que la respuesta <si= de una persona a un inciso es equi!alente a su respuesta a$irmati!a en cualquier otro inciso. Propiedades $ormales* Las operaciones y relaciones en que se origina la estructura de una escala inter!alar son tales que las di$erencias en la escala son isomr$icas a la estructura de la aritm#tica. Los n'meros pueden asociarse con las posiciones de los ob&etos en una escala inter!alar de tal modo que las operaciones aritm#ticas puedan reali"arse signi$icati!amente con las di$erencias entre esos n'meros. (l construir una escala inter!alar no solo se especi$ican equi!alencias como en la escala nominal, y relaciones de mayor a menor como en la ordinal, sino tambi#n la proporcin de dos inter!alos cualesquiera. Dperaciones admisibles* Cualquier cambio de los n'meros aosciados con los ob&etos medidos en escala inter!alar debe preser!ar no solo el orden sino tambi#n las di$erencias relati!as entre ellos, o sea, la escala inter!alar es <'nica %asta una trans$ormacin lineal=. La escala inter!alar es laprimera !erdaderamente cuantitati!a. 2odas las estadsticas param#tricas comunes Amedia, des!iaciones estandar, correlaciones de Pearson> se aplican a datos en escala inter!alar, como las pruebas estadsticas param#tricas comunes At, 8>. Si la medicin en el sentido de la escala inter!alar se e&ecut en realidad y si todos los supuestos en elmodelo estadstico se cumplen, el in!estigador debe utili"ar pruebas estadsticas param#tricas. Los m#todos no param#tricos no suelen sacar pro!ec%o de toda la in$ormacin contendida en los datos de la in!estigacin ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. 1M Escala de Proporcin* Cuando una escala tiene las caractersticas de una escala inter!alar y adems tiene un punto cero real en su origen se llama escala de proporcin. En ella la proporcin de un punto a otro de la escala es independiente de la unidad de medida Propiedades 8ormales* Las operaciones y relaciones en una escala de proporcin son correspondientes a una escala isomr$ica a la estructura aritm#tica. Por eso las operaciones aritm#ticas son permisibles en !alores num#ricos asignados a los ob&etos mismos, como tambi#n en los inter!alos entre los n'meros. Las escalas de proporcin mas $recuenten en las ciencias $sicas se logran cuando cuatro relaciones son operacionalmente posibles* equi!alencia, mayor a menor, proporcin conocida de dos inter!alos, proporcin conocida de dos !alores. Dperaciones admisibles* Los n'meros asociados con !alores de una escala de proporcin son !erdaderos n'meros con un !erdadero cero, solo la unidad de medida es arbitraria. (s, la escala de proporcin es <'nica %asta la multiplicacin por una constante positi!a=, o sea, las proporciones entre dos n'meros cualesquiera son preser!adas cuando los !alores de la escala son multiplicados por una constante positi!a y la trans$ormacin no altera la in$ormacin de la escala. Cualquier prueba estadstica puede usarse cuando se logr medida de proporcin. (dems de las pruebas anteriores apropiadas para escala inter!alar pueden usarse estadsticas como la media geom#trica y el coe$iciente de !ariacin, que requieren del !erdadero punto cero.
Criterios "ara e#e'ir ,na "r,e)a: 1> potencia de la prueba ;> aplicabilidad del modelo estadstico en que se basan los datos ?>potencia U e$iciencia @> ni!el de medida logrado en la in!estigacin. 4enta&as de pruebas Estadsticas no param#tricas* 1> Las declaraciones de probabilidad obtenidas son probabilidades exactas Aen muestras grandes son excelentes aproximaciones> independientemente de la $orma de la distribucin de la poblacin ;> Si los tama7os de las muestras con peque7os como CKM no %ay alternati!a de eleccin de prueba no param#trica a menos que se cono"ca exactamente la naturale"a de la distribucin ?> ,ay pruebas estadsticas no param#tricas adecuadas para obser!aciones en poblaciones di$erentes. @> Son 'tiles tanto para datos in%erentes a los rangos como datos cuyos punta&es aparentemente num#rico tienen $uer"a de rangos, o sea si el in!estigador solo puede decir de sus su&etos que uno comparte en mayor o menor grado cierta caracterstica de otro, sin especi$icar cantidad. F> Son 'tiles para datos solo clasi$icatorios, en escala nominal. Co %ay t#cnica param#trica para ellos. M> Son muc%o mas $ciles de aplicar que las pruebas param#tricas 0es!enta&as de pruebas Estadsticas Co Param#tricas 1> Si los supuestos del modelo estadstico param#trico son satis$ec%os y con la $uer"a requerida, las pruebas no param#tricas disipan los datos. El grado de desperdicio se expresa por la potenciaJ e$iciencia ;> Co existen a'n m#todos Co param#tricos para probar interacciones dentro del modelo del anlisis de !arian"a a menos que se %agan suposiciones especiales acerca de la aditi!idad.
ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. 1O Esta%$stica Para!trica Esta%$stica No Para!trica Pruebas estadsticas param#tricas son aquellas cuyo modelo especi$ica condiciones de los parmetros de la poblacin de la que se obtu!o la muestra. La signi$icacin de los resultados de estas pruebas dependen de estas suposiciones. Estas pruebas requieren que los punta&es sur&an de una medicin con $uer"a de escala inter!alar. Pruebas estadsticas no param#tricas son aquellas cuyo modelo no especi$ica condiciones a parmetros de la poblacin. (lgunas suposiciones seran* obser!aciones independientes y !ariable de continuidad bsica, pero son pocas suposiciones y mas d#biles que las asociadas con pruebas param#tricas. Estas pruebas no requieren mediciones tan $uertes, la mayora se aplican a datos de escala ordinal y algunas a los de escala nominal Las pruebas de la estadstica param#trica estn en todos los libros Las pruebas de la estadstica no param#trica estn dispersas en mas libros 2raba&an bien con escalas inter!alares
2raba&an bien con escalas nominales y ordinales. Se usa en estas escalas sin perder in$ormacin 2raba&an con !ariables !erdaderamente cuanti$icables Co necesariamente deben traba&ar con !ariables !erdaderamente cuanti$icables Son !lidas para 0istribuciones Cormales Co necesitan garanti"ar que la 0istribucin sea Cormal Es mas e$ica" cuando se cumplen las suposiciones y se miden las !ariables al menos en escala inter!alar ('n cuando se satis$agan suposiciones de la prueba param#trica, requerimientos de $uer"a y medicin, la potenciaUe$iciencia indica que al aumentar el tama7o de la muestra podemos usar una prueba no param#trica sin perder potencia para rec%a"ar ,o. Si las suposiciones de la poblacin son correctas o aproximadas tendrn una muy buena prueba. Para ser con$iables los datos cumplen muc%as caractersticas. Si los datos no son certeros la in$erencia es errada Si las suposiciones de la poblacin son $alsas, una prueba no param#trica puede dar un resultado mas preciso, o sea si lo que suponen es errado, igual son con$iables pues no necesitan todas las condiciones Se establecen di!ersas suposiciones respecto de la naturale"a de la poblacin Se %acen pocas suposiciones acerca de la naturale"a de la distribucin por eso son ampliamente aplicables 0i$ciles de entender 8ciles de entender. Exigen conocimientos matemticos bsicos Pueden utili"arse $cilmente en experimentos comple&os con gran n'mero de !ariables Co se pueden aplicar en experimentos comple&os en los que se mane&e gran n'mero de !ariables Es signi$icati!a con Co o con la poblacin 2raba&a 'nicamente con C Per$ecta U E$iciencia, siempre en t#rminos de precisin. 2ienen el 1HH P de e$icacia certe"a Co son per$ectas, sino probables, no tienen 1HH P de e$icacia sino de probabilidad.
ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. 1G CAPITULO I( B EL CASO DE UNA 2UESTRA ,ay pruebas estadsticas no param#tricas que pueden usarse para probar %iptesis con una muestra. Estas indican si la muestra pro!iene de una poblacin especi$ica. La prueba de una muestra es del tipo de la bondad del a&uste. En una muestra tomada al a"ar probamos la %iptesis de que su extraccin !iene de una poblacin con una cierta distribucin. La t#cnica param#trica consiste en aplicar una prueba t a la di$erencia entre media obser!ada Amuestra> y esperada Apoblacin>. La prueba t supone que las obser!aciones muestrales son de una poblacin distribuida normalmente y en escala inter!alar. Pr,e)a 1inoia# ,ay poblaciones que se conciben $ormadas solo por dos clases, as las obser!aciones caern en una u otra clasi$icacin. En cualquier poblacin de dos casos, al saber que la proporcin de casos en una clase es P, la proporcin en la otra clase ser 9 K 1JP. La t#cnica es del tipo de la bondad del a&uste @,ncin: La distribucin binomial es la distribucin muestral de las proporciones obser!adas en muestras tomadas al a"ar de una poblacin de dos clases. 0a los di$erentes !alores que pueden presentarse ba&o ,o. Esta prueba es de tipo de la bondad del a&usteB dice que tan ra"onable es que las $recuencias obser!adas en la muestra se %ayan sacado de una poblacin con un !alor especi$ico de P 2!to%o: La probabilidad de obtener x ob&etos en una categora y CJx en la otra es* P es la proporcin de casos esperados en una categora y 9 A1JP> proporcin de casos esperados en la otra Pero en una in!estigacin no nos ocuparnos de la probabilidad de obtener exactamente los !alores que $ueron obser!ados, en realidad preguntamos Qqu# probabilidad %ay de obtener los !alores obser!ados o a'n mas extremosR. En este caso la distribucin muestral binomial es* /uestra peque7as* en el caso de una muestra, cuando se usa para una clase con dos categoras, una situacin com'n ocurre si P K X. La tabla 0 que contiene las probabilidades de una cola asociadas con la ocurrencia de !alores tan extremos como x con$orme a ,o de que PK9KX.. La tabla 0 es 'til si C es TK ;F. La tabla 0 contiene las probabilidades asociadas con la ocurrencia de !alores tan peque7os como x para di$erentes C Ade F a ;F>. Las probabilidades Ap> de la tabla 0 son de una cola. Se usa una prueba de una cola cuando %emos predic%o cul de las categoras contendr el menor n'mero de casos. Si solo se predice la di$erencia, se usa una prueba de dos colas y se duplica la p 0. /uestras grandes* La tabla 0 no puede usarse con C S ;F, pero a medida que C aumenta, la distribucin binomial tiende a la distribucin normal. Esta tendencia es rpida con P cercano a X y lenta con P prximo a Ho1. ( mayor disparidad entre P y 9, mayor debe ser C para que la aproximacin pueda usarse para una prueba estadstica si CS;F. Cuando P se acerca a Ho1, el sentido com'n indica que CP9 debe ser, al menos K I para ser aplicable a la prueba estadstica basada en la aproximacin normal. 0entro de estas limitaciones la distribucin muestral de x es aproximadamente normal, con media K CP y des!iacin estandar K YCP9. 1esumen del procedimiento* 1J Se determina C, numero total de casos obser!ados. ;J Se determinan las $recuencias en cada categora. N N! x x! ( N x )! p(x)= N p x Q n-x
x 4.1 x p(x)= N p t Q n-t t=0 i 4.2 z = x NP / NPQ 4.3 z = (x 0.5) - NP / NPQ 4.4 ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. 1I ?J Se elige el m#todo para %allar la probabilidad de ocurrencia seg'n ,o de !alores obser!ados a> C K o T ;F y PK9KX tabla 0 b> P 9 $rmula @.;. 2abla 2 es 'til aqu* da coe$icientes binomiales A C x> para C T K ;H c> C S ;F y cercana a X, ,o se prueba usando la $rmula @.@. 2abla ( Si la p asociada con el !alor obser!ado de x , o de un !alor mas externo, es K o T Z se rec%a"a ,o. PotenciaJE$iciencia* Como no %ay t#cnica param#trica aplicable a datos en escala nominal, no se deduce potenciaJe$iciencia de la binomial con datos nominales. (l dicotomi"ar un continuo, si se aplica la binomial puede actuar disipadoramente y la binomial tiene potencia e$iciencia del IF P con C de M La "r,e)a HI %e ,na ,estra @,ncin* La 3V es adecuada cuando interesa el n'mero de su&etos, ob&etos o respuestas que se clasi$ican en di$erentes categoras. Las categoras pueden ser dos o masB la t#cnica es del tipo de la bondad del a&uste, que puede usarse para probar la existencia de una di$erencia signi$icati!a entre un n'mero obser!ado de ob&etos o respuestas de cada categora y un n'mero esperado, basado en la ,o 2!to%o* El $in es comparar un grupo de $recuencias obser!ado con uno esperadoB a partir de la ,o podemos deducir cuales son las $recuencias esperadas. La t#cnica 3V prueba si las $recuencias obser!adas estn su$icientemente prximas a las esperadas que podran ocurrir con$orme a ,o. La %iptesis de nulidad puede probarse mediante la $ormula* 0onde DiK n'mero obser!ado de casos clasi$icados en la categora i . EiK n'mero esperado de casos en la categora de i con$orme a ,o. [ se7ala la necesidad de sumar en todas las categora A->. La $ormula nos indica sumar en las - categoras los cuadros de las di$erencias de cada $recuencia obser!ada y cada $recuencia esperada, di!idida por la $recuencia esperada correspondiente. Si el acuerdo entre $recuencias obser!adas y esperadas es grande la di$erencia ADiJEi> ser peque7a, entonces 3V ser tambi#n peque7a. Si la di!ergencia es grande 3; con la $rmula @.F tambi#n ser grande. Entonces, podemos decir que para !alores mayores de 3V, aumentarn las probabilidades de que las $recuencias obser!adas no pro!engan de la poblacin en la que se bas la ,o. La distribucin muestral de 3V con$orme a ,o calculada con la $ormula sigue la distribucin de 3V con gl K -J1. En la parte superior de cada columna de la tabla C encontramos las probabilidades de ocurrencia asociadas Ade ; colas> con$orme a ,o. ,ay una !alor di$erente de 3V para cada gl. ,ay di$erentes distribuciones muestrales para 3V, una para cada !alor de gl. El tama7o de gl re$le&a el n'mero de obser!aciones susceptible de !ariar despu#s de ciertas restricciones en los datos. En general, en casos de una muestra, cuando ,o especi$ica completamente las Ei, gl K -J1, donde - representa el numero de categoras de la clasi$icacin. Para usar 3V en la prueba de una %iptesis en casos de una muestra, se pone cada obser!acin en cada una del numero - de celdillas. El n'mero total de tales obser!aciones ser el numero de casos en su muestra C. Esto es, una obser!acin debe ser independiente de cualquier otra. (s se e!itan obser!aciones en la misma persona. Para cada una de las - celdillas, la $recuencia esperada tambi#n debe ser registrada. Si ,o supone que la proporcin de casos en cada categora es la misma entonces EiK CL-. Conociendo los di$erentes !alores de Ei y Di, se puede computar el !alor de 3V mediante la $ormula @.F. La signi$icacin de este !alor obtenido de 3V puede determinarse recurriendo a la tabla C . Si la probabilidad asociada con la ocurrencia, con$orme a ,o de la 3V obtenida para gl K -J1 es K o T Z determinado pre!iamente, ,o puede ser rec%a"ada. Si no es as, ,o ser aceptada. k X = ( Oi Ei )
i = 1 Ei 4.5 ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ;H 1esumen del procedimiento* 1J Se clasi$ican las $recuencias obser!adas en un numero - de categoras. La suma de las $recuencias debe ser C, es decir, el numero de obser!aciones independientes. ;J ( partir de la ,o se determina las $recuencia esperada para cada una de las - celdillas. ?J Con la $ormula @.F se calcula el !alor de 3V. @J Se determina el !alor de gl K -J1. FJ Con la tabla C, se determina la probabilidad asociada con la ocurrencia con$orme a ,o de un !alor tan grande como !alor obser!ado de 3V para el !alor obser!ado de gl. Si p es igual o menor que Z, se rec%a"a la ,o. Potencia* Como esta prueba suele usarse cuando no se dispone de otra alternati!a, usualmente no se puede calcular su potencia exacta. Si se usa medicin nominal o los datos estn con$ormados por categoras in%erentemente discretas, la nocin de potenciaJe$iciencia de 3V no tiene importancia, entonces no %ay prueba param#trica adecuada. Si los datos permiten que pueda disponerse de una prueba param#trica, la 3V puede disipar la in$ormacin. Cuando gl S 1 las pruebas 3V son insensibles a los e$ectos de orden, as cuando una %iptesis tiene en cuenta el orden 3V puede no ser la me&or.
CAPITULO ( A EL CASO DE DOS 2UESTRAS RELACIONADAS Las pruebas estadsticas de dos muestras se usan cuando el in!estigador desea establecer la di$erencia entre dos tratamientos o si un tratamiento es <me&or= q otro. El <tratamiento= puede ser cualquiera de una multi$orme !ariedad de condiciones. En cada caso, el grupo que %a su$rido el tratamiento es comparado con el que no lo %a experimentado o que %a su$rido un tratamiento di$erente. En comparaciones de dos grupos algunas !eces se obser!an di$erencias signi$icati!as que no son resultado del tratamiento. Una manera de !encer la di$icultad impuesta por di$erencias extra7as entre los grupos es usar dos muestras relacionadas en la in!estigacin. Esto es, uno puede <igualar= o relacionar de otra manera las dos muestras estudiadas, cosa que puede lograrse cuando cada su&eto es su propio control o con pare&as de su&etos en las que se asignan los miembros de cada pare&a a las dos condiciones. Siempre que sea $actible, el m#todo de usar a cada su&eto como su propio control Acompensando en el orden en el que le son asignados los tratamientos> es pre$erible al m#todo de pares, debido a que nuestra capacidad para $ormar pare&as se !e limitada por la ignorancia de las !ariables pertinentes que determinan su conducta. El problema desaparece cuando cada su&eto es usado como su propio controlB no es posible un par mas preciso que el logrado por identidad. Las pruebas estadsticas no param#tricas para dos muestras relacionadas tienen la !enta&a adicional que no requieren una misma poblacin de la que pro!engan todas las pare&as. Se presentaran F pruebas, las cuales ayudan a seleccionar la t#cnica mas adecuada p una in!estigacin* LA PRUE1A 2c NE2AR P LA SIGNI@ICACIN D LOS CA21IOS @,ncin: esta prueba es mas apropiada para los dise7os de <antes y despu#s= en los que cada persona se usa como su propio control y en la medida tiene la $uer"a de una escala nominal y ordinal. @,n%aento + !to%o: para probar la signi$icacin de cualquier cambio obser!ado con este m#todo, se elabor una tabla de cuatro entradas de $recuencias que representa al primero y al segundo con&unto de respuestas de los mismos indi!iduos. Los rasgos generales de la tabla Ase ilustran en la ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ;1 tabla F.1Jpag. GM =(er 'r&fico %e #a ta)#a, de antes y despu#s>, en la que se usan \ y U porque simboli"ar respuestas di$erentes. Ctese q los casos q muestran cambios entre la primera y segunda respuesta aparecen en las celdillas ( y 0. Un indi!iduo es clasi$icado en la celdilla ( si cambio de \ a J. Es clasi$icado en la celdilla 0 si cambio de U a \. Si no es obser!ado ning'n cambio, !a a la celdilla . Artas. d \ antes y despu#s> o a la celdilla C Artas. 0 U antes y despu#s>. Puesto q ( \ 0 representan el numero total de personas que cambiaron, se espera que X A( \ 0> sea la $recuencia esperada con$orme a ,o en ambas celdillas ( y 0. Res,en %e# "roce%iiento: estos son los pasos p calcular la prueba d /c Cemar* 1. Se ordena las $recuencias obser!adas en una tabla de cuatro entradas de la $orma d la tabla F.1. ;. Se determinan las $recuencias esperadas en las celdillas ( y 0. Si las $recuencias esperadas son menores que F, se usa la prueba binomial en lugar de la de /c Cemar. ?. Si las $recuencias esperadas son F o mas, se calcula el !alor xV. @. Se determina la probabilidad con$orme a ,o asociada con un !alor tan grande como el !alor obser!ado d x] en a tabla C. si se requiere una prueba unilateral, se di!ide en dos la probabilidad q resulta en la tabla. Si la probabilidad de la tabla C por el !alor obser!ado de xV con d$ K 1 es igual o menor que , se rec%a"a ,o y se acepta de ,1. LA PRUE1A DE LOS SIGNOS @,ncin* la prueba de los signos debe su nombre al uso de los signos mas y menos de medicin en lugar de cantidades. Es particularmente 'til cuando la medicin cuantitati!a es imposible o no es practica, pudiendo aun %aber cierto orden entre los miembros de cada pare&a. La prueba de los signos es aplicable al caso de dos muestras relacionadas cuando el experimentador desea establecer que ambas condiciones son di$erentes. El 'nico supuesto adyacente d la prueba es la continuidad de la !ariable considerada. Las di$erentes pare&as pueden pro!enir de poblaciones distintas con respecto a edad, sexo, inteligencia, etc.B el 'nico requisito es q dentro d cada pare&a el experimento %aya logrado igualar las !ariables extra7as pertinentes, como se indico antes, cada su&eto puede ser su propio control. 2!to%o: al aplicar la prueba d los signos nos orientamos en la direccin d las di$erencias entre cada 3ai y 3bi, ad!irtiendo el signo mas o menos de la di$erencia. Con$orme a ,o, esperamos que el numero de pare&as por las que 3aS3b sea igual al numero de pare&as por las que 3aT3b. Esto es, si la %iptesis d nulidad $uera !erdadera, esperaramos q cerca d la mitad d las di$erencias $ueran negati!as y la otra mitad positi!as. ,o es rec%a"ada si ocurren muy pocas di$erencias de un signo. La prueba de los signos puede ser de una o de dos colas. En la d una cola, se predice q signo ocurrir mas $recuentemente. En una prueba de dos colas, solo se predice q las $recuencias con q ocurrirn los signos sern signi$icati!amente di$erentes. En esta prueba %ay q duplicar los !alores de probabilidad en la tabla 0. Li'as: en la prueba d signos, se dice q una <liga= ocurre cuando no es posible distinguir di$erencias en la pare&a igualada en la !ariable ba&o estudio o cuando los dos punta&es obtenidos por cualquier pare&a son iguales. 2odos los casos ligados $ueron desec%ados del anlisis de prueba de los signos, y en consecuencia el C se redu&o. Por tanto, C es el numero de pare&as igualadas cuyo punta&e de di$erencia tiene un signoB xe&. 1@ de 1O pare&as tu!ieron punta&es d di$erencia con signo, por lo que C K 1@. ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ;; 2,estras 'ran%es: si C es mayor que ;F, puede emplearse la aproximacin normal a la distribucin binomial. Res,en %e# "roce%iiento: estos son los pasos de la prueba de los signos* 1. Se determina el signo de la di$erencia entre los dos miembros d cada pare&a. ;. Se determina el !alor d C, numero de pare&as, cuya di$erencias ex%iben un signo. ?. El m#todo para determinar la probabilidad asociada con la ocurrencia con$orme a ,o de un !alor tan extremo como el !alor obser!ado de x depende del tama7o d C. Si la probabilidad producida es igual o menor que , se rec%a"a la ,o. LA PRUE1A D RANGOS SEJALADOS Y PARES IGUALADOS DE KILCOHON @,ncin* si se considera la magnitud relati!a as como la direccin de las di$erencias, puede %acerse una prueba mas poderosa. La de rangos, se7alados y pares igualados de ^ilcoxon* da mayor eso al par q muestra una di$erencia grande entre las dos condiciones q el par q ex%ibe una di$erencia peque7a. Esta prueba es la de mayo utilidad p el cient$ico conductual. @,n%aento + !to%o: sea di el punta&e de di$erencia p cualquier par igualado, representando la di$erencia entre los punta&es del par ba&o los dos tratamientos. Cada par tiene una di. Para usar la prueba de ^ilcoxon, se clasi$ican todas las di, sin tener en cuenta el signo as* del rango de 1 a la mas peque7a di, el rango de ; a la siguiente menor, etc. cuando se clasi$ican punta&es despreciando el signo, a una di de U1 se le da un rango menor que a una di de U; \;. Enseguida se a7ade a cada rango el signo de la di$erencia, indicando que rangos procedieron de di negati!as y de di positi!as. (%ora bien, si los tratamientos d ( y . son equi!alentes, esto es, si ,o es !erdadera, esperaramos encontrar algunas de las di mayores $a!oreciendo el tratamiento de ( y otras $a!oreciendo el de .. Es decir, algunos de los rangos mayores procederan de las di positi!as mientras otros procederan de las di negati!as. En otras palabras, rec%a"amos ,o si tanto la suma de los rangos de las di negati!as como la suma de los rangos para las di positi!as es demasiado peque7a. 2,estras "e7,eDas: sea 2 la suma mas peque7a de los rangos se7alados. Esto es, 2 es la suma de los rangos positi!os cuando es menor que la suma de los rangos negati!os, o !ice!ersa. En la tabla + del ap#ndice %ay di$erentes !alores de 2 y sus ni!eles asociados de signi$icacin. Es decir, si una 2 obser!ada es igual o menor q el !alor dado en la tabla + en un ni!el particular de signi$icacin para el !alor obser!ado de C, la %iptesis de nulidad puede rec%a"arse entonces a ese ni!el de signi$icacin. La tabla + se adapta, tanto a pruebas de una cola como de dos colas. Res,en %e# "roce%iiento* estos son los pasos de la prueba de rangos se7alados y pares igualados de ^licoxon* 1. Para cada par igualado, se determina la di$erencia del signo Adi> entre los dos punta&es. ;. Se ordenan estas di sin respetar el signo. Con las d ligadas, se asigna el promedio de los rangos ligados. ?. Se a7ade a cada rango el signo A\ J> de la d q representa. @. Se determina 2, la mas peque7a suma de los rangos igualados. F. Se determina C, el numero total de d con un signo. M. El procedimiento p determinar la signi$icacin del !alor obser!ado d 2 depende del lado de C* si C es ;F menor, si C es mayor q ;F. ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ;? LA PRUE1A DE KALSH @,ncin: si el in!estigador esta en condiciones de suponer que los punta&es en di$erencia obser!ados en dos muestras relacionados se tomaron de una poblacin sim#trica, puede usar la poderosa prueba desarrollada d ^als%. La prueba supone poblaciones sim#tricas, d manera q la media representa exactamente la tendencia central, y es igual a la mediana. La prueba d ^als% requiere mediciones por lo menos de escala de inter!alo. 2!to%o: para la prueba de ^als%, se obtienen punta&es de di$erencia Adi> para cada uno d los C pares, q se colocan en orden a su tama7o, teniendo en cuenta el signo d cada d. Sea d1 el punta&e de di$erencia mas ba&o Apuede ser una d negati!a>, d; la di$erencia siguiente mas ba&a, etc. (s, d1d;d?d@...dn. La %iptesis de nulidad supone q los !alores de di $ueron tomados de una poblacin de mediana cero Ao de un grupo de poblaciones de mediana com'n de cero>. En una distribucin sim#trica, la media y la mediana coinciden. La prueba d ^las% supone q las di pro!ienen de poblaciones con distribuciones sim#tricas. Por consiguiente, ,o a$irma q el promedio de los punta&es de di$erencia AH> es cero. Para una prueba de dos colas, ,i supone q ; H. Para una prueba de una cola, ,i puede ser bien ;SH, o bien, ;TH. La tabla , del ap#ndice se usa para determinar la signi$icacin se di$erentes resultados con$orme a la prueba d ^las%. Para usar esta tabla, se necesita conocer el !alor obser!ado en C Ael numero d pare&as>, la naturale"a de ,i y los !alores num#ricos de cada di. La tabla , contiene los !alores signi$icati!os para pruebas tanto de una como de dos colas. Res,en %e# "roce%iiento: estos son los pasos de la prueba d ^las%* 1. Se determina el punta&e de di$erencia con signo Adi> para cada par. ;. Se determina C, el numero de pares igual a dos. ?. Se colocan las di, en tama7os cada !e" mayores, de di a dn, teniendo en cuenta el signo. (s, di es el !alor negati!o mayor de d y dn es el !alor positi!o mayor de d. @. La tabla , sir!e para determinar si ,o se rec%a"a y se acepta ,i, con !alores obser!ados de di, d;,d?...dn. CAPITULO (I A EL CASO DE DOS 2UESTRAS INDEPENDIENTES (l estudiar las di$erencias entre dos grupos, podemos usar grupos relacionados o independientes. (unque tiene meritos usar dos muestras relacionadas en un dise7o de in!estigacin, suele resultar poco practico. 8recuentemente, la naturale"a de la !ariable dependiente impide usar a los su&etos como sus propios controles. Cuando el uso de dos muestras relacionadas no es practico ni adecuado, pueden usarse dos muestras independientes. En este dise7o, las dos muestras pueden obtenerse con la ayuda de dos m#todos* a> tomadas al a"ar de dos poblaciones o b> asignados al a"ar ambos tratamientos a miembros de alguna muestra de orgenes arbitrarios. En cualquier caso no es necesario que las muestras sean del mismo tama7o. Las t#cnicas param#tricas usuales para anali"ar datos de dos muestras independientes consiste en aplicar una prueba t a alas medidas de los dos grupos. La prueba t supone que los punta&es Aque se suman al calcular las medidas> son obser!aciones independientes de poblaciones distribuidas normalmente con !arian"as iguales, y requiere que las obser!aciones se midan por lo menos en una escala de inter!alo. Para una in!estigacin dada, la prueba t puede ser aplicable debido a !arias ra"ones. El in!estigador puede encontrar que a> las suposiciones de la prueba t son poco adecuadas para sus datosB b> pre$iere no %acer suposiciones y as dar a sus conclusiones mayor generalidad oB c> sus punta&es pueden no ser !erdaderamente num#ricos y por tanto no satis$acer la medida de la prueba t. ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ;@ LA PRUE1A DE LA PRO1A1ILIDAD EHACTA DE @ISHER 8UCC5DC* Esta es una t#cnica no parametrica sumamente 'til para anali"ar datos discretos Anominales u ordinales> cuando las dos muestras independientes son peque7as. Se usa cuando los punta&es de dos muestras recogidas independientemente al a"ar perteneces respecti!amente a clases mutuamente excluyentes. En otras palabras, cada su&eto en ambos grupos obtiene uno de los dos punta&es posibles. Los punta&es se representan mediante $recuencias en una tabla de contingencia de ;3;, como la tabla M.1. Los grupos 5 y 55 pueden ser dos grupos independientes cualquiera, tales por e&emplo pueden ser como experimentales y control, %ombres y mu&eres, empleados y no empleados, etc. 2ambi#n en cuanto a las dos clasi$icaciones pude ser cualquiera e&emplo aprobadoJ desaprobado, de acuerdo y en desacuerdo, etc. La prueba determina si los grupos di$ieren en la proporcin correspondiente a las clasi$icaciones. E&emplo de la tabla de contingencia ;3;* 2D2(L J \
+rupo 5 (\.
+rupo 55 C\0
2D2(L (\C .\0 N /E2D0D* La probabilidad exacta de obser!ar un con&unto particular de $recuencias en una tabla de ;3;, cuando los totales marginales se consideran $i&os, esta dada por la distribucin %ipergeom#trica. Esto es, la probabilidad exacta de la ocurrencia obser!ada se encuentra tomando la proporcin del producto de los $actoriales de los cuatro totales marginales y el producto de los $actoriales de las $recuencias de las celdillas, multiplicando por el $actorial C. Si para el in!estigador son su$icientes los ni!eles de signi$icacin en lugar de !alores exactos de p Aprobabilidad>, puede usar la tabla 5 del ap#ndice. Se elimina la necesidad de reali"ar clculos tediosos. Con ella se puede determinar directamente la signi$icacin de un con&unto obser!ado de !alores en una tabla de contingencia de ;3;. La tabla 5 es aplicable a los datos donde C toma un !alor de ?H o menor, y donde ninguno de los totales del margen derec%os sobrepasa 1F. Es decir ni (\., ni, C\0 pueden ser mayores que 1F. 0ebido a su gran tama7o, la tabla 5 es un poco ms di$cil de usar que la mayora de las tablas de !alores de signi$icacin. Por lo tanto, se %a incluido direcciones detallada para su uso. 1> Se determinan los !alores de (\.\C\0 a partir de los datos. ;> Se encuentra el !alor obser!ado de (\. en la tabla 5 ba&o el encabe"ado <totales en el margen derec%o= ?> En la misma seccin de la tabla, se locali"a el !alor obser!ado de C\0 ba&o el mismo encabe"ado. @> Para el !alor obser!ado de C\0, %ay en la tabla !arios !alores posibles de ._. Se encuentra el !alor obser!ado de . entre estas posibilidades. F> Se obser!a a continuacin el !alor de 0. Si es igual o menor que el !alor dado en la tabla de acuerdo con su ni!el de signi$icacin, los datos obser!ados son signi$icati!os en se ni!el.
A B
C D ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ;F 0eber notarse que los !alores de la tabla 5 son aproximados. ) tambi#n que los ni!eles de signi$icacin de esta tabla son para regiones de rec%a"o de 1 cola. Si se necesita una regin de rec%a"o de ; colas %ay que duplicar el ni!el de signi$icacin dado en la tabla 5. 1ESU/EC 0EL P1DCE05/5EC2D* Estos son los pasos para usar la prueba de 8is%er* 1> Se distribuyen las $recuencias obser!adas en una tabla de ;3;. ;> Se determinan los totales marginales. Cada con&unto de totales marginales se suma a C, el n'mero de casos independientes obser!ados. ?> La eleccin del m#todo para decidir si se rec%a"a o no la ,o depende de que se requiera el clculo de las probabilidades exactas. a> Para una prueba de signi$icacin, %ay que consultar la tabla 5 b> Para una probabilidad exacta, se requiere un uso recurrente de $ormula AM.1> En cualquier caso, el !alor obtenido ser para una prueba de una cola. Para una prueba de dos colas, el ni!el de signi$icacin que aparece en la tabla 5 o la p obtenida deber duplicarse. @> Si el ni!el de signi$icacin que aparece en la tabla 5 o la p obtenida es igual o menor que , se rec%a"a ,o. LA PRUE1A HL PARA DOS 2UETRAS INDEPENDIENTES 8UCC5DC* Cuando los datos de in!estigacin consisten en $recuencias de categoras, puede usarse la prueba 3_ para determinar la signi$icacin de las di$erencias entre dos grupos independientes. La medicin implicada puede ser tan !aga como una escala nominal. La %iptesis que usualmente se pone a prueba supone, que los dos grupos di$ieren con respecto a alguna caracterstica y por lo tanto, con respecto a la $recuencia relati!a con que los miembros del grupo son encontrados en di$erentes categoras. Para probar esta %iptesis, contamos el n'mero de casos de cada grupo en cada categora de un grupo con la del otro grupo. Por e&emplo podramos probar si dos grupos polticos di$ieren en su acuerdo o desacuerdo con alguna opinin. /E2D0D* La %iptesis de nulidad puede probarse por medio de* HL M NO A E.L NG;C. E 0onde D es el numero obser!ado de casos clasi$icados y E es el numero de casos esperados con$orme con la ,o. Para encontrar la $recuencia esperada par cada casillero o celdilla se multiplican los dos totales marginales comunes por una celdilla particular y se di!ide este producto por el n'mero total de casos C. Los !alores sacados despu#s de la $ormula son distribuidos aproximadamente con un '#M NOA-.; NrA-. donde - quiere decir numero de categoras y r quiere decir n'mero de columnas. (%ora bien, si las $recuencias obser!adas estn estrec%amente de acuerdo con las $recuencias esperadas, las di$erencias ADJE> sern por supuesto, peque7as y consecuentemente el !alor de 3_ ser peque7o. Con un !alor 3_ no podemos rec%a"ar la %iptesis de nulidad Ao nula>, que supone independientes entre si a los dos con&untos de caractersticas. Sin embargo, si %ay una o !arias di$erencias grandes, el !alor de 3_ tambi#n ser grande. Cuanto mayor es 3_ tanto mas probable es que los dos grupos di$ieran con respecto a las clasi$icaciones. Las probabilidades asociadas con di$erentes !alores de c%i cuadrada se encuentran en la tabla C del ap#ndice. ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ;M 2(.L(S 0E CDC2EC+ECC5( 0E ;3;* 2al !e" el uso mas comun de la prueba de 3_ se re$iere a la posibilidad de que ocurra con$orme a ,o un colapso obser!ado de $recuencias en una tabla de contingencia de ;3;. Cuando aplicamos a la prueba 3E a los datos donde tanto r como - son iguales a ;, deber usarse la $ormula* N HL M N NP AD B 1CP A 0 . NG;E. '#M - NAQ1.; NCQD.; NAQC.; N1QD. 1ESU/EC 0E P1DCE05/5EC2D* Pasos par usar la prueba de 3_ para dos muestras independientes* 1> Se calculan las $recuencias obser!adas en una tabla de contingencia - x r, usando las columnas de - para los grupos y las $ilas de r para las condiciones ;> Se determina la $recuencia esperada para cada una de las celdillas para obtener el producto de los totales marginales. Comunes a ella y di!idirlo por CA C es la suma de cada grupo de totales marginales. 1epresenta el numero total de obser!aciones independientes. Las C in$ladas in!alidan la prueba>. El paso de ; es innecesario cuando los datos estn en una tabla de ;x;. ?> Para una tabla de ;x;, se calcula 3_ con una $ormula AM.@> cuando es mayor que ;, se calcula 3_ con una $ormula de AM.?> @> Se determina la signi$icacin de la 3_ obser!ada consultando la tabla C. Para una prueba de una cola, se di!ide por dos el ni!el de signi$icacin se7alado. Si la probabilidad dad por la tabla C es igual o menor que se rec%a"a ,o y se acepta ,1. Cuando se usa la prueba 3_ E# caso 0H0; Si las $recuencias estn en una tabla de contingencia ;3;, la decisin concerniente al uso de 3_ debe guiarse por estas consideraciones* 1> Cuando C> @H, se usa 3_ corregida por la continuidad, es decir con la $ormula GM.@> ;> Cuando C esta entre ;H y @H, la prueba 3_ AM.@>, puede usarse en el caso de que todas las $recuencias esperadas sean de F o mas. Si la $recuencia esperada ms peque7a es menor que F se usa la prueba de 8is%er. ?> Cuando C<;H, se usa la prueba de 8is%er. Ta)#as %e contin'encia con '# a+or 7,e -: Cuando - es mayor que ; Ay as gl > 1>, puede usarse la prueba 3_ si menos del ;H por ciento de las celdillas tiene una $recuencia esperada menor que F y si no %ay ninguna celdilla con una $recuencia espera menor que 1. Si estos requisitos no son reunidos por los datos en la $orma en que se obtu!ieron originalmente, el in!estigador debe combinar las categoras adyacentes para aumentar la $recuencia esperada en las di$erentes celdillas. LA PRUE1A DE LA 2EDIANA 8UCC5DC* La prueba de la mediana es un procedimiento para probar si dos grupos independientes di$ieren en sus tendencias centrales. /s exactamente, la prueba de la mediana dar in$ormacin acerca de la probabilidad de que dos grupos independientes Ano necesariamente del mismo tama7o> se %ayan tomado de poblaciones con la misma mediana. La %iptesis de nulidad supone que pro!iene de poblaciones con la misma medianaB la %iptesis alterna puede ser que la mediana de una poblacin es di$erente de la de la otra Aprueba de dos colas> o que la mediana de una poblacin es ms alta que la de la otra Aprueba de una cola>. La prueba puede usarse siempre que los punta&es de los dos grupos por lo menos en una escala ordinal de medicin. ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ;O 8UC0(/EC2D ) /E2D0D* (l aplicar la prueba de la mediana, se empie"a por determinar el punta&e de la mediana para el grupo combinado Aes decir, la mediana para todos los punta&es en ambas muestras>. Enseguida se dicotomi"an os con&untos de punta&es de la mediana combinada y se distribuyen los datos en una tabla de ;3;, como la tabla a continuacin AM.1H> 2D2(L +rupo 5 +rupo 55
Cum. de punta&. Por encima de la mediana combinada (\.
Cum. de punta&. por deba&o de la mediana combinada C\0 AG;-R. 2D2(L (\C .\0 NMn- Qn0 (%ora bien, si en los grupos 5 y 55 tenemos muestras procedentes de poblacin con la misma mediana, cerca de la mitad d los punta&es e cada grupo deber estar por encima de la mediana combinada y cerca de la otra mitad por deba&o. Es decir, esperaremos que las $recuencias ( y C sean aproximadamente iguales, y las $recuencias . y 0 tambi#n lo sean. Puede demostrarse que si ( es el numero de casos en el grupo 5 por encima de la mediana combinada y si . es el numero de casos en el grupo 55 en la misma situacin, la distribucin muestral de ( y . ba&o la %iptesis nula A,o es ( K 1 n1 y . K 1 n;> es la distribucin %ipergeometrica. ; ; P A(,.>K A(\C> . A.\0> ( . An1 \n;> (\. NG;F. Si el numero total de casos en ambos grupos An1\n;> es peque7o puede usarse la prueba de 8is%er para probar ,o. Si el numero total de casos es su$icientemente grande puede usarse 3V con glK 1. Cuando se anali"an datos di!ididos en la mediana, %ay que guiarse por estas consideraciones al escoger entre la prueba de 8is%er y la prueba 3_. 1> Cuando n1\ n; S @H se usa 3_ corregida por continuidad es decir con la $ormula AM.@>. ;> Cuando n1\ n; esta entre ;H y @H y ninguna celdilla tiene una $recuencia esperada menor a F se usa 3_ corregida por continuidad por AM.@>. Si la mas peque7a $recuencia esperada es menor que F, se usa la prueba de 8is%er. ?> Cuando n1\ n; T ;H se usa 8is%er. Puede surgir una di$icultad al calcular la prueba de la mediana* puede que %aya !arios punta&es exactamente, en la mediana combinada. Si sucede, el in!estigador tiene dos alternati!as* a> si n1\ n; es grande y si solamente unos pocos casos caen en la mediana combinada esos casos pueden retirarse del anlisis o b> los grupos pueden di!idirse en punta&es que excedan o no excedan la mediana. 1ESU/EC 0EL P1DCE05/5EC2D* Son los pasos para usar la mediana 1> Se determina la mediana combinada de los punta&es n1 \ n;. ;> Se di!iden en la mediana combinada los punta&es de cada grupo. Se registran las $recuencias resultantes en una tabla como la M.1H. Si son muc%os los punta&es que quedan en la mediana combinada, se di!iden los punta&es en categoras* excedentes y no excedentes de la mediana. ?> Se encuentra la probabilidad de los !alores obser!ados por la prueba de 8is%er o la 3_, escogiendo entre ellas de acuerdo con los criterios ya establecidos. @> Si la probabilidad resultante de la prueba es igual o menor que , se rec%a"a ,o.
A B
C D ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ;G ELECCIN DE LA PRUE1A ESTADSTICA ADECUADA Una prueba estadstica es buena si es peque7a la probabilidad de rec%a"ar ,o siendo !erdadera y grande la probabilidad de rec%a"ar ,o siendo $alsa. Esto determina la potencia de una prueba. Existen otras consideraciones adems de la potencia que determinan la eleccin de la prueba estadstica. En la eleccin debemos considerar la manera en que la muestra de punta&es $ue obtenida, la naturale"a de la poblacin de la que se sac la muestra y la clase de medicin o escala que se emple en las de$iniciones operacionales de las !ariables usadas, es decir, en los punta&es Las pruebas ms poderosas son las apoyadas por suposiciones mas $uertes y amplias. Las pruebas param#tricas como la prueba t o 8 se basan en una !ariedad de $uertes suposiciones. Cuando los datos de la in!estigacin pueden ser anali"ados adecuadamente por una prueba param#trica, ese ser el medio mas poderoso para rec%a"ar una ,o 8alsa. Las condiciones en las que la prueba t es la ms poderosa y sin las cuales no se puede tener con$ian"a en cualquier ase!eracin de probabilidad obtenida son* 1. Las obser!aciones deben ser independientes entre s. La seleccin de un caso cualquiera de la poblacin con miras a la inclusin en la muestra no debe a$ectar las posibilidades de incluir cualquier otro, y el punta&e que se asigne a un caso cualquiera no debe in$luir en el punta&e que se asigne a cualquier otro ;. Las obser!aciones deben %acerse en poblaciones distribuidas normalmente ?. Estas poblaciones deben tener la misma !arian"a A o una proporcin de !arian"a conocida> @. Las !ariables correspondientes debern %aberse medido por lo menos en una escala de inter!alo, de modo que puedan %acerse con ellas operaciones matemticas Asuma, di!isin, clculo de las medias, etc.> F. En el caso de la prueba 8 se agrega una condicin* Las medias de estas poblaciones normales y %omoscedsticas debern ser combinaciones lineales de e$ectos debidos a las columnas y a los renglones o a ambos, los e$ectos deben ser aditi!os PotenciaAEficiencia ( medida que son ms d#biles las suposiciones de un modelo particular son mas generales las conclusiones deri!adas al aplicar la prueba estadstica asociada con #l, pero menos poderosa es la prueba de ,o. Esta asercin es generalmente !erdadera para cualquier tama7o de muestra, pero no se sostiene al comparar dos pruebas estadsticas que se aplican a dos muestras de distinto C. El concepto de potencia e$iciencia se re$iere al incremento en el tama7o de la muestra necesario para %acer la prueba . tan poderosa como la ( PotenciaJe$iciencia de la prueba . K 1HH CaLCb P (l escoger otra prueba estadstica con menos suposiciones podemos e!itar las suposiciones por medio del incremento en C. PotenciaAeficiencia %e #as "r,e)as No "ara!tricas PotenciaJe$iciencia de la .inomial* En !ista de que no %ay t#cnica param#trica aplicable a datos medidos en escala nominal, carece de sentido inquirir la potenciaJe$iciencia de la prueba binomial cuando se emplea con datos nominales. (l ser dicotomi"ado un continuo si con los datos resultantes se emplea la prueba binomial, puede actuar disipadoramente. En tales casos, la prueba binomial tiene una potencia e$iciencia del IFP con una C de M disminuyendo a una e$iciencia e!entual de ;L`K M?P. Sin embargo, si los datos se prestan bsicamente a la dicotoma, aunque la !ariable tenga en la base una distribucin continua, la prueba binomial puede no tener alternati!as mas poderosas. ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ;I PotenciaJe$iciencia de la Prueba a; para una muestra* En !ista de que esta prueba suele ser usada cuando no se dispone de otra alternati!a clara, usualmente no estamos en condiciones de calcular su potencia exacta. Cuando se usa la medicin nominal o cuando los datos estn con$ormados por categoras in%erentemente discretas, la nocin de potenciaJe$iciencia de la prueba a; no tiene importancia, en tales casos, no %ay prueba param#trica adecuada. Si los datos permiten que pueda disponerse de una prueba param#trica, la prueba a; puede ser disipadora de la in$ormacin. Cuando gl S1, las pruebas a; son insensibles a los e$ectos de orden, y as, cuando una %iptesis tiene en cuenta el orden, la prueba a; puede no ser la me&or PotenciaJe$iciencia dela Prueba de /cCemar* Cuando la prueba de /cCemar se usa con medidas nominales, el concepto de potencia e$iciencia no tiene sentido pues no %ay otra alternati!a. Sin embargo, cuando la medicin y otros aspectos de los datos son tales que es posible aplicar la prueba param#trica t, tanto la prueba de /cCemar como la binomial, tienen una potenciaJ e$iciencia de cerca del IFP para (\0KM, que declina a medida que aumenta el tama7o de (\0 %asta una e$iciencia $inal asinttica de cerca del M?P PotenciaJe$iciencia de la Prueba los Signos* La ptenciaJe$iciencia de la prueba de los signos est cerca del IFP para CKM, pero declina a medida que el tama7o de la muestra se incrementa %asta una e$iciencia $inal asinttica del M?P. PotenciaJe$iciencia de la Prueba de ^ilcoxon* Cuando las suposiciones de la prueba param#trica t en !erdad se satis$acen, la e$iciencia asinttica cercana a ,o de la prueba de rangos se7alados y pares igualados de ^ilcoxon, comparada con la prueba t es de ?L` K IF,FP. Esto signi$ica que ?L` es la proporcin lmite, de tama7os de muestras, necesaria para que las pruebas de ^ilcoxon y t alcancen el mismo poder . Para muestras peque7as la e$iciencia se acerca al IFP PotenciaJe$iciencia de la Prueba de ^als%* Cuando se compara con la prueba mas poderosa, la prueba param#trica t, la de ^als% tiene una potenciaJe$iciencia del IF P para la mayora de los !alores de Cy de Z. Su potenciaJe$iciencia es del II P ACKI y ZKH.H1 en una prueba de una cola> sin ba&ar del GO,F ACK1H y ZKH.HM en una prueba de una cola> PotenciaJe$iciencia de la Prueba de 8is%er* Con la modi$icacin de 2oc%er Aconsiderando las distribuciones de $recuencia mas extremas que pudieran ocurrir con los mismos totales marginales>, la prueba de 8is%er es la mas poderosa de las pruebas de una cola para datos adecuados PotenciaJe$iciencia de la Prueba de a; para ; muestras independientes * Cuando la prueba de a; se usa, generalmente no %ay una alternati!a clara, y la potencia exacta de la prueba es di$cil de calcular. Sin embargo se demostr que el lmite de la distribucin de potencia de a; tiende a 1 cuando C toma un !alor grande PotenciaJe$iciencia de la Prueba de a; para la prueba de la Extensin de la mediana A- muestras ind> Como se sabe, la extensin de la prueba de la mediana es en esencia, una prueba a; para - muestras, por tanto su potencia e$iciencia es similar a la a; para ; muestras independientes PotenciaJe$iciencia del rango de Spearman* La e$iciencia de la correlacin de rango de Spearman cuando se compara con la correlacin mas poderosa, la r p de Pearson, es de cerca de I1 P. Cuando el r s se usa con una muestra para probar la existencia de una asociacin en la poblacin, y cuando la poblacin tiene una distribucin normal bi!ariada y la medicin se %a %ec%o en escala 5nter!alar, r s tiene una e$iciencia del I1 P respecto a r para rec%a"ar ,o. Si existe una correlacin entre 3 e ) en esa poblacin, r s necesitar 1HH casos para establecer esa correlacin al mismo ni!el de signi$icacin que r logra con I1 casos ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ?H INDICADORES DEL NI(EL DE SALUD
-AIn%ica%ores %e# Ni*e# %e Sa#,% Los indicadores responden a la necesidad de expresar cuantitati!amente las !ariables que son ob&eto de estudio en la ciencia. Para eso, #sta debe ser correctamente de$inida conceptual y operacionalmente, de modo que puedan establecerse cuales son los componentes de la !ariable cuya magnitud desea medirse desde el indicador. Por e&emplo si queremos medir el ni!el de %acinamiento con $ines epidemiolgicos deber tomarse la cantidad de personas por cama en cada !i!ienda. Re7,isitos %e #os in%ica%ores 4alide"* Signi$ica que el indicador mida la !ariable que se pretende y no otra cosa. Por e&emplo, si queremos medir la e$iciencia de la atencin m#dica no podemos tomar para ello el ni!el de mortalidad, pues esta depende de muc%os otros componentes como la educacin, la !i!ienda, el ingreso econmico y puede que una !ariacin notable en la mortalidad no se deba a la e$iciencia de atencin m#dica 8actibilidad* Signi$ica que los datos que se requieren para calcular un indicador est#n %abitualmente disponibles o pueden obtenerse de alg'n modo. Por e&emplo, los indicadores de morbilidad son me&ores que los de mortalidad, pero estos 'ltimos son ms $actibles Estabilidad* Signi$ica que sean poco sensibles a las de$iciencias de los datos bsicos, que no se !ean demasiado in$luenciados por datos bsicos de$icientes o errneos Comple&idad* En caso de tratarse de !ariables comple&as debe ser posible de$inir la !ariable en !arios componentes, entonces se puede obtener un ndice combinando di!ersos indicadores, asignando a cada uno la ponderacin correspondiente Simplicidad y Estandari"acin* 0eben ser de $cil comprensin y presentarse normali"ados en escalas internacionales para $acilitar las comparaciones 0A2e%icin %e# Ni*e# %e Sa#,% La organi"acin /undial de la Salud de$ine salud como, un estado de bienestar $sico, mental y social y no solo como ausencia de en$ermedad. La medicin del ni!el de salud puede darse a partir de* a> La medicin positi!a de la salud, o sea, del estado mismo de bienestar b> La medicin de las consecuencias deri!adas de la p#rdida de la salud, o sea, en$ermedad y muerte c> La medicin de los $actores que determinan el ni!el de salud La medicin del estado de bienestar %a sido muy tenido en cuenta en los 'ltimos a7os por la creciente conciencia de las limitaciones de los indicadores basados en la morbilidad y mortalidad, pero es a'n un campo de ensayo. La medicin de los $actores que determinan el ni!el de salud se utili"a en la plani$icacin, como parte del diagnstico de salud de una comunidad. Se relacionan con el estado de la !i!ienda, la disponibilidad de ser!icios p'blicos y m#dicos, pero el modelo de interrelacin entre estos $actores y el ni!el de salud a'n no se %a desarrollado, por eso se anali"an los de morbilidad y mortalidad que si son medidas que presentan una relacin cuanti$icable con el ni!el de salud.
ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ?1 0;-AIn%ica%ores )asa%os en #a 2orta#i%a% 4enta&as* 1> La de$uncin es un e!ento concreto, 'nico en la !ida de una persona y de$inido internacionalmente. ;> En la mayora de los pases existe un registro sistemtico de las muertes. ?> Los datos de poblacin requeridos generalmente se obtienen de los censos 0es!enta&as* 1J0e$iciencia en datos bsicos ;JErrores en el registro de las causas de muerte ?J Dmisiones que a !eces alcan"an %asta un tercio de las de$unciones @JCo re$le&an toda la comple&idad del $enmeno de salud de una poblacin FJCo expresan la ocurrencia de en$ermedades de ba&a o nula letalidad ;.1.1 2asa cruda de /ortalidad* 1e$le&a el n'mero de de$unciones anuales por 1HHH %abitantes y traduce en $orma global el impacto de las alteraciones letales de salud en una comunidad. 1equiere del conocimiento del total de muertes y de toda la poblacin. Es un macroindicador y resume los riesgos de una poblacin %eterog#nea. Co contempla aspectos como la edad y el sexo ;.1.;* Esperan"a de !ida al nacimiento* Si se disponen de las tasas espec$icas de mortalidad por edad y sexo de una poblacin se puede calcular las correspondientes probabilidades de muerte. Con ellas se puede construir una tabla de !ida que representa el curso de una generacin de 1HH.HHH nacidos !i!os que %ubieran estado expuestos a riesgos de muerte citados. El indicador de ni!el de salud deri!ado de la tabla de !ida es la esperan"a de !ida al nacimiento y re$le&a el promedio de a7os de sobre!ida al nacimiento. Este indicador resume ms comprensiblemente los riesgos de morir obser!ados en una poblacin, independientemente de la estructura de edad de la poblacin. Para ello se precisa* poblacin, de$unciones por edad y construccin de tabla de !ida ;.1.?* /ortalidad 5n$antil* Es una tasa que indica el n'mero de muertes que se dan antes del a7o de !ida por cada 1HHH nacidos !i!os en una poblacin. (unque indica mortalidad de un grupo etario, realmente muestra ni!el de salud y !ida de la poblacin ya que los menores a un a7o son en extremo !ulnerables a las condiciones ad!ersas de !ida. El incon!eniente de este indicador es que no siempre se registran estas muertes y parte de las muertes del primer da son errneamente ad&udicadas a la mortalidad $etal. ;.1.@* /ortalidad proporcional* Es el cociente entre de$unciones de personas de mas de FH a7os sobre el total de de$unciones, expresado en porcenta&e. 1equiere de pocos datos, es poco sensible a errores de in$ormacin bsica y es $cil su clculo e interpretacin. Se basa en la obser!acin de que en los pases con ba&o ni!el de salud la estructura de poblacin es &o!en y la mortalidad temprana es alta. ( medida que los ni!eles de salud y de !ida aumentan, disminuye la mortalidad por deba&o de los FH a7os. Este indicador discrimina con ms e$iciencia pases de distinto ni!el de !ida y es me&or que la mortalidad proporcional calculada usando otra edad, por ello parece un buen macroindicador 0;0; In%ica%ores 1asa%os en #a 2or)i#i%a% 4enta&as* Co re$le&a exclusi!amente la ocurrencia de en$ermedades letales, sino el con&unto de en$ermedades y accidentes de una poblacin. 0es!enta&as* 1JLa en$ermedad es repetiti!a y de caractersticas !ariadas ;JLas de$iniciones operacionales pueden %acerse seg'n di!ersos criterios ?JLa clasi$icacin de las en$ermedades es distinta seg'n los estados. @JEs imposible su registro completo y sistemtico FJCo existen criterios de diagnstico uni$orme MJLa clasi$icacin depende del conocimiento del m#dico OJLa e$iciencia de los medios para diagnstico es !ariable GJ La disponibilidad de los medios de diagnstico es !ariable IJLos datos estn dispersos en sitios p'blicos y pri!ados 1HJLa percepcin de en$ermedad por parte del indi!iduo depende de $actores culturales y sociales 11JLa concurrencia o no a un centro de asistencia depender del $actor anterior 1;JSolo se pueden obtener datos sobre algunas en$ermedades 1?JDcurrencia de en$ermedades crnicas ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ?; Pro",estas "ara e%ir ni*e#es %e sa#,% Sanders propone un indicador en el sentido de medir positi!amente la salud y se basa en la determinacin de los das en que el indi!iduo es capa" de desarrollar el papel adecuado a su edad y su sexo. Sulli!an propone medir el n'mero de das en que el indi!iduo se encuentra en alguna de @ categoras que !an desde el en$ermo crnico %ospitali"ado a la incapacidad transitoria por una a$eccin aguda. Pero igualmente, %ay que considerar que el %ec%o de que un indi!iduo decida suspender o reducir sus acti!idades debido a una en$ermedad o accidente depende de $actores sociales y culturales y por tanto est su&eto a $actores de !ariacin El ob&eti!o $undamental de estas mediciones es orientar acciones concretas para me&orar los ni!eles de salud, en tal sentido los planes de salud, mas que un 'nico indicador, requieren de un diagnstico analtico de los da7os de salud de la poblacin y de los $actores que los determinan. En tal sentido, combinan !ariadas $uentes de in$ormacin y utili"an indicadores m'ltiples. Tasas/ Ra8ones + "ro"orciones Las tasas, ra"ones y proporciones son los elementos mas usados en la descripcin de datos cualitati!os.. En el campo de salud p'blica, el uso de !alores absolutos es muy $recuente y llena los requerimientos de muc%os sectores, por e&emplo la necesidad del conocimiento del total de la poblacin de un municipio para estimar el !olumen de prestaciones que debe drsele, como puede ser el conocer el n'mero total de nacimientos para calcular el !olumen de camas que deben estar disponibles para obstetricia Los !alores absolutos tienen innumerables aplicaciones en salud p'blica, particularmente los relacionados con nacimientos, de$unciones, morbilidad, etc, ya que son ampliamente usados en los programas de plani$icacin de acti!idades. Sin embargo, no son su$icientes cuando se desea comparar las ci$ras de un rea a lo largo del tiempo o entre !arias regiones entre s, porque las poblaciones de las cuales pro!ienen son cambiantes y los totales absolutos pierden importancia pues no son comparables. Para ello se usan las $recuencias relati!as que no son ms que cantidades que estn re$eridas a otras que se usan como base de comparacin. Pa,tas "ara e# ,so %e frec,encias Re#ati*as 1> Es necesario especi$icar que $enmenos se estn relacionando y cual de ellos se toma como base de re$erencia ;> Co deben calcularse $recuencias relati!as sobre !alores absolutos muy peque7os, los resultados seran muy inestables ?> 2odo cociente debe expresarse a tra!#s de su !alor real o puede ampli$icarse por un $actor que puede ser m'ltiplo de 1H @> Un cociente no expresa la magnitud de ninguno de los !alores usados sino de la relacin, por eso todo cociente debe acompa7arse por lo menos por uno de los !alores absolutos que le dio origen Ra8n* Es todo n'mero relati!o que relaciona a> dos $enmenos distintos o b> dos categoras di$erentes de un mismo $enmeno. E&* a> Promedio de %abitantes por -m ; . b> 1elacin de sexos de los nacidos !i!os Pro"orcin* Es la relacin de dos cantidades en la cual el numerador es una parte de la registrada en el denominador y este constituye el total de las obser!aciones en consideracin. El resultado se agranda por un $actor de ampli$icacin que en general es 1HH y esa proporcin recibe el nombre de porcenta&e. Una proporcin mide el peso relati!o de una parte respecto al todo del cual pro!iene. E&emplo* Proporcin de pacientes que curaron con una droga con respecto al total de pacientes tratados con dic%a droga ELI AGUILAR ESTADSTICA Lic. En Psicologa UC.S. ?? Tasa* Es la relacin existente entre el n'mero de !eces que ocurri un %ec%o !ital o de salud, y la poblacin que estu!o expuesta al riesgo de acaecimiento del %ec%o mencionado en el numerador. 2iene mayor implicancia que las ra"ones y proporciones pues in!olucra el $actor riesgo o probabilidad. La mayora de las tasas miden la $uer"a de acaecimiento de un $enmeno y con ello e!al'a el riesgo in%erente. Una tasa est compuesta por tres elementos* numerador, denominador y $actor de ampliacin. En el numerador se consigna el n'mero de !eces que se registr un $enmeno Atotal de nacimientos, de$unciones, matrimonios> y en el denominador la poblacin que estu!o expuesta al riesgo de acaecimiento de lo asignado en el numerador. +eneralmente los datos del numerador pro!ienen de sistemas de registro permanente y los del denominador de recuentos censales o proyecciones %ec%as a partir de los censos. Para que una tasa sea correcta se debe considerar la concordancia de numerador y denominador en lo re$erente a la naturale"a, tiempo y rea de re$erencia. 1especto a la concordancia en la naturale"a, en la tasa de mortalidad por cncer de 'tero no se considera la poblacin total pues los %ombres no pueden producir tales de$unciones. 1especto del tiempo, los datos deben %aber sido enumerados en el mismo periodo. 1especto del rea de re$erencia se deben descartar %ec%os acaecidos a personas no residentes en el rea, as en %ospitales muy especiali"ados los casos que puedan registrarse pueden corresponder a personas residentes en otras reas 2asa general* /ide la $uer"a de acaecimiento de un $enmeno en el total de la poblacin e intenta cuanti$icar la probabilidad de ocurrencia en el con&unto de los componentes. 2asa espec$ica* /ide un %ec%o registrado en un segmento de la poblacin en relacin a la poblacin de ese segmento E&emplos* 2asa general K CE de de nacimientos en el rea ) en el perodo b 0e Catalidad Poblacin total del rea ), a la mitad del perodo b 2asa espec$ica K CE de nacimientos en un segmento del rea ) en el periodo b de natalidad Poblacin de ese segmento a la mitad del perodo Tasas a9,sta%as: 9ue ; tasas generales sean iguales no implica que ambas poblaciones tengan igual riesgo de acaecimiento del $enmeno pues pueden tener estructura di$erente, pero las di$erencias se compensan y los resultados $inales son iguales. E&emplo* La tasa general anual de mortalidad por cncer en %ombres en 1IM;JM? $ue de ;FI.@ por 1HHH.HHH %abitantes. En Lima en igual perodo $ue de I1.I. (l comparar ambas poblaciones se !e que en La Plata un ?MP de la poblacin tiene entre @FJO@ a7os y en Lima solo un ;HP, Lima tiene una poblacin mas &o!en y por ello menos expuesta a tal riesgo. 0ebe entonces eliminarse esa di$erencia. Suprimiendo las di$erencias de edad, las tasas son 1?;.1M y 11;.F, la disimilitud tiende a disminuir. Por ello cuando se desean comparar dos poblaciones respecto a cierto riesgo deben tomarse uno de dos caminos* 1> Comparar las tasas espec$icas* Se comien"a estableciendo cul es el $actor espec$ico mas importante Aedad, sexo> luego se obtienen las tasas espec$icas correspondientes y luego se comparan clase a clase, las clases de cada tramo. Esto se puede %acer cuando el n'mero de clases es peque7o sino debe optarse por el segundo m#todo ;> Comparar las tasas a&ustadas* a> Se determinan cules son los $actores de !ariacin posible b> Se asla el que se supone mas probable c> Se estudia la estructura de las poblaciones tabuladas y se detectan similitudes o di$erencias d> se calculan las tasas espec$icas para cada tramo y se las compara una a una 1I1LIOGRA@IA Slonim, /. A1IMO>. /uestreo* +ua gil y precisa de Estadstica Prctica. .uenos (ires* Editorial (mericana. Siegel, S. A1IOH>. 0ise7o experimental no param#trico aplicado a las ciencias de la conducta. /#xico* Editorial 2rillas S(.