You are on page 1of 20

Gua Estadstica 1

1. INTRODUCCIN 1.1 NOCIN Y UTILIDAD DE LA ESTADSTICA Por estadstica entendemos una batera de recursos cientficos por los cuales podemos recolectar, organizar, resumir, presentar y analizar datos numricos de un conjunto de observaciones. La estadstica se emplea en aquellos casos en los que tenemos una gran cantidad de observaciones y cuya aparicin se rige por las leyes del azar. Es decir, se aplica a fenmenos cuya medicin requiere una coleccin de observaciones, pues hay algunos fenmenos que se presentan en masa, pero para los que no se requiere observacin alguna, pues se conocen a priori. Para saber el porcentaje de hombres mayores de un metro setenta en una poblacin, son necesarias una serie de medidas. En cambio no es necesaria ninguna observacin para saber la cantidad que integran un matrimonio. Para que sean de utilidad los datos estadsticos tienen que tener dos caractersticas bsicas: Deben ser pertinentes: deben guardar una relacin con el tema en cuestin. Deben ser insesgados: no deben tener deformaciones provenientes de prejuicios o de errores de los instrumentos empleados. 1.1.1 NOCIN BSICA a) Variable: Las variables, tambin suelen ser llamados caracteres cuantitativos, son aquellos que pueden ser expresados mediante nmeros. Son caracteres susceptibles de medicin. Como por ejemplo, la estatura, el peso, el salario, la edad, etc. Segn, Murray R. Spiegel, (1992) "una variable es un smbolo, tal como X, Y, Hx, que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar solamente un valor, se llama constante." Todos los elementos de la poblacin poseen los mismos tipos de caracteres, pero como estos en general no suelen representarse con la misma intensidad, es obvio que las variables toman distintos valores. Por lo tanto estos distintos nmeros o medidas que toman los caracteres son los "valores de la variable". Todos ellos juntos constituyen una variable. b) Poblacin: El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes. "Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubn (1996). "Una poblacin es un conjunto de elementos que presentan una caracterstica comn". Cadenas (1974). El tamao que tiene una poblacin es un factor de suma importancia en el proceso de investigacin estadstica, y este tamao vienen dado por el nmero de elementos que constituyen la poblacin, segn el nmero de elementos la poblacin puede ser finita o infinita. Cuando el nmero de elementos que integra la poblacin es muy grande, se puede considerar a esta como una poblacin infinita, por ejemplo; el conjunto de todos los nmeros positivos. Una poblacin finita es aquella que est formada por un limitado nmero de elementos, por ejemplo; el nmero de estudiante del Ncleo San Carlos de la Universidad Nacional Experimental Simn Rodrguez.

c) Muestra: Es un subconjunto de unidades de anlisis de una poblacin dada, destinado a suministrar informacin sobre la poblacin. Para que este subconjunto de unidades de anlisis sea de utilidad estadstica, deben reunirse ciertos requisitos en la seleccin de los elementos. Las causas por la cual se seleccionan muestras son muchas. Puede ocurrir que la poblacin que se defina tenga tamao infinito, y en consecuencia, no fuera posible observar a todos sus elementos. En otras ocasiones, el costo de la observacin exhaustiva puede ser muy elevado, el tiempo de recoleccin de la informacin muy extensa, o ms an, la observacin de los elementos puede ser destructiva. Por ejemplo, si quisiramos hacer un estudio de la calidad de una partida de fsforos, no podramos probarlos a todos pues los destruiramos. 1.1.2 USO INDEBIDO DE LA ESTADSTICA

El verdadero significado de los hechos se puede distorsionar fcilmente. Por lo tanto, el investigador estadstico debe estar alerta para evitar malas interpretaciones de los datos y detectar usos errneos de las estadsticas. Es esencial mantener una actitud crtica. Hay muchas personas que por carencia de sentido crtico de carcter estadstico, se impresionan muy fcilmente por coincidencias sorprendentes que a la luz de la teora de la probabilidad y de la estadstica nada tienen de sorprendentes. Enseguida mencionamos algunos ejemplos del uso impropio de datos (el gran arte de mentir con estadsticas) que habrn de alertar sobre ciertos errores comunes. Las estadsticas muestran que casi todos los accidentes de circulacin se producen entre vehculos que ruedan a velocidad moderada. Muy pocos ocurren a ms de 150 km/h. Significa esto que resulta ms seguro conducir a gran velocidad? No, de ninguna manera. Con frecuencia, las correlaciones estadsticas no reflejan causas y efectos. Casi todo el mundo circula a velocidad moderada, y como es natural, la mayora de los accidentes se producen a estas velocidades. Si las estadsticas mostrasen que la mortalidad por tuberculosis es mayor en Segovia que en las dems provincias, significara esto que el clima segoviano favorece el contagio tuberculoso? Todo lo contrario. El clima segoviano es tan beneficioso para los tuberculosos que muchos acuden all para restablecerse. Naturalmente, sta es la causa de que aumenten all los fallecimientos provocados por el mal. 1.2 CONCEPTOS BASICOS Y OPERACIONES ELEMENTALES EN LA TEORIA DE CONJUNTOS TEORA DE CONJUNTOS: La teora de conjuntos es un sistema matemtico con un lenguaje especfico para el manejo de ciertos problemas matemticos. Al igual que todo sistema matemtico consiste en un conjunto de conceptos bsicos, definiciones, operaciones y propiedades. NOCION DE LOS CONJUNTOS: Un conjunto se denomina a toda agrupacin o coleccin bien definida de objetos que poseen una caracterstica en comn. A dichos objetos que forman parte del conjunto se le denomina elementos del conjunto. Los conjuntos se denotan con letras maysculas (A, B,.Z) y sus elementos con letras minsculas (a, b, c, d, e.. ,z) los que pueden ser seres u objetos, separados adecuadamente por signos de puntuacin y encerrados entre llaves. DETERMINACIN DE UN CONJUNTO: Los conjuntos se pueden determinar de dos formas diferentes:

Gua Estadstica 3
a) Forma tabular o por extensin: Es el caso que se presenta cuando se indican explcitamente, nombrando a cada uno de los elementos de un conjunto. Por ejemplo: A = 5, 10, 15, 20, 25, 30, 35 B = 8, 9, 10, 11, 12

b) Forma constructiva o por comprensin: Es el caso que se presenta cuando se menciona una o ms caracterstica o propiedades que cumplen todos los elementos de un conjunto. Por ejemplo: A = 5x/x e N ^ x < 8 CLASES DE CONJUNTOS a) Conjunto vaco o nulo: Es el conjunto que no posee elemento alguno, se denota por: Por ejemplo: A = x/x es el astronauta peruano que lleg a la luna B= x/x es el cuadriltero de 3 lados b) Conjunto unitario: Es aquel conjunto que posee un solo elemento. Por ejemplo: A = x/x es el presidente peruano, periodo 2006 - 2011 B= x/x Z ^ 2 < x < 4 c) Conjunto finito: Es aquel conjunto que se le puede enumerar sus elementos, es decir consta de una cantidad limitada de elementos. Por ejemplo: B = x/x e N; 7< x < 13

A = x/x es un pas de Sudamrica B= x/x N ^ x es par ^ x < 11 d) Conjunto infinito: Es aquel conjunto que posee una cantidad ilimitada de elementos. Por ejemplo: A = x/x es una estrella del universo B= x/x es un nmero impar e) Conjunto universal: Es el conjunto referencial para todos los conjuntos, se denota por U. Hay dos circunstancias que se deben tener en cuenta cuando se trata de elegir al conjunto universal: El conjunto Universal (U) no es nico, depende del problema que se est considerando y puede cambiar segn la situacin particular de que se trate, por eso decimos que es un conjunto referencial. Por ejemplo: Sean los conjuntos: A = 1, 2 B= -1, 1, 2 C = 0, 2, 4 D= -1, 1, 3, 5 U = -3, -2, -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 El conjunto U contiene a los conjuntos A, B, C, D CONCEPTOS BSICOS: La estadstica es una rama de las matemticas que conjunta herramientas para recolectar, organizar, presentar y analizar datos numricos u observacionales.

Presenta nmeros que describen una caracterstica de una muestra. Resulta de la manipulacin de datos de la muestra segn ciertos procedimientos especificados. Procedimiento: 1 2 3 4 5 6 7 8 9 Obtencin de datos Clasificacin Presentacin Interpretacin Descripcin Generalizaciones Comprobacin de hiptesis por su aplicacin. Toma de decisiones Trminos comunes.

Poblacin: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten informacin sobre el fenmeno que se estudia. Por ejemplo, si estudiamos la edad de los habitantes en una ciudad, la poblacin ser el total de los habitantes de dicha ciudad. Muestra: Subconjunto de la poblacin seleccionado de acuerdo con un criterio, y que sea representativo de la poblacin. Por ejemplo, elegir 30 personas por cada colonia de la ciudad para saber sus edades, y este ser representativo para la ciudad. Individuo: cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si estudiamos la altura de los nios de una clase, cada alumno es un individuo; si estudiamos la edad de cada habitante, cada habitante es un individuo. Variable: Fenmeno que puede tomar diversos valores. Las variables pueden ser de dos tipos: Variables cualitativas o atributos: no se pueden medir numricamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos anuales Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas: Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podr ser 3,45). Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehculo puede ser 80,3 km/h, 94,57 km/h...etc. Las variables tambin se pueden clasificar en: Variables unidimensionales: slo recogen informacin sobre una caracterstica (por ejemplo: edad de los alunmos de una clase).

Gua Estadstica 5
Variables bidimensionales: recogen informacin sobre dos caractersticas de la poblacin (por ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales: recogen informacin sobre tres o ms caractersticas (por ejemplo: edad, altura y peso de los alumnos de una clase). CONCEPTO Y CLASIFICACIN DE DATOS DATOS: Caractersticas o nmeros que son recolectados por observacin. No son otra cosa que el producto de las observaciones efectuadas en las personas y objetos en los cuales se produce el fenmeno que queremos estudiar Los datos estadsticos pueden ser clasificados en cualitativos, cuantitativos, cronolgicos y geogrficos Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de cantidad. Ejemplo: Si deseamos clasificar los estudiantes que cursan la materia de estadstica I por su estado civil, observamos que pueden existir solteros, casados, divorciados, viudos. Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son datos cuantitativos. Ejemplo: Se clasifican los estudiantes del Ncleo San Carlos de la UNESR de acuerdo a sus notas, observamos que los valores (nota) representan diferentes magnitudes. Datos cronolgicos: cuando los valores de los datos varan en diferentes instantes o perodos de tiempo, los datos son reconocidos como cronolgicos. Ejemplo: Al registrar los promedios de notas de los Alumnos del Ncleo San Carlos de la UNESR en los diferentes semestres. Datos geogrficos: cuando los datos estn referidos a una localidad geogrfica se dicen que son datos geogrficos. Ejemplo: El nmero de estudiantes de educacin superior en las distintas regiones del pas PRESENTACION DE INFORMACIN 1.2.1 DISTRIBUCION DE TABLAS DE FRECUENCIAS Estadstica Descriptiva: Tienen por objeto fundamental describir y analizar las caractersticas de un conjunto de datos, obtenindose de esa manera conclusiones sobre las caractersticas de dicho conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas. No obstante puede no solo referirse a la observacin de todos los elementos de una poblacin (observacin exhaustiva) sino tambin a la descripcin de los elementos de una muestra (observacin parcial). En relacin a la estadstica descriptiva, Ernesto Rivas Gonzles dice; "Para el estudio de estas muestras, la estadstica descriptiva nos provee de todos sus medidas; medidas que cuando

quieran ser aplicadas al universo total, no tendrn la misma exactitud que tienen para la muestra, es decir al estimarse para el universo vendr dada con cierto margen de error; esto significa que el valor de la medida calculada para la muestra, en el oscilar dentro de cierto lmite de confianza, que casi siempre es de un 95 a 99% de los casos. Distribucin de frecuencias: muestra el nmero de veces que ocurre cada observacin. Ejemplo: Se elabor una encuesta en un jardn de nios y sta inform que las mascotas ms comunes que tiene un nio son perros, gatos, peces, hmsteres y pjaros perro pjaro hmster perro perro gato hmster gato perro perro perro gato pjaro hmster pjaro hmster perro gato pjaro gato

A continuacin se muestra la distribucin de frecuencias absolutas, relativas y porcentuales de las mascotas mas comunes de los nios. Mascota Perro Pajaro Hamster gato Frecuencia absoluta 7 4 4 5 Frecuencia relativa .35 .20 .20 .25 Frecuencia acumulada 35 % 20 % 20 % 25 %

Estos datos se pueden representar en una grfica de barras o en una grfica de pastel: NOTA :Para calcular:.. Frecuencia absoluta: se cuenta la cantidad de veces que ocurre el evento, en este caso, las mascotas. Frecuencia relativa: se divide la frecuencia absoluta de cada evento entre el total de eventos. Frecuencia porcentual: se multiplica la frecuencia relativa por 100. 1.2.2 CONSTRUCCION DE TABLAS ESTADSTICAS Distribucin agrupada de frecuencias: Distribucin de frecuencias en la que los valores de la variable se han agrupado en clases. Esto se debe principalmente a la disposicin de gran nmero

Gua Estadstica 7
de datos. Las razones por las que se elaboran este tipo de agrupacin de datos es por economa, practicidad, y baja frecuencia de algunos puntajes. Agrupacin de datos: para elaborar las tablas estadsticas, se debe seguir un procedimiento preciso: Estos son algunos mtodos para obtener datos: Censo: Se entiende por censo aquella numeracin que se efecta a todos y cada uno de los caracteres componentes de una poblacin. Para Levin & Rubin (1996) "Algunas veces es posible y prctico examinar a cada persona o elemento de la poblacin que deseamos describir. A esto lo llamamos una numeracin completa o censo. Utilizamos el muestre cuando no es posible contar o medir todos los elementos de la poblacin. Si es posible listar (o enumerar) y observar cada elemento de la poblacin, los censos se utilizan rara vez porque a menudo su compilacin es bastante difcil, consume mucho tiempo por lo que resulta demasiado costoso. Encuesta: Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales. El diseo de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que si queremos conocer algo sobre el comportamiento de las personas, lo mejor, ms directo y simple es preguntrselo directamente a ellas. (Cadenas, 1974). Segn Antonio Napolitano "La encuesta, es un mtodo mediante el cual se quiere averiguar. Se efecta a travs de cuestionarios verbales o escritos que son aplicados a un gran nmero de personas". Toma de datos.- es la obtencin de una coleccin de datos por medio de encuestas, preguntas, sondeos etc. Que no han sido ordenados numricamente y que dicha informacin se extrae al azar, es decir, de tal forma que cada miembro de la poblacin tenga la misma oportunidad de ser elegida o seleccionada. Ordenacin de datos: es una colocacin de los datos numricos tomados en orden creciente a decreciente de magnitud. La diferencia entre el mayor y el menor de los nmeros se llama rango o recorrido de datos. *No. De clases (Regla de Sturges): 1 + 3.332 log N *Tamao de clase = Rango / No. De clases Clculo de tamao de clase: para calcular el tamao de clase es necesario calcular primeramente el nmero de clases utilizando la regla de Sturges y desps se obtiene el tamao de clase dividiendo el rango entre el nmero de clases. Lmites de clase: representan el tamao de cada clase. El lmite inferior de la primer clase toma el valor de el dato menor de la coleccin de datos, para obtener el lmite inferior de la clase siguente, se suma al lmite inferior de la case anterior el tamao de clase. Lmites reales de clase: se obtienen sumando al LS de la clase el Lide la clase contigua superior y dividiendo entre dos. Marca de clase: Es el punto medio de la clase y se obtiene sumando los LI y LS de la clase y dividiendo entre 2. La marca de clase tambin se llama punto medio de la clase. EJEMPLO: AUTOBUSES FORANEOS

1) Toma de datos Los siguientes datos corresponden a la cantidad de asientos vacos que reportaron 50 autobuses forneos en un domingo. 12 10 8 5 7 11 1 7 6 6 4 1 8 6 8 6 2 4 4 4 6 4 10 12 6 11 5 4 8 9 3 2 2 1 3 10 4 6 12 7 12 4 2 1 7 4 8 9 7 5

2) Ordenacin de datos 1 1 1 1 2 2 2 2 3 3 4 4 4 4 4 4 4 4 4 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 8 8 8 8 8 9 9 10 10 10 11 11 12 12 12 12

Rango = 12-1 = 11 3) Tamao de clase No de clases = 1 + 3.332log (50) = 6 Tamao de clase = 11/6 = 2 4) Lmites de clase 5) Lmites reales de clase 6) Marca de clase Clase Intervalo LI 1 2 3 1 3 5 LS 2.9 4.9 6.9 0.95 2.95 4.95 2.95 4.95 6.95 LRI LRS Frec. Absoluta 8 11 10 Frec. Relat .16 .22 .20 Frec. Porcentual 16 % 22 % 20 % X

1.95 3.95 5.95

Gua Estadstica 9
4 5 6 total 7 9 11 8.9 10.9 12.9 6.95 8.95 10.95 8.95 10.95 12.95 10 5 6 50 .20 .10 .12 1 20 % 10 % 12 % 100 % 7.95 9.95 11.95

Representacin grfica de datos. Se tomar el ejemplo anterior para demostrar el uso de diferentes grficas. Histograma: forma grfica de barras que emplea variables con escala de intervalos o de proporciones. Para realizarla, se toma en cuenta para el eje X, los Lmites reales, y para el eje Y, las frecuencias absolutas. Polgono de frecuencias: Forma grfica que representa una distribucin de frecuncias en la forma de una lnea continua que traza un histograma. Para su elaboracin, se consideran las marcas de clase en el eje X y las frecuencias absolutas en el eje Y. Grfica de barras: la grfica de barras es una forma de grfica que utiliza barras para indicar la frecuencia de ocurrencia de las observaciones. Para construirla se constituye el eje y por las frecuencias absolutas y el eje X por los lmites inferior y superior de cada clase, dejando un espacio entre barra y barra. 1.3 CALCULO DE LA MEDIA MEDIANA Y MODA Medidas de tendencia central: La tendencia central se refiere al punto medio de una distribucin. Las medidas de tendencia central se conocen como medidas de posicin. MEDIA: La media es el punto en una distribucin de medidas, alrededor del cual las desviaciones sumadas son iguales a cero. Es el valor promedio de una muestra o poblacin. La media es muy sensible a mediciones extremas que no estn balanceadas en ambos lados. Se pueden calcular diversos tipos de media, siendo las ms utilizadas: a) Media aritmtica: se calcula multiplicando cada valor por el nmero de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra: b) Media geomtrica: se eleva cada valor al nmero de veces que se ha repetido. Se multiplican todo estos resultados y al producto fiinal se le calcula la raz "n" (siendo "n" el total de datos de la muestra).

Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media geomtrica. La media geomtrica se suele utilizar en series de datos como tipos de inters anuales, inflacin, etc., donde el valor de cada ao tiene un efecto multiplicativo sobre el de los aos anteriores. En todo caso, la media aritmtica es la medida de posicin central ms utilizada. Lo ms positivo de la media es que en su clculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna informacin. Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmtica como geomtrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores anmalos podran condicionar en gran medida el valor de la media, perdiendo sta representatividad. MEDIANA: Observacin u observacin potencial en un conjunto que divide el conjunto, de modo que el mismo nmero de observaciones estn en cada uno de sus lados. Para un nmero impar de valores, es el valor de en medio; para un nmero par es el promedio de los dos medios. Para un conjunto con un nmero par de nmeros, la mediana ser el promedio aritmtico de los dos nmeros medios. Ejemplo: Calcule la mediana para los siguientes datos. La edad de una muestra de cinco estudiantes es: 21, 25, 19, 20 y 22. Al ordenar los datos de manera ascendente quedan: 19, 20, 21, 22, 25. La mediana es 21. La mediana de una muestra de datos organizados en una distribucin de frecuencias se calcula mediante la siguiente frmula: Mediana = LRI + [(n/2 - FA)/f] c Donde: L es el lmite inferior de la clase que contiene a la mediana, FA es la frecuencia acumulada que precede a la clase de la mediana, f es la frecuencia de clase de la mediana e i es el intervalo de clase de la mediana. MODA: La moda es el valor de la observacin que aparece con ms frecuencia. Ejemplo: Las calificaciones de un examen de diez estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75, 81, 87. Como la calificacin 81 es la que ms ocurre, la calificacin modal es 81

1 Gua Estadstica 1
La moda de los datos agrupados se aproxima por el punto medio de la clase que contiene la frecuencia de clase mayor. Cuando dos valores ocurren una gran cantidad de veces, la distribucin se llama bimodal, como en dicho ejemplo. Ejemplo de clculo de media mediana y moda. Para ejemplificar, tomaremos el ejemplo de autobuses forneos de la pagina 6. Clase Intervalo LI 1 2 3 4 5 6 total 1 3 5 7 9 11 LS 2.9 4.9 6.9 8.9 10.9 12.9 0.95 2.95 4.95 6.95 8.95 10.95 2.95 4.95 6.95 8.95 10.95 12.95 LRI LRS Frec. Absoluta 8 11 10 10 5 6 50 Frec. Relat .16 .22 .20 .20 .10 .12 1 Frec. Porcentual 16 % 22 % 20 % 20 % 10 % 12 % 100 % X fx

1.95 3.95 5.95 7.95 9.95 11.95

15.60 43.45 59.50 79.50 49.75 71.70 319.50

CLCULO DE VARIANZA, DESVIACIN ESTNDAR Y COEFICIENTE DE VARIACIN. Medidas de dispersin: Estudia la distribucin de los valores de la serie, analizando si estos se encuentran ms o menos concentrados, o ms o menos dispersos Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el nmero de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamao de la muestra. La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms concentrados estn los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, ms dispersos estn. Desviacin estndar: Se calcula como raz cuadrada de la varianza. Coeficiente de variacin de Pearson: se calcula como cociente entre la desviacin tpica y la media de la muestra

Continuando con el caso de los autobuses forneos, se realizar el ejemplo de medidas de dispersin. Clase Intervalo LI 1 2 3 4 5 6 total 1 3 5 7 9 11 LS 2.9 4.9 6.9 8.9 10.9 12.9 0.95 2.95 4.95 6.95 8.95 10.95 2.95 4.95 6.95 8.95 10.95 12.95 LRI LRS Frec. Absoluta 8 11 10 10 5 6 50 UNIDAD II FUNDAMENTOS DE PROBABILIDAD 2.1 CONCEPTOS BSICOS Probabilidad: valor entre cero y uno, inclusive, que describe la posibilidad relativa de que ocurra un evento. Experimento: proceso que conduce a la ocurrencia de una de varias observaciones posibles. Resultado: lo que resulta en particular de un experimento. Evento: conjunto de uno o ms resultados de un experimento. Espacio muestral: son todos los posibles resultados de un experimento. Cualquier resultado experimental particular se llama punto muestral y es un elemento del espacio muestral. Tipos de sucesos Exhaustivo: se dice que dos o ms sucesos son exhaustivos si se consideran todos los posibles resultados. Simblicamente: p (A o B o...) = 1 No exhaustivos: se dice que dos o ms sucesos son exhaustivos si no cubren todos los posibles resultados. Mutuamente excluyentes: sucesos que no pueden ocurrir en forma simultnea: P(A y B) = 0 y p(A o B) = p(A) + p (B) Ejemplo: hombres, mujeres Frec. Relat .16 .22 .20 .20 .10 .12 1 Frec. Porcentual 16 % 22 % 20 % 20 % 10 % 12 % 100 % X fx f(x-x)2

1.95 3.95 5.95 7.95 9.95 11.95

15.60 43.45 59.50 79.50 49.75 71.70 319.50

157.71 171.63 354.03 632.03 495.01 856.82 2667.21

1 Gua Estadstica 3
No mutuamente excluyentes: sucesos que pueden ocurrir en forma simultnea: P (A o B) = p (A) + p (B) p (A y B ) Ejemplo: hombres, ojos cafs Independientes: Sucesos cuya probabilidad no se ve afectada por la ocurrencia o no ocurrencia del otro : P ( AI B ) = P ( A ); P ( BIA ) = P (B) Y P (A Y B) = P(A) P(B) Ejemplo: sexo y color de ojos Dependientes: sucesos cuya probabilidad cambia dependiendo de la ocurrencia o no ocurrencia del otro: P ( AI B ) difiere de p (A); P ( BIA ) difiere de P(B); y P (A Y B)= P ( A ) P ( BIA )= P (B) P ( AI B ) Ejemplo: raza y color de ojos Probabilidades conjuntas: probabilidad de que dos sucesos o ms, ocurran simultneamente Probabilidades marginales: o probabilidades incondicionales = suma de probabilidades. Enfoques de la probabilidad: Probabilidad clsica se basa en la consideracin de que los resultados de un experimento son igualmente posibles. Utilizando el punto de vista clsico, Probabilidad de un evento = no. de resultados probables no. De resultados posibles Ejemplo Considere el experimento de lanzar dos monedas al mismo tiempo. El espacio muestral S = {HH, HT, TH, TT} Considere el evento de una cara. Probabilidad de una cara = 2/4 = 1/2. Distribucin muestral El diagrama de rbol es muy til para visualizar las probabilidades condicional y conjunta y en particular para el anlisis de decisiones administrativas que involucran varias etapas. EJEMPLO: una bolsa contiene 7 fichas rojas (R) y 5 azules (B), se escogen 2 fichas, una despus de la otra sin reemplazo. Construya el diagrama de rbol con esta informacin.

2.2 AXIOMAS DE PROBABILIDAD Primer axioma : La probabilidad de un suceso A es un nmero real entre 0 y 1. Segundo axioma :Ocurre un suceso de la muestra de todos los sucesos o espacio de sucesos con probabilidad 1. Tercer axioma Si A1, A2 ... son sucesos mutuamente excluyentes 2.3 PROBABILIDAD CONDICIONAL Probabilidad condicional es la probabilidad de que ocurra un evento en particular, dado que ocurri otro evento. Nota: la probabilidad de que ocurra el evento A dado que ya ocurri B se denota como P(A|B). REGLAS DE LA PROBABILIDAD Reglas bsicas de probabilidad: Si los eventos son mutuamente excluyentes, la ocurrencia de cualquier evento impide que otro eventos ocurra. Reglas de adicin: si dos eventos A y B son mutuamente excluyentes, la regla especial de adicin indica que la probabilidad de que ocurra A o B es igual a la suma de sus probabilidades respectivas: P(A o B) = P(A) + P(B) Ejemplo Llegada Antes de tiempo A tiempo Demorado Cancelado Total Frecuencia 100 800 75 25 1000

Aerolneas Argentinas acaba de proporcionar la siguiente informacin de sus vuelos de Buenos Aires a Rosario: Ejemplo Si A es el evento de que un vuelo llegue antes de tiempo, entonces P(A) = 100 /1000 = 0.1.

1 Gua Estadstica 5
Si B es el evento de que un vuelo llegue demorado, entonces P(B) = 75 /1000 = 0.075. La probabilidad de que un vuelo llegue antes de tiempo o demorado es P(A o B) = P(A) + P(B) = .1 + .075 = 0.175. UNIDAD III DISTRIBUCIONES DE PROBABILIDAD 3.1 VARIABLES ALEATORIAS Las variables aleatorias son una transformacin o funcin que asignan uny slo un valor numrico a cada resultado de un experimento. Variables aleatorias discretas: comprenden reglas o modelos de probabilidad para asignar o generar slo valores diversos (no mediciones fraccionarias). Variables aleatorias continuas: 3.2 DISTRIBUCION BINOMIAL Una distribucin de probabilidad ampliamente utilizada de una variable aleatoria discreta es la distribucin binomial. Esta describe varios procesos de inters para los administradores. Describe datos discretos, resultantes de un experimento denominado proceso de Bernoulli en honor del matemtico suizo Jacob Bernoulli, quien vivi en el siglo XVII. Empleo del proceso de Bernoulli. Podemos servirnos de los resultados de un nmero fijo de lanzamientos de una moneda como ejemplo de un proceso de Bernoulli. Este proceso lo describimos as: 1. Cada ensayo ( cada lanzamiento, en nuestro caso) tiene slo dos resultados posibles: lado A o lado B, s o no, xito o fracaso. 2. La probabilidad del resultado de cualquier ensayo (lanzamiento) permanece fija con el tiempo. Tratndose de una moneda la probabilidad de que salga de el lado A sigue siendo de 0.5 en cada lanzamiento, cualquiera que sea el nmero de veces que la moneda sea arrojada. 3. Los ensayos son estadsticamente independientes, es decir, el resultado de un lanzamiento no afecta al de cualquier otro lanzamiento. Cada proceso de Bernoulli tiene su propia probabilidad caracterstica. Pongamos el caso en que siete dcimas partes de las personas que solicitaron cierto tipo de empleo pasaron la prueba. Diremos entonces que la probabilidad caracterstica fue de 0.7 pero podemos describir los resultados de la prueba como un proceso de Bernoulli slo si tenemos la seguridad de que la

proporcin de los que fueron aprobados permaneci constante con el tiempo. Des de luego, la otra caracterstica del proceso de Bernoulli tambin deber ser satisfecha. Cada prueba deber arrojar tan slo dos resultados (xito o fracaso= y los resultados de las pruebas habrn de ser estadsticamente independientes. En un lenguaje ms formal, el smbolo p representa la probabilidad de un xito y el smbolo q ( 1p ) representa la probabilidad de un fracaso. Para representar cierto nmero de xitos, utilizaremos el smbolo r y para simbolizar el nmero total de ensayos emplearemos el smbolo n. Entonces tenemos que : P Q r n Probabilidad de xito. Probabilidad de fracaso. Nmero de xitos deseados. Nmero de ensayos efectuados.

Existe una frmula binomial: Probabilidad de r xitos en n ensayos es : N! / R! (N-R)! PR QN-R Recordemos que el smbolo factorial! Significa por ejemplo que es 3! = 3*2*1 = 6 Los matemticos definen 0! = 1. 3.3 DISTRIBUCION NORMAL La Distribucin Normal: una distribucin de una variable aleatoria continua. Una muy importante distribucin continua de probabilidad es la distribucin normal. Varios matemticos intervinieron en su desarrollo entre ellos figura el astrnomo del siglo XVIII Karl Gauss, a veces es llamada en sus honor la distribucin de Gauss. Caractersticas de la distribucin normal de la probabilidad. 1. La curva tiene un solo pico, por consiguiente es unimodal. Presenta una forma de campana. 2. La media de una poblacin distribuida normalmente se encuentra en el centro de su curva normal. 3. A causa de la simetra de la distribucin normal de probabilidad, la mediana y la moda de la distribucin tambin se hallan en el centro, por tanto en una curva normal, la media, la mediana y la moda poseen el mismo valor.

1 Gua Estadstica 7
4. Las dos colas (extremos) de una distribucin normal de probabilidad se extienden de manera indefinida y nunca tocan el eje horizontal. reas bajo la curva normal. El rea total bajo la curva normal ser de 1.00 por lo cual podemos considerar que las reas bajo la curva son probabilidades. El valor de Z. Z= Nmero de desviaciones estndar de x respecto a la media de esta distribucin. Z= x-m / s X=valor de la variable aleatoria que nos interesa. m = media de la distribucin de esta variable aleatoria. s = desviacin estndar de esta distribucin. Las variables aleatorias distribuidas en forma normal asumen muchas unidades diferentes de medicin, por lo que hablaremos de forma estndar y les daremos el smbolo de Z.

UNIDAD IV TIPOS DE MUESTREO 4.1 TIPOS DE MUESTREO Los autores proponen diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en general pueden dividirse en dos grandes grupos: mtodos de muestreo probabilsticos y mtodos de muestreo no probabilsticos. Muestreo probabilstico: Los mtodos de muestreo probabilsticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamao n tienen la misma probabilidad de ser elegidas. Slo estos mtodos de muestreo probabilsticos nos aseguran la representatividad de la muestra extrada y son, por tanto, los ms recomendables. Dentro de los mtodos de muestreo probabilsticos encontramos los siguientes tipos: El mtodo otorga una probabilidad conocida de integrar la muestra a cada elemento de la poblacin, y dicha probabilidad no es nula para ningn elemento.

Los mtodos de muestreo no probabilsticos no garantizan la representatividad de la muestra y por lo tanto no permiten realizar estimaciones inferenciales sobre la poblacin. (En algunas circunstancias los mtodos estadsticos y epidemiolgicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilistico, por ejemplo los estudios de casocontrol, donde los casos no son seleccionados aleatoriamente de la poblacin.) Entre los mtodos de muestreo probabilsticos ms utilizados en investigacin encontramos: - Muestreo aleatorio simple: El procedimiento empleado es el siguiente: Se asigna un nmero a cada individuo de la poblacin a travs de algn medio mecnico (bolas dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamao de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la poblacin que estamos manejando es muy grande. Ejemplo: formar el equipo de ftbol de la universidad seleccionando 11 boletas de una urna con el nombre de todos los alumnos de la universidad. - Muestreo aleatorio sistemtico: Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i, que es un nmero elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamao de la poblacin entre el tamao de la muestra: k= N/n. El nmero i que empleamos como punto de partida ser un nmero al azar entre 1 y k. El riesgo este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la poblacin. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 ltimos mujeres, si empleamos un muestreo aleatorio sistemtico con k=10 siempre seleccionaramos o slo hombres o slo mujeres, no podra haber una representacin de los dos sexos. - Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamao dado de la muestra. Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a alguna caracterstica (se puede estratificar, por ejemplo, segn la profesin, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de inters

1 Gua Estadstica 9
estarn representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarn parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la poblacin. (Tamao geogrfico, sexos, edades,...). La distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin, y puede ser de diferentes tipos: Afijacin Simple: A cada estrato le corresponde igual nmero de elementos mustrales. Afijacin Proporcional: La distribucin se hace de acuerdo con el peso (tamao) de la poblacin en cada estrato. Afijacin Optima: Se tiene en cuenta la previsible dispersin de los resultados, de modo que se considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que no se suele conocer la desviacin. - Muestreo aleatorio por conglomerados: Los mtodos presentados hasta ahora estn pensados para seleccionar directamente los elementos de la poblacin, es decir, que las unidades mustrales son los elementos de la poblacin. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la poblacin que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son reas geogrficas suele hablarse de "muestreo por reas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamao muestral establecido) y en investigar despus todos los elementos pertenecientes a los conglomerados elegidos. Mtodos de muestreo no probabilsticos A veces, para estudios exploratorios, el muestreo probabilstico resulta excesivamente costoso y se acude a mtodos no probabilsticos, aun siendo conscientes de que no sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra extrada sea representativa, ya que no todos los sujetos de la poblacin tienen la misma probabilidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea representativa. - Muestreo por cuotas: Tambin denominado en ocasiones "accidental". Se asienta

generalmente sobre la base de un buen conocimiento de los estratos de la poblacin y/o de los individuos ms "representativos" "adecuados" para los fines de la investigacin. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad de aqul. En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de individuos que renen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 aos, de sexo femenino y residentes en Gijn. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas caractersticas. Este mtodo se utiliza mucho en las encuestas de opinin. - Muestreo opintico o intencional: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusin en la muestra de grupos supuestamente tpicos. Es muy frecuente su utilizacin en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. - Muestreo casual o incidental: Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los individuos de la poblacin. El caso ms frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fcil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos). - Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones

You might also like