You are on page 1of 17

LA ESTADSTICA La Estadstica es una ciencia formal que estudia la recoleccin, anlisis e interpretacin de datos de una muestra representativa, ya sea

para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algn fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadstica es ms que eso, es decir, es el vehculo que permite llevar a cabo el proceso relacionado con la investigacin cientfica. Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en reas de negocios o instituciones gubernamentales. POBLACIN

En estadstica, poblacin es el conjunto de cosas, personas, animales o situaciones que tiene una o varias caractersticas o atributos comunes, por ejemplo: los habitantes de El Salvador en el presente ao, las personas menores de edad en el ao 2001; los estudiantes de la Universidad, las reacciones de un nuevo medicamento, las diferencias entre los tratamientos de diferentes formulaciones de insecticidas, entre otras. Poblacin Finita: es el conjunto compuesto por una cantidad limitada de elementos, como el nmero de especies, el nmero de estudiantes, el nmero de obreros. Poblacin Infinita: es la que tiene un nmero extremadamente grande de componentes, como el conjunto de especies que tiene el reino animal. Poblacin Real: es todo el grupo de elementos concretos, como las personas que en Europa se dedican a actividades artsticas. Poblacin Hipottica: es el conjunto de situaciones posibles imaginables en que puede presentarse un suceso, como por ejemplo las formas de reaccionar de una persona ante una catstrofe. Poblacin estable: es aquella en que sus valores o cualidades no presentan variaciones, o stas, por pequeas que sean, son despreciables, como la rotacin de la tierra o la velocidad de la luz. Poblacin inestable: es la que contienen los valores en constante cambio. Prcticamente la totalidad de las poblaciones corresponden a este tipo. El cambio de los valores se presentan en el tiempo o en el espacio.

Poblacin aleatoria: es la que presenta cambios en sus colores debidos al azar, sin que exista una causa aparente, como las variaciones en el contenido del producto. Poblacin dependiente: es la que cambia sus valores debido a una causa determinada y medida. La dependencia puede ser total, como las variaciones obtenidas en una funcin matemtica, la regresin lineal, por ejemplo. La dependencia es parcial cuando la causa influye en la variable dependiente en una proporcin menor a la total, por ejemplo, el incremento en las ventas proveniente de una mayor gasto publicitario. Esta ltima influencia no es proporcional. Poblacin binomial es aquella en la que se busca la presencia o ausencia de una caracterstica, por ejemplo, la presencia de ozono en el aire. Poblacin polinomial: es la que tiene varias caractersticas que deben ser definidas, medidas o estimadas, como la obediencia, la inteligencia y la edad de los alumnos de postgrado.
MUESTRA

En estadstica una muestra estadstica (tambin llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una poblacin estadstica. Las muestras se obtienen con la intencin de inferir propiedades de la totalidad de la poblacin, para lo cual deben ser representativas de la misma. Para cumplir esta caracterstica la inclusin de sujetos en la muestra debe seguir una tcnica de muestreo. En tales casos, puede obtenerse una informacin similar a la de un estudio exhaustivo con mayor rapidez y menor costo. Ejemplo La descripcin de una muestra, y los resultados obtenidos sobre ella, puede ser del tipo mostrado en el siguiente ejemplo:
Dimensin de la poblacin: Probabilidad del evento: ej. Nivel de confianza: Desviacin tolerada: ej. 5% Tamao de la muestra: ej. 270 ej. 222.222 Hombre o Resultado habitantes Mujer 50% ej. 96% ej. 196

La interpretacin de esos datos sera la siguiente: La poblacin a investigar tiene 222.222 habitantes y queremos saber cuntos son hombres o mujeres. Estimamos en un 50% para cada sexo y para el propsito del estudio es suficiente un 90% de seguridad con un nivel entre 90 - 5 y 90 + 5. Generamos una tabla de 270 nmeros al azar entre 1 y 222.222 y en un censo numerado comprobamos el gnero para los seleccionados
INDIVIDUO

Un Individuo o bien unidad Estadstica es cada uno de los elementos que componen la poblacin. hay que mencionar que cuando decimos individuo no exclusivamente nos estamos refiriendo a una persona. Vamos a ver un ejemplo, supongamos que deseamos estudiar los negocios que existen en nuestra localidad, cada Negocio es equivalente a un individuo o unidad Estadstica. porque los Negocios en total componen a la Poblacin.

VARIABLE

El conjunto de valores que constituyen un carcter estadstico se denomina variable estadstica. En trminos estrictos, se denomina variable estadstica a todo carcter cuantitativo de un individuo, mientras que los caracteres cualitativos se suelen llamar atributos.
Los atributos son aquellos caracteres que para su definicin precisan de palabras, es decir, no le podemos asignar un nmero. Por ejemplo Sexo Profesin, Estado Civil, etc. A su vez las podemos clasificar en: Ordenables: Aquellas que sugieren una ordenacin, por ejemplo la graduacin militar, El nivel de estudios, etc. No ordenables: Aquellas que slo admiten una mera ordenacin alfabtica, pero no establece orden por su naturaleza, por ejemplo el color de pelo, sexo, estado civil, etc.

VARIABLES CUALITATIVAS
Son las variables que expresan distintas cualidades, caractersticas o modalidad. Cada modalidad que se presenta se denomina atributo o categora y la medicin consiste en una clasificacin de dichos atributos. Las variables cualitativas pueden ser dicotmicas cuando slo

pueden tomar dos valores posibles como s y no, hombre y mujer o son politmicas cuando pueden adquirir tres o ms valores. Dentro de ellas podemos distinguir: Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, fuerte. Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores.

VARIABLES CUANTITATIVAS
son las que se describen por medio de nmeros, como por ejemplo el peso, Altura, Edad, Nmero De SuspensosA su vez este tipo de variables se puede dividir en dos subclases:

Variable Discreta : Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores especficos que la variable pueda asumir. Ejemplo: El nmero de hijos (1, 2, 3, 4, 5). Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario. Solamente se est limitado por la precisin del aparato medidor, en teora permiten que siempre exista un valor entre dos variables.
No obstante en muchos casos el tratamiento estadstico hace que a variables discretas las trabajemos como si fuesen continuas y viceversa.

Variables unidimensionales:slo recogen informacin sobre una caracterstica (por ejemplo: edad de los alumnos de una clase). Variables bidimensionales:recogen informacin sobre dos caractersticas de la poblacin (por ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales:recogen informacin sobre tres o ms caractersticas (por ejemplo: edad, altura y peso de los alumnos de una clase).
ESTADSTICA DESCRIPTIVA

La Estadstica es la ciencia que se encarga de recolectar datos de una poblacin o muestra. Los conceptos estadsticos se han trabajado intuitivamente desde la antigedad, las primeras culturas recopilaron datos poblacionales por medio de censos como los realizados Egipto y por Moiss (segn consta la Biblia) y el empadronamiento que fue efectuado por los romanos en Judea, slo a partir del siglo pasado Adolfo Quetelec (1796-1874) cre diferentes mtodos para realizar observaciones con el fin de determinar el tipo de datos que regulan algunos fenmenos. La Estadstica descriptiva registra los datos en tablas y los representa en grficos. Calcula los parmetros estadsticos (medidas de centralizacin y de dispersin), que describen el conjunto estudiado. DISTRIBUCIN DE FRECUENCIAS Presenta los valores de los datos y la frecuencia con que se presentan, al ser mostrados en una tabla, los valores de los datos de los datos se presentan en orden y, por lo general, el valor del dato ms bajo aparece en la parte inferior de la tabla. Una distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente. Cuando se dispone de gran nmero de datos, es til el distribuirlos en clases o categoras y determinar el nmero de individuos pertenecientes a cada clase, que es la frecuencia de clase. Una ordenacin tabular de los datos en clases, reunidas las clases y con las frecuencias correspondientes a cada una, se conoce como una distribucin de frecuencias o tabla de frecuencias. CARACTERSTICAS Una distribucin de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una caracterstica de los [datos] y muestra el nmero de observaciones del conjunto de datos que caen en cada una de las clases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el nmero de veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada. La tabla de frecuencias puede representarse grficamente en un histograma (Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores.

La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.

TIPOS DE FRECUENCIA
1. La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N. f1+f2+f3+....+fn=N Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria. 2. La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por ni. La suma de las frecuencias relativas es igual a 1. 3. La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fi. 4. La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento. Ejemplo Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta. xi Recu ento I fi Fi ni Ni

27

0.032

0.032

28 29 30 31 32 33 34

II IIII-I IIII-II IIII-III III III I

2 6 7 8 3 3 1 31

3 9 16 24 27 30 31

0.065 0.194 0.226 0.258 0.097 0.097 0.032 1

0.097 0.290 0.516 0.774 0.871 0.968 1

DISTRIBUCIN DE FRECUENCIAS AGRUPADAS La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denomina dos clases. A cada clase se le asigna su frecuencia correspondiente. Lmites de la clase Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase. Amplitud de la clase La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. Marca de clase La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros. CONSTRUCCIN DE UNA TABLA DE DATOS AGRUPADOS 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1. se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48. 2. Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos de queramos poner. Es conveniente que el nmero de intervalos oscila entre 6 y 15.

En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50: 5 = 10 intervalos. Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no pertenece intervalo, se cuenta en el siguiente intervalo. ci [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40) [40, 45) [45, 50) 2.5 fi 1 Fi 1 ni 0.0 25 0.0 25 0.0 75 0.0 75 0.0 75 0.1 50 0.1 75 0.2 50 0.1 00 0.0 50 1 Ni 0.0 25 0.0 50 0.1 25 0.2 00 0.2 775 0.4 25 0.6 00 0.8 50 0.9 50 1

7.5

12. 5 17. 5 22. 5 27. 5 32. 5 37. 5 42. 5 47. 5

11

17

24

10

34

38

40

40

GRFICAS ESTADSTICAS DIAGRAMA DE BARRAS

Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto. Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas. Los datos se representan mediante barras de una altura proporcional a la frecuencia. Ejemplo Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguneo ha dado el siguiente resultado: Grupo sanguneo A B AB 0 fi 6 4 1 9 20

POLGONOS DE FRECUENCIAS VARIABLES DISCRETAS Los polgonos de frecuencias se realiza trazando los puntos que representan las frecuencias y unindose mediante segmentos. Ejemplo Las temperaturas en un da de otoo de una ciudad han sufrido las siguientes variaciones: Hora 6 9 Temperatura 7 12

12 15 18 21 24

14 11 12 10 8

VARIABLES CONTINUAS O DATOS AGRUPADOS Los polgonos de frecuencias se realiza trazando los puntos formados las marcas de clase y las frecuencias, y unindose mediante segmentos. Tambin se puede construir el polgono de frecuencia uniendo los puntos medios de cada rectngulo de un histograma. Ejemplo El peso de 65 personas adultas viene dado por la siguiente tabla: ci [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120) 55 65 75 85 95 110 115 fi 8 10 16 14 10 5 2 65 Fi 8 18 34 48 58 63 65

DIAGRAMA DE SECTORES Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un crculo, de modo que el ngulo de cada sector es proporcional a la frecuencia absoluta correspondiente. El diagrama circular se construye con la ayuda de un transportador de ngulos. Ejemplo En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natacin, 9 juegan al ftbol y el resto no practica ningn deporte.

Alumnos Baloncesto Natacin Ftbol Sin deporte Total HISTOGRAMA 12 3 9 6 30

ngulo 144 36 108 72 360

Un histograma es una representacin grfica de una variable en forma de barras. Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han agrupado en clases. En el eje abscisas se construyen unos rectngulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados. POLGONO DE FRECUENCIA Para construir el polgono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectngulo. Ejemplo

El peso de 65 personas adultas viene dado por la siguiente tabla: ci [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120) 55 65 75 85 95 105 115 fi 8 10 16 14 10 5 2 65 Fi 8 18 34 48 58 63 65

HISTOGRAMA Y POLGONO DE FRECUENCIAS ACUMULADAS Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente polgono. HISTOGRAMAS CON INTERVALOS DE AMPLITUD DIFERENTE Para construir unos histogramas con intervalo de amplitud diferente tenemos que calcular las alturas de los rectngulos del histograma. A. es la altura del intervalo B.es la frecuencia del intervalo C. es la amplitud del intervalo Ejemplo En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas pr un grupo de 50 alumnos. fi [0, 5) [5, 7) 15 20 hi 3 10

[7, 9) [9, 10)

12 3 50

6 3

MEDIDAS DE POSICIONAMIENTO CENTRAL MEDIA Vamos a estudiar en este apartado los distintos tipos de media que hemos detallado en el apartado anterior. La media aritmtica de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos pory se calcula mediante la expresin: xi representa el valor de la variable o en su caso la marca de clase. Propiedades: Si multiplicamos o dividimos todas las observaciones por un mismo nmero, la media queda multiplicada o dividida por dicho numero. Si le sumamos a todas las observaciones un mismo nmero, la media aumentar en dicha cantidad. Adems de la media aritmtica existen otros conceptos de media, como son la media geomtrica y la media armnica. Media geomtrica: La media geomtrica de N observaciones es la raz de ndice N del producto de todas las observaciones. La representaremos por G. Solo se puede calcular si no hay observaciones negativas. Es una medida estadstica poco o nada usual. Media armnica: La media armnica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H Al igual que en el caso de la media geomtrica su utilizacin es bastante poco frecuente. MEDIANA La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente o decreciente, el valor que divide en dos partes la muestra. Para calcular la mediana debemos tener en cuenta si la variable es discreta o continua. Clculo de la mediana en el caso discreto: Tendremos en cuenta el tamao de la muestra.

Si N es Impar, hay un trmino central, el trmino que ser el valor de la mediana. Si N es Par, hay dos trminos centrales,la mediana ser la media de esos dos valores Veamos un ejemplo. N Impar N par

1,4,6,7,8,9,12,16,20, 24,25,27 N=12

1,4,6,7,8,9,12,16,20, 24,25,27,30 N=13

Trminos Centrales Trmino Central el 7 el 6 y 7 9 y 12 , 12

Me=12 Me=9+12/2=10,5

Clculo de la mediana en el caso contino: Si la variable es continua, la tabla vendr en intervalos, por lo que se calcula de la siguiente forma: Nos vamos a apoyar en un grfico de un histograma de frecuencias acumuladas. MODA La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que ms se repite, es la nica medida de centralizacin que tiene sentido estudiar en una variable cualitativa, pues no precisa la realizacin de ningn clculo. Por su propia definicin, la moda no es nica, pues puede haber dos o ms valores de la variable que tengan la misma frecuencia siendo esta mxima. En cuyo caso tendremos una distribucin bimodal o polimodal segn el caso. Por lo tanto el clculo de la moda en distribuciones discretas o cualitativas no precisa de una explicacin mayor; sin embargo, debemos detenernos un poco en el clculo de la moda para distribuciones cuantitativas continuas. MEDIDAS DE POSICIONAMIENTO NO CENTRAL CUARTILES Medida de localizacin que divide la poblacin o muestra en cuatro partes iguales.

Q1= Valor de la variable que deja a la izquierda el 25% de la distribucin. Q2= Valor de la variable que deja a la izquierda el 50% de la distribucin = mediana. Q3= Valor de la variable que deja a la izquierda el 75% de la distribucin. Al igual que ocurre con el clculo de la mediana, el clculo de estos estadsticos, depende del tipo de variable. Caso I: Variable cuantitativa discreta: En este caso tendremos que observar el tamao de la muestra: N y para calcular Q1 o Q3 procederemos como si tuvisemos que calcular la mediana de la correspondiente mitad de la muestra. Caso II: Variable cuantitativa continua: En este caso el clculo es ms simple:, sea la distribucin que sigue: (li-2-Li-1) (Li-1-Li) ni-1 ni Ni -1 Ni

DECILES Medida de localizacin que divide la poblacin o muestra en 10 partes iguales No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver slo para las variables continuas. dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k10 % de la distribucin. [Li-2 -- Li-1) [Li-1 -- Li) ni-1 ni Ni-1 Ni

Intervalo donde se encuentra el Decil correspondiente:

k = 1 .. 9 PERCENTILES Medida de localizacin que divide la poblacin o muestra en 100 partes iguales No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver slo para las variables continuas.

pk = Percentil k-simo es aquel valor de la variable que deja a su izquierda el k % de la distribucin. [Li-2 -- Li-1) [Li-1 -- Li) ni-1 ni Ni-1 Ni

Intervalo donde se encuentra el percentil correspondiente: k=1 .. 99 Ejemplo: Como se puede observar la forma de calcular estas medidas es muy similar a la del clculo de la mediana. Veamos el clculo de algunas de estas medidas en el ejemplo que estamos estudiando. Vamos a calcular Q1,Q3, d3, y p45 Li-1 45 55 65 75 85 Li 55 65 75 85 95 ni 6 10 19 11 4 Ni 6 16 35 46 50

Clculo de Q1: Buscamos en la columna de las frecuencias Acumuladas el valor que supere al 25% de N=50, corresponde al 2 intervalo.(50/4=12.5)

Anlogamente calculemos Q3, Buscamos ahora en la misma columna el correspondiente al 75 %de N que en este caso es el 4 intervalo (3.50/4=37.5) Veamos ahora el decil 3. (Corresponde al 30 % 3 50 / 10 = 15) sera el 2 intervalo. Por ltimo veamos el percentil 45 (4550/100 = 22.5) Corresponde al intervalo 3

You might also like