You are on page 1of 3

Estadstica: Conjunto de mtodos cientficos para la recopilacin, organizacin, resumen, presentacin y anlisis de datos, o anlisis de hechos, que se presten

a valoracin numrica; tales como son: Caractersticas biolgicas o sociolgicas, fenmenos fsicos, produccin, calidad, poblacin, riqueza, impuestos, cosechas, etc. Informacin numrica o cuantitativa sobre un tema, para un cierto periodo, y organizada de tal forma que muestre los aspectos ms significativos y de mayor inters. Persigue:

Elementos del Anlisis Estadstico: Observaciones (base), Caractersticas y Unidades de estudio Salario semanal promedio de trabajadores en el ao 2007 en la zona de los Santos. UE (trabajador), C (salario), Ob (Valor) Poblacin (N): Conjunto de animales, personas, objetos, empresas o cualquier otra cosa que es objeto de un estudio. Total de agregados de las unidades de estudio. Es necesario ver tiempos y lugares, cuando y donde.

Distribuciones de frecuencia: Variables/Atributos Ordenamiento o arreglo de datos en categoras o clases que muestran para cada uno de esos datos el nmero de elementos que contiene. Datos estadsticos: Medir Contar (forma especial de medir) Caractersticas de lo que se mide:

1. 2.

3.

Dar mayor importancia a los hechos que a los conceptos abstractos. No expresar los hechos en trminos de sentimientos o ideas, sino utilizar grficas o diagramas derivados de resultados especficos observados. Tomar decisiones en base de condiciones establecidas, mediante anlisis estadsticos efectuados.

1. Caractersticas de la poblacin: Finitas: # limitado de elementos Infinitas: # limitado (generalmente tiene perodos de tiempo) Muestreo: Procedimiento rpido, barato y en ocasiones el nico posible que permite inferir datos, debe ser homognea (representativa-especfica), por lo que se deben evitar los SESGOS (fallas de seleccin). Formas para realizar un muestreo:

Variables (cuantitativo): como peso, longitud, edad, caudal. Clases: Variable continua: es aquella que puede tomar cualquier valor en un intervalo (peso, estatura, velocidad, edad). Variable discreta: solo puede tomar un nmero determinado de valores en un intervalo (goles, nmero de hijos, # de televisores). Atributo (cualitativo): como estado civil, nacionalidad. sexo,

La informacin para ser analizada estadsticamente, debe ser cuantitativa (o susceptible de ser analizada de esa forma). Pero no toda informacin cuantitativa constituye un dato estadstico. Teles. Dato estadstico: son un conjunto de nmeros referidos a una misma caracterstica, recopilados de tal forma que pueden ser comparados, analizados e interpretados. Estadstica descriptiva: Anlisis metdico de datos, simplificndolos y presentndolos en forma clara; eliminando la confusin caracterstica de los datos preliminares. Permite la elaboracin de cuadros, grficos e ndices bien calculados lo suficientemente claros. Se limita a describir los datos que se analizan, sin hacer inferencia por datos no incluidos en la muestra; analiza, estudia y describe a la totalidad de individuos de una poblacin. su finalidad es obtener informacin, analizarla, elaborarla y simplificarla lo necesario para que pueda ser interpretada cmoda y rpidamente y, por tanto, pueda utilizarse eficazmente para el fin que se desee. Proceso (pasos): 1. 2. Seleccin de caractersticas de una poblacin a estudiar. Obtencin del valor de cada individuo en los caracteres seleccionados (medicin o encuesta). Elaboracin de tablas de frecuencias, mediante la adecuada clasificacin de los individuos dentro de cada carcter. Representacin grfica de los resultados. Obtencin de parmetros estadsticos (valores que sintetizan los puntos ms importantes de una distribucin estadstica).

2.

Conteo, interpretacin de variables. 1. 2. A conveniencia: que estn disponibles y fciles de conseguir. Intencional: Se considera el juicio de un experto (tendencias subsecuentes pueden generar SESGOS). Muestra Aleatorias (Azar): se le da a cada elemento de la poblacin una probabilidad conocida de ser incluido en la muestra, el caso ms conocido es que todos los elementos tienen la misma probabilidad. (Muestreo al azar simple). Elementos descriptivos Forma: se refiere al patrn de distribucin de las diferentes variables, responde a la pregunta de cmo se comporta. Posicin: Saber alrededor de concentran los datos. Variabilidad: Generar interpretaciones puede ser: Probabilidad: incertidumbre, posibilidad, eventualidad, contingencia (relacionados con eventos de verificacin incierta) Es un valor numrico que cumple con ciertas propiedades matemticas que determinan el grado de confianza. Datos: (fuentes) Observaciones Experimentos (Diseos experimentales) Procesos repetitivos FACIL: pocos datos (tecnologa apropiada) DIFICIL: Muchos datos, diferenciar y apreciar irregularidades, anlisis y conclusiones. de frecuencias de variables cul valor se

3.

Distribuciones continuas. 1. 2.

Ordenamiento de los datos (menor a mayor o viceversa). Calcular el rango de la muestra.

3.

Evento: Observacin particular de un fenmeno (precipitacin, escorrenta, caudales) # Mayor de 3 al lanzar un dado C = {3, 4, 5, 6} NC = 4 Espacio Muestral (S): Todos los posibles resultados u observaciones de un experimento, o bien todos los eventos posibles. S2DADOS = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} NS = 11

R = Xmax Xmin 3. Calcular Intervalos de Clases (NC).

4. 5.

NC = 1.33 (ln (n) + 1), donde n es el # de valores de la muestra (Ec. De Yeujevich). 4. Calcular Amplitud de los intervalos de clase.

Estadstica Inferencial: Diseo de experimentos, teora de muestras, teora de la estimacin, etc. para hallar respuesta a interrogantes. Trabaja con muestra (subconjuntos de algunos individuos de la poblacin en estudio) para inferir aspectos relevantes de toda la poblacin. La EI provee conclusiones o inferencias, basndose en los datos simplificados y analizados; detectando las interrelaciones que puedan unirlos, leyes que los rigen y eliminando las influencias al azar, llegando a verificaciones fsicas posibles. Aspectos que influyen en la EI:

x = R/(NC 1) Definicin clsica de probabilidad: Redondeo: Sea un evento A S NA # de eventos NS cantidad de eventos totales P(A) = NA / NS, donde ambos son finitos Definicin Axiomtica de probabilidad: Condiciones: (P, funcin de probabilidad en S) Matemtico (al valor ms cercano) Hacia abajo, edad Hacia arriba, bebidas consumidas

Los valores hacia arriba y hacia abajo del redondeo se multiplican por los intervalos de clase (NC), y el valor mas cercano a el Xmax ser el redondeo apropiado. 5. Calcular los lmites de clase.

1. 2. 3. 4.

Cmo se selecciona la muestra Cmo se realiza la inferencia Qu grado de confianza se puede tener la inferencia Grado de conocimiento de estadstica, probabilidad y matemtica.

0 P(A) 1 ( A S) P(S)= 1 A1, A2, A3,, An eventos excluyentes P(A1, A2, A3,, An) = P(A1) + P(A2) + + P(An) Teoremas bsicos:

Inferior: LCIo = Xmin (x/2), si da negativo, y no hay razones negativas en las muestras en estudio, se pone cero. Superior: LCSo = LCIo + x

Se usa cuando hay problemas de: tamao del problema (millones de individuos), o es posible pero tedioso.

P() = 0% (algo sucede) P(AC) = 1 P(A), con AC complemento de A

2. 6. Clculo de las marcas de clase.

Media Aritmtica Ponderada Datos agrupados

Xp = fiXi/ fi MCo = (LCIo + LCSo)/2 (determinar la primera marca) MCi = MCi 1 + x (para calcular las siguientes) 7. Calcular las frecuencias absolutas. que 4. Mediana (MED) 3. Media geomtrica

Pm = LCIm + [(mn/100) Fa/fm+ x LCI: lmite de clases inferior donde esta el percentil Fa: Sumatoria de frecuencias absolutas hasta la clase donde esta el percenbtil, sin incluirlo. fm: frecuencia absoluta de la clase, donde esta el percentil Medicin de variabilidad

En una muestra compuesta de n datos, es la raz ensima de la productoria de los datos. XG = ( Xx)1/n

Nmero de elementos u observaciones pertenecen a la misma clase. f = ni

Valor situado en el centro de los datos ordenados de manera creciente (o decreciente). Dos formas alternativas de clculo: 8. Calcula la frecuencia absoluta relativa: MED = (Xn/2 + X(n/2) + 1)/2 para un n par Datos no agrupados:

Se puede resolver con un simple conteo entre las muestras comprendidas en los respectivos intervalos de clase.

Si los hechos no se repitieran o se repitieran sin variacin, la estadstica no tendra sentido; pero la realidad la mayora de los fenmenos se repiten y lo hacen mostrando variaciones de mayos o menor intensidad. Se persiguen dos objetivos: Descubrir las irregularidades que puedan existir en l y de resumirlas a travs de valor tpico (un promedio por ejemplo). Establecer la medida en que los datos se concentran o se dispersan alrededor de ese valor tpico, o sea, la importancia de las desviaciones de los elementos individuales respecto a ese valor representativo escogido para categorizar el grupo. La validez de un valor tpico para resumir o presentar al conjunto de datos para el cual se calculo, depende de si los datos individuales se concentran o se dispersan alrededor de el. Cuanto mas concentrados estn los datos alrededor del promedio aritmtico mucha mas confianza se tendr en este valor para caracterizar o representar el conjunto de datos. Datos: 5, 5, 5, 5, 5 Datos: 4, 5, 5, 5, 6 Datos:1, 3, 4, 7, 10 1. Suma: 25 Suma: 25 Suma: 25 Promedio: 5 Promedio: 5 Promedio: 5

freli = (f/N) x 100 MED = X((n + 1)/2) para un n impar 9. Realizar el histograma y polgono de frecuencia. Datos agrupados:

Un histograma es un grfico de barras vertical que se diferencia de los normales, pues no tiene separacin y pueden tener diferentes grosores. Frecuencia Ab vrs. Intervalos de clase Frecuencia Ab vrs. Marca de clase Frecuencia Absoluta acumulada Menor que LCS: Se van sumando las frecuencias en orden creciente. Mayor que LCI: Se van restando desde la mxima frecuencia hasta el menor. Frecuencia acumulada vrs. Intervalos de clase Interv. clase Marca de clase Frecuencia Absoluta Frecuencia Relativa

MED = ([(n+1)/2 (F + 1)]/fmed) x + LCIMED F: # de frecuencias hasta la clase que contiene la mediana (sin incluirla) Fmed: frecuencia de la clase que contiene la mediana x: amplitud de clase LCI: limite de clase inferiro de la clase que contiene la mediana. CMED = X((n + 1)/2) 5. Moda

Medidas de tendencia central Elementos descriptivos: Forma o patrn de los datos Posicin o tendencia central Dispersin o variabilidad alrededor de los valores centrales.

Medida de posicin, asociada al valor ms comn, ms tpico o ms frecuente. Valor al cual corresponde la mayor frecuencia Es una medida muy natural para describir un conjunto de datos. Como ventaja, no se ve afectada por valores altos o bajos presentes. Su limitacin, requiere de un nmero suficiente de observaciones para que se manifieste o se defina claramente. En algunos casos puede no existir, no estar definida, e incluso puede no ser nica, en estos casos, utilidad como medida de posicin central es muy reducida y resulta difcil de interpretarlas. Puede aplicarse tanto a series cuantitativas, como cualitativas (marcas, sabores, colores, etc.) Datos agrupados:

Recorrido o rango

La representacin de frecuencias y su presentacin grfica ayudan a conocer estos aspectos, sobre todo el primero. Es necesario obtener medidas de datos que resuman o condensen las caractersticas del conjunto de datos en cuanto a su posicin y variabilidad. Fines: Anlisis e interpretacin del conjunto de datos. Comparaciones entre varios conjuntos de valores.

Forma natural de apreciar la variabilidad. Diferencia entre el valor mayor y el valor menor del conjunto de datos. Es de poco uso por sus limitaciones: No considera todas las observaciones Depende sensiblemente del nmero de datos. Es muy probable que vare conforme se realicen nuevas observaciones (ya que pueden surgir datos mayores o menores a los que se tuvieron) En la prctica se utiliza solo cuando se desea una medida simple de variabilidad o cuando no se pueden hacer medidas ms complejas. Lateral de riego Xmax - Xmin 2. Desviacin media

MO = LCIMO + (1/(1 + 2)) X 1: diferencia entre frecuencia de la clase modal y la premodal. 2: diferencia entre frecuencia de la clase modal y la postmodal. Cuantilos Dividen el conjunto ordenado de datos en fracciones especficas llamadas cuantilos. Ej: la mediana divide el conjunto de datos en dos partes iguales (la mitad mayor y la otra mitad menor que su valor). Cuartiles: son valores de la variable que dividen el conjunto de datos en cuatro partes. El clculo del coeficiente de uniformidad de riego involucra el uso de cuartiles. Deciles: divisin en dcimas

Diferencia de los datos individuales respecto de un valor central tpico. La suma de las desviaciones de las observaciones con respecto a la media aritmtica siempre es cero. Casi no se utiliza debido al uso de valores absolutos. Xi X la suma de los datos es cero DM = *Xi X]/n

Medidas de Posicin (tendencia central) Tratan de resumir en un solo nmero la posicin de la distribucin. Campana/cuando la distribucin tenga una forma muy particular, las medidas de posicin no sern valores centrales. Puede expresarse en varias formas: 1. Media Aritmtica (Promedio) Simple de datos no agrupados

3. 6. Percentiles: divisin en centsimas (ms comunes) Datos no agrupados:

Varianza

La desviacin estndar se calcula a partir de su valor. Datos no agrupados: S2 = (Xi X)2/n-1 muestral

X = Xi/n en una muestra X = fiXi/n en una poblacin, donde X es la marca de clase


K

Pm = (m/100) (n + 1) M: # que indica el percentil deseado

Datos agrupados: S2 = (Xi X)2fi/n-1 Xi: marca de clase 4. Desviacin estndar

Medida de dsipersin mas utilizada en estadstica, tanto en forma descriptiva como analtica Utiliza los cuadros de las desviaciones Indica cuanto se alejan en promedio, las observaciones de la media aritmtica del conjunto. Para datos muestrales se utiliza n-1 porque de acuerdo a la estadstica de esa manera se obtiene una mejor estimacin del valor poblacional. 5. Coeficiente de variacin

You might also like