You are on page 1of 68

Universidad Central de Venezuela Facultad de Agronoma Ctedra de Estadstica

ESTADSTICA I 2012
M. Sc. Raquel Mayela Parra
parrar@agr.ucv.ve 1

Universidad Central de Venezuela Facultad de Agronoma Ctedra de Estadstica

OBJETIVO 1-tema 1 IMPORTANCIA DE LA ESTADSTICA


Raquel Mayela Parra
parrar@agr.ucv.ve 2

OBJETIVO 1- tema 1 IMPORTANCIA DE LA ESTADSTICA


Definicin de Estadstica. Importancia de la Estadstica en el campo agronmico. Conceptos bsicos. Escalas de medicin. Anlisis Exploratorio de datos: Recoleccin, Tabulacin y Representacin Grficas de datos univariados. Mtodos de agrupacin de datos: Diagramas de Tallo y Hoja. Distribucin de Frecuencias para datos numricos continuos y discretos. Histogramas y Polgonos de frecuencias. Formas, Simetra y Curtosis. Interpretacin de las representaciones grficas. Objetivos Especficos Aplicar e interpretar las diferentes formas de recolectar, organizar y presentar datos de acuerdo a la escala de medicin. Ponderacin: 10%

DEFINICIONES DE ESTADSTICA
Es

una rama de la matemtica aplicada, que tiene por objeto la recoleccin, organizacin, interpretacin, anlisis y presentacin de datos numricos sujetos a variacin. La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.

P O C RE

R A IL

ANALIZAR

ESTADSTICA
ORGANIZAR
5

INTE RPR E

TAR

DEFINICIONES DE ESTADSTICA
Podramos por tanto clasificar la Estadstica en: DESCRIPTIVA, cuando los resultados del anlisis no pretenden ir ms all del conjunto de datos, e INFERENCIAL cuando el objetivo del estudio es derivar las conclusiones obtenidas a un conjunto de datos ms amplio,

DEFINICIONES DE ESTADSTICA
Es decir que,
La

Estadstica DESCRIPTIVA: Describe, analiza y representa un grupo de datos utilizando mtodos numricos y grficos que resumen y presentan la informacin contenida en ellos. La Estadstica INFERENCIAL: Apoyndose en el clculo de probabilidades y a partir de datos muestrales, efecta estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.

CONCEPTOS BSICOS
POBLACIN O CONJUNTO UNIVERSAL

Conjunto de elementos con caractersticas similares presentes en un espacio definido y en un tiempo determinado. POBLACIN ESTADSTICA

Conjunto de DATOS numricos que corresponden a la medicin o conteo de alguna caracterstica de los elementos de una poblacin en un espacio definido y en un tiempo determinado.

CONCEPTOS BSICOS
MUESTRA

Subconjunto representativo de una poblacin.

CONSTANTE

Si el valor de una variable toma igual valor para todos los elementos de una poblacin, este se denomina constante.

CONCEPTOS BSICOS
VARIABLE
Caractersticas

que le son comunes a los elementos de una poblacin y que varan de uno a otro.

Por ejemplo: el peso de cada uno de nosotros, el promedio de calificaciones de los integrantes de esta seccin de clase, el nmero de horas que le dedicamos a leer la prensa semanalmente, el nmero de horas que le dedicamos a navegar en internet.

OBSERVACIN

El valor que toma la variable en un momento determinado.

CONCEPTOS BSICOS
PARMETRO

Funcin definida sobre los valores numricos de caractersticas medibles de una poblacin. Valor que caracteriza a una poblacin como un todo. ESTADSTICO

Funcin

definida sobre los valores numricos de una muestra. Valor que caracteriza a una muestra.

Los PARMETROS son constantes y los ESTADSTICOS son variables.

P O C RE

R A IL

ANALIZAR

ESTADSTICA
ORGANIZAR
12

INTE RPR E

TAR

DEFINICIONES DE ESTADSTICA

CENSOS:

Cuando se estudia TODA la poblacin.

MUESTREO: cuando se estudian porciones representativas de una poblacin .

CONCEPTOS BSICOS
MUESTRA AL AZAR SIMPLE
Es

aquella que se selecciona cuando a cada elemento de la poblacin se le asigna la misma probabilidad de formar parte de la muestra.

Por ejemplo:
En

un galpn de conejos para engorde se desea de un lote de 50 animales tomar el 16% para estudiar su peso. Se procede dndole a cada una de los animales la misma probabilidad de ser parte de la muestra.

MUESTRA AL AZAR SIMPLE

MUESTRA AL AZAR SIMPLE

16 2

4 3

87 5

MUESTRA AL AZAR SIMPLE

1 5

2 7

8 3

CONCEPTOS BSICOS
MUESTRA ESTRATIFICADA
Es

aquella que se selecciona cuando los elementos de la poblacin se clasifican en funcin de los objetivos mismos del muestreo y luego de cada estrato se selecciona una muestra al azar simple.

Es importante sealar que no considerar el o los criterios de estratificacin podra afectar el comportamiento de la variable bajo estudio.

CONCEPTOS BSICOS
Por ejemplo:

MUESTRA ESTRATIFICADA

Se desea estudiar la produccin de leche de un rebao compuesto por varias razas.

Supongamos que de un rebao de 200 animales debemos extraer una muestra de 20 animales.

MUESTRA ESTRATIFICADA
3 0 17 0 4 2 13 6 1 22 27 3 4 85 172 3 1 1 2 1 2 5 10 23 12 4 310 16 2 1 11 19 6 121 13 218 9 12 16 23 1 1 25 19 1 7 5 1 4 2717 8 8 13 15 2 4 29 9 7 20 5 3 7 23 24 14 18 19 15 21 25 2228 20 30 9 6 27 11 2 26 16 15 9 7 11 1 14 5 7 13 17 10 1 8 1 15 17 2 3 1 12 2 26 4 22 8 2 9 19 16 4 4 12 6 5 20 8 6 4 13 15 16 3 9 10 7 8 12 23 11 7 10 11 186 3 1410 13 1 1 16 14 15 19 3 4 1 26 7 16 18 20 26 2 24 5 20 2 17 257 3 3 218 8 1 3 21 22 23 19 7 30 17 2 2 2 17 9 23 23 28 21 10 3 21 20 16 6 19 29 15 11 10 8 4 8 1 9 12 1 4 25 25 12 5 6 7 27 3 2 1 1 1 4 2 2 13 4 20 33 3 1

POBLACIN

MUESTRA
20 13 6 4 1 22 1 3 4 23 12 4 21 185 172 3 2 5 10 13 16 21 231019 1 11 6 2 1 1 1 2 9 5 19 12 16 8 1 8 1 7 5 27 1 8 1 15 17 4 20 5 3 7 24 29 15 2324 14 1819 9 7 3 2125 2 2 22 2820 30 16 9 6 1 7 11 26 1 14 5 7 15 13 17 0 1 2 3 1 12 9 17 26 4 22 8 9 7 11 4 2 8 4 6 5 1 15 8 6 2 16 19 16 3 10 12 8 20 9 10 11 7 5 4 13 13 12 11 1 23 6 3 1410 18 1 7 14 15 19 1 16 3 4 16 18 20 26 2 24 1 26 7 0 17 25 2 52 18 7 2 3 9 1 22 21 8 3 22 1 3 7 1 2 9 20 16 23 30 17 213 27 8 3 0 1 1 2 2 0 1415 11 8 1 6 9 6 1 7 2 29 1 3 8 1 5 3 5 9 2 4 12 1 4 2 22 5 3 1 0 1 2413 1 23 23

17

27

20 27

33
21

MUESTRA
20 13 6 4 1 22 1 3 4 23 12 4 21 185 172 3 2 5 10 13 16 21 231019 1 11 6 2 1 1 1 2 9 5 19 12 16 8 1 8 1 7 5 27 1 8 1 15 17 4 20 5 3 7 24 29 15 2324 14 1819 9 7 3 2125 2 2 22 2820 30 16 9 6 1 7 11 26 1 14 5 7 15 13 17 0 1 2 3 1 12 9 17 26 4 22 8 9 7 11 4 2 8 4 6 5 1 15 8 6 2 16 19 16 3 10 12 8 20 9 10 11 7 5 4 13 13 12 11 1 23 6 3 1410 18 1 7 14 15 19 1 16 3 4 16 18 20 26 2 24 1 26 7 0 17 25 2 52 18 7 2 3 9 1 22 21 8 3 22 1 3 7 1 2 9 20 16 23 30 17 213 27 8 3 0 1 1 2 2 0 1415 11 8 1 6 9 6 1 7 2 29 1 3 8 1 5 3 5 9 2 4 12 1 4 2 22 5 3 1 0 1 2413 1 23 23

17

27

20 27

33
22

MUESTRA
20 13 6 4 1 22 1 3 4 23 12 4 21 185 172 3 2 5 10 13 16 21 231019 1 11 6 2 1 1 1 2 9 5 19 12 16 8 1 8 1 7 5 27 1 8 1 15 17 4 20 5 3 7 24 29 15 2324 14 1819 9 7 3 2125 2 2 22 2820 30 16 9 6 1 7 11 26 1 14 5 7 15 13 17 0 1 2 3 1 12 9 17 26 4 22 8 9 7 11 4 2 8 4 6 5 1 15 8 6 2 16 19 16 3 10 12 8 20 9 10 11 7 5 4 13 13 12 11 1 23 6 3 1410 18 1 7 14 15 19 1 16 3 4 16 18 20 26 2 24 1 26 7 0 17 25 2 52 18 7 2 3 9 1 22 21 8 3 22 1 3 7 1 2 9 20 16 23 30 17 213 27 8 3 0 1 1 2 2 0 1415 11 8 1 6 9 6 1 7 2 29 1 3 8 1 5 3 5 9 2 4 12 1 4 2 22 5 3 1 0 1 2413 1 23 23

17

27

20 27

33
23

COMPOSICIN DE UNA MUESTRA ESTRATIFICADA REPRESENTATIVA del 10%N; n=20


# DE ANIMALES RAZA POBLACION MUESTR A

11 12 20 6 1

33 17 30 23 27 20 27 23

3 2 3 2 3 2 3 2

9
2 7 22

30 5 13

23 15 15 13 8 8

17

P O C RE

R A IL

ANALIZAR

ESTADSTICA
ORGANIZAR
25

INTE RPR E

TAR

ESCALAS DE MEDICIN ORGANIZAR


Medir una variable trae como consecuencia directa el pensar que tipo de respuesta tenemos bajo estudio. En el nivel ms bajo de abstraccin, podemos pensar que cualquier variable puede ser clasificada en cualitativa o cuantitativa. Es decir que, puede medirse como datos categricos o como datos mtricos.

ESCALAS DE MEDICIN
Variables cualitativasdatos categricos
Color de las flores

Estado del tiempo

Direccin del viento Estado de nimo

ESCALAS DE MEDICIN
Variables cuantitativasdatos mtricos

Tiempo (Duracin)

Concentraciones

Caudal

Temperatura

Sin embargo a un nivel de abstraccin ms elevado podemos decir que cualquier medicin puede clasificarse como medida en cuatro tipos de escalas, a saber:

Escala nominal
En este tipo de escala, slo se le asigna un nombre a cada una de las posibles categoras de medicin que se realiza. Por ejemplo: cuando se evala el color de las flores de una especie,
rojo, rosado, moteado y blanco, en este caso no existe ningn tipo de relacin de jerarqua entre las distintas categoras.

Podramos decir que con este tipo de escala lo que hacemos es los asignar valores de la respuesta en clases o categoras.

Escala ordinal
En este tipo de escala tambin se le asigna un nombre a cada una de las posibles categoras de medicin que se realiza, pero en este caso existe una relacin de jerarqua, un cierto orden, entre las distintas categoras. Razn por la cual hay una relacin de importancia entre categoras.
Por ejemplo: El grado de recuperacin de un paciente al aplicarle un
tratamiento, en el que podemos tener como respuesta Nada, Poco, Moderado, Bueno, Muy Bueno. A veces se representan este tipo de variables en escalas numricas, por ejemplo, puntuar el dolor en una escala de 1 a 5. Debemos evitar sin embargo realizar operaciones algebraicas con estas cantidades, Un dolor de intensidad 4 no duele el doble que otro de intensidad 2!

Escala de intervalo
En este tipo de escala las respuestas no slo pueden ser ordenadas segn una relacin de importancia entre categoras, sino tambin se pueden establecer entre clases medidas de distancia, sin embargo para este tipo de medicin tanto el cero como las medidas de distancia son arbitrarios. Por ejemplo: El caso de la variable temperatura, donde
segn la escala que se utilice el cero grados tiene diferente significado.

Escala de proporcin o razn


En este tipo de escala las respuestas corresponden a los nmeros reales. Entre los valores observados de este tipo de mediciones no slo pueden establecer relaciones de igualdad, orden o jerarqua, distancia y razn; en este caso el cero es real. Por ejemplo: El caso del rea, el rendimiento y el peso.

P O C RE

R A IL

ANALIZAR

ESTADSTICA
ORGANIZAR
34

INTE RPR E

TAR

Anlisis exploratorio de datos

ANALIZAR E INTERPRETAR
Aplicacin de herramientas de observacin exploratorias e informales a los datos con el fin de obtener una primera impresin de los mismos.

Anlisis grfico

Anlisis numrico

Tcnicas de agrupacin de datos


Construccin e interpretacin de Tablas de Distribucin de Frecuencias (TDF) y Diagramas

Tabulacin de datos-tablas de distribucin de frecuencias


En el caso de variables cualitativas o cuantitativas con pocos datos:
Clase Tigres Magallanes Leones Caribes Cardenales Tiburones Aguilas fi 55 35 45 25 25 20 30

Tabulacin de datos-tablas de distribucin de frecuencias


En el caso de variables cuantitativas: Consumo de agua (m3) de 40 familias de un barrio ubicado en la zona urbana durante el mes de octubre.
Consumo de agua (m3) 4 9 3 11 13 8 18 17 23 23 8 17 25 10 12 13 16 10 21 23 15 16 18 21 17 20 29 29 6 22 10 17 6 22 18 19 23 23 18 27

Tabulacin de datos-tablas de distribucin de frecuencias


Ordenar los valores de menor a mayor

3 10 16 18 23

4 10 17 19 23

Consumo de agua (m3) 6 6 8 8 11 17 20 23 12 17 21 23 13 17 21 25 13 18 22 27

9 15 18 22 29

10 16 18 23 29

CONSTRUCCIN DE LA TDF
1. Calcular la Amplitud de Variacin AV=VMax-Vmin 2. Determinar el nmero de clases K=(5,20) 3. Calcular el Intervalo de Clases IC=AV/K 4. Construir la tabla siguiente:

CONSTRUCCIN DE LA TDF
Ttulo: Tabla de distribucin de frecuencias del consumo de agua (m3) de 40 familias de un barrio ubicado en la zona urbana durante el mes de octubre.
k 1 2 3 4 5 Li CC Ls fi fr Fi Fr

REPRESENTACIONES GRFICAS

ANALIZAR E INTERPRETAR
El aserto una imagen vale ms que mil palabras se puede aplicar al mbito de la estadstica descriptiva diciendo que un grfico bien elaborado vale ms que mil tablas de frecuencias.

HISTOGRAMA Y POLGONO DE FRECUENCIAS

Simetria de la distribucin de un conjunto de datos

Simtrica

Simetria de la distribucin de un conjunto de datos

Asimtrica positiva

Simetria de la distribucin de un conjunto de datos

Asimtrica negativa

kurtosis de la distribucin de un conjunto de datos

Platicrtica

kurtosis de la distribucin de un conjunto de datos

Mesocrtica

kurtosis de la distribucin de un conjunto de datos

Leptocrtica

POLGONO DE FRECUENCIAS ACUMULADAS U OJIVA

Otras representaciones grficas univariadas

Grficos para variables cualitativas

Diagrama de sectores (torta)

Grficos para variables cualitativas

Diagrama de sectores (torta)

Grficos para variables cualitativas

Diagrama de barras

Grficos para variables cualitativas

Pictogramas

Grficos para variables cuantitativas

Casos en los que NO se deben utilizar los Grficos de dispersin XY o scatterplots


Estatura y peso de 4 estudiantes de Estadstica
250 200 150 158 100 50 55 0 1 2 52 3 60 4 162 168 195

80

Estudiante
Estatura (cm) Peso (kg)

Grficos para variables cuantitativas

Casos en los que NO se deben utilizar los Grficos de dispersin XY o scatterplots


Estatura y peso de 4 estudiantes de Estadstica
250 200 150 158 100 50 55 0 1

X
162 52 2 3

168

195

60 4

80

Estudiante

Estatura (cm)

Peso (kg)

Grficos para variables cuantitativas

Grficos de barras
Estatura y peso de 4 estudiantes de Estadstica
250 200 150 100 50 0 1 158 162 168 195

55 2

52 3

60

80

Estudiante Estatura (cm) Peso (kg)

Algunas representaciones grficas bivariadas

Grficos para variables cual.-cuant.

Grficos para variables cual.-cuant.

Grficos para variables cual.-cuant.

Diagrama de caja o box-plot por categora


28 26 24 22

TMIN

20 18 16 14 12 10

N= Automtica ESTACIN Convencional

Grficos para variables cuant.-cuant.


40

Grficos de dispersin XY o scatterplots


Concentracin de ozono 30

.
Y=f(X) .

20

. .
40 60 80 100

20

10

Temperatura

Ejemplo -Estudio conjunto de dos variables


En cada fila tenemos los datos de un individuo, cada columna representa los valores que toma una variable sobre cada individuo.

Altura ( cm)
162 154 180 158 171 169 166 176 163 ...

Peso ( kg)
61 60 78 62 66 60 54 84 68 ...

Dichas observaciones pueden ser representadas en un diagrama de dispersin (scatterplot). En ellos, cada individuo es un punto cuyas coordenadas son los valores de las variables.

Nuestro objetivo ser intentar reconocer a partir del mismo si hay relacin entre las variables, de qu tipo, y si es posible predecir el valor de una de ellas en funcin de la otra.

63

OBS 1 2 3 4 5 6 7 8 9 10

ALTUR A 160 183 162 184 180 183 165 189 168 150

PESO 95 88 123 100 66 98 43 90 50 44

OBS 11 12 13 14 15 16 17 18 19 20

PESO 96 99 64 49 66 87 89 42 150 180

ALTUR A 178 166 170 168 185 175 180 156 167 190

OBS 21 22 23 24 25

ALTUR A 190 169 175 184 166

PES O 120 81 90 50 79

ALTURA (cm)

DIAGRAMA DE PUNTOS 200 180 160 140 0 20 40 60 ESTUDIANTE

DIAGRAMA DE PUNTOS PESO (Kg) 180 130 80 30 0 20 40 60 ESTUDIANTE

ALTURA DE LOS E STUDIANTES DE LA SECCION 03 200 180 160


) m c ( R U T L A

140 120 1 6 11 16 21 26

E STUDIANTE

Ser lo correcto unir esos puntos?


220 170 120 70 20 0 5 10 15 20

PESO DE LOS ESTUDIANTES DE LA SECCION 03

PESO (kg)

25

30

ESTUDIANTE

Diagramas de dispersin o nube de puntos


Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersin.

100 90 80 70 60 50 40 30 140 150 160 170 180 190 200


Pesa 50 kg. Mide 161 cm. Mide 187 cm. Pesa 76 kg.

Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de dispersin.

Relacin entre variables.

100 90 80 70 60 50 40 30 140 150 160 170

e c e Par ra u t l a

l e que

a t n e m au o pes

la n co

180

190

200

You might also like