Professional Documents
Culture Documents
TEMA:
ESTADISTICA
DOCENTE:
ING. LASCANO
ESTUDIANTE:
ÁLVARO ORTIZ CORTEZ
CURSO:
VE 12
CICLO-1
ESTADISTICA
CONCEPTO:
La estadística podría definirse como la ciencia que se encarga de recopilar, organizar,
procesar, analizar e interpretar datos con el fin de deducir las características de una
población objetivo, pero esta sería solo una visión estrecha de lo que comprende esta
rama del saber. A continuación, se hace una muy breve introducción teórica al amplio
concepto de la estadística.
Definiciones
Conjunto de métodos científicos ligados a la toma, organización, recopilación,
presentación y análisis de datos, tanto para la deducción de conclusiones como para
tomar decisiones razonables de acuerdo con tales análisis.
Arte de la decisión en presencia de incertidumbre.
Ciencia que sirve para demostrar que dos personas han comido 1/2 pollo cada una,
cuando en realidad una ha comido uno y la otra ninguno.
¿Por qué la estadística?
¿Usaron la estadística Galileo, Newton y Einstein?
En ciertas ciencias (Biología, Ciencias Humanas, algunos campos de la Física, ...)
aparece el concepto de experimento aleatorio (experimento que repetido en las
"mismas condiciones" no produce el mismo resultado) y asociado al mismo el de
variable aleatoria.
Una variable no aleatoria (asociada al resultado de una experiencia que sí produce el
mismo resultado) está caracterizada por un valor para cada condición.
Una variable aleatoria está caracterizada por la llamada función densidad de
probabilidad, a partir de la cual se obtienen las probabilidades para sus posibles
valores para cada condición.
Se divide en dos áreas:
Estadística descriptiva: Trata de describir las variables aleatorias en las "muestras".
Estadística inductiva o inferencial: Trata de la generalización hacia las poblaciones de
los resultados obtenidos en las muestras y de las condiciones bajo las cuales estas
conclusiones son válidas. Se enfrenta básicamente con dos tipos de problemas:
Estimación, que puede ser puntual o por intervalos.
Contraste de hipótesis.
ESTADISTICA DESCRIPTIVA
La descripción completa de una variable aleatoria está dada por su función densidad
de probabilidad (fdp).
Afortunadamente una gran cantidad de variables de muy diversos campos están
adecuadamente descritas por unas pocas familias de fdps: binomial, Poisson, normal,
gamma, etc.
Dentro de cada familia, cada fdp está caracterizada por unos pocos parámetros,
típicamente dos: media y varianza.
Por tanto, la descripción de una variable indicará la familia a que pertenece la fdp y los
parámetros correspondientes.
Ejemplo: (hipotético) la concentración de glucosa en sangre en individuos no
diabéticos, medida en mg/dl, es normal con media 98 y varianza 90.
MEDIDAS DESCRIPTIVAS
Medidas de posición o tendencia
Media muestral: Si tenemos X1, X2, ... , Xn datos, se llama media muestral de los
mismos a su media aritmética
Moda muestral: El valor que más se repite (puede no existir y si existe puede no ser
única).
Varianza:
Coeficiente de variación:
INDIVIDUOS O ELEMENTOS:
PARÁMETRO:
POBLACIÓN Y MUESTRA
Población:
Es el todo o un conjunto formado por todos los valores existentes, ya sean personas,
medidas u objetos que pueden ser expresados mediante una variable y además, tienen
una característica; de que son de interés estadístico para un estudio en específico. Al
análisis completo de la población también se le suele conocer como censo.
Censo:
Se entiende por censo aquella numeración que se efectúa a todos y cada uno de los
caracteres componentes de una población.
Encuesta:
Se entiende por encuesta las observaciones realizadas por muestreo, es decir son
observaciones parciales.
Según Antonio Napolitano "La encuesta, es un método mediante el cual se quiere
averiguar. Se efectúa a través de cuestionarios verbales o escritos que son aplicados a
un gran número de personas".
Muestra:
Es aquel subconjunto perteneciente a una población. Esto quiere decir que se
conforma por algunos datos de esta, ya sean ciertos objetos, personas, o medidas de la
población. Al estudio de este concepto se le suele conocer como muestreo.
Muestreo:
Esto no es más que el procedimiento empleado para obtener una o más muestras de
una población; el muestreo es una técnica que sirve para obtener una o más muestras
de población. Éste se realiza una vez que se ha establecido un marco muestral
representativo de la población, se procede a la selección de los elementos de la
muestra, aunque hay muchos diseños de la muestra. Al tomar varias muestras de una
población, las estadísticas que calculamos para cada muestra no necesariamente
serían iguales, y lo más probable es que variaran de una muestra a otra.
Ejemplo;
Consideremos como una población a los estudiantes de educación del Núcleo San
Carlos de la UNESR, determinando por lo menos dos caracteres ser estudiados en
dicha población;
• Religión de los estudiantes
• Sexo.
ORGANIZACIÓN DE DATOS
TABLA DE FRECUENCIA
Fórmula de la suma de las frecuencias absolutas que tiene como resultado el número
total de elementos N.
Ejercicio
Frecuencia relativa
La frecuencia relativa (fi) de un valor Xi es la proporción de valores iguales a Xi en
el conjunto de datos (X1, X2,…, XN). Es decir, la frecuencia relativa es la frecuencia
absoluta dividida por el número total de elementos N:
Las frecuencias relativas son valores entre 0 y 1, 0 ≤ fi ≤ 1. La suma de
las frecuencias relativas de todos los sujetos da 1. Supongamos que en el conjunto
tenemos k números (o categorías) diferentes, entonces:
N1(3)=n1(3)=2
N2(4)=n1(3)+n2(4)=2+4=6
N3(5)=n1(3)+n2(4)+n3(5)=2+4+6=12
N4(6)=n1(3)+n2(4)+n3(5)+n4(6)=2+4+6+7=19
N5(7)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)=2+4+6+7+5=24
N6(8)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)=2+4+6+7+5+3=27
N7(9)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)+n7(9)=2+4+6+7+5+3+2=2
9
N8(10)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)+n7(9)+n8(10)
=2+4+6+7+5+3+2+1=30
Frecuencia relativa
Se calcula la frecuencia relativa de cada elemento como la división de la frecuencia
absoluta entre el total de elementos N=30.
f1(3) = n1(3)/N = 2/30 = 0,07
f2(4) = n2(4)/N = 4/30 = 0,13
f3(5) = n3(5)/N = 6/30 = 0,20
f4(6) = n4(6)/N = 7/30 = 0,23
f5(7) = n5(7)/N = 5/30 = 0,17
f6(8) = n6(8)/N = 3/30 = 0,10
f7(9) = n7(9)/N = 2/30 = 0,07
f8(10) = n8(10)/N = 1/30 = 0,03
Se pueden calcular las frecuencias relativas en porcentaje (%)
multiplicándolas por 100.
Frecuencia completa
La frecuencia completa por su denominación es el número de veces que aparece un
determinado valor en un valor estadístico. Se representa por fila. La suma de la
frecuencia completa es igual al número total de datos, que se representa por N. Para
indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se
lee sumatoria.
Frecuencia relativa
Se dice que la frecuencia relativa es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos. Se puede expresar en tantos por ciento
y se representa por hi. La suma de las frecuencias relativas es igual a 1
Frecuencia relativa (hi) es el cociente entre la frecuencia absoluta y el tamaño de la
muestra (N). Es decir:
siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una
distribución de frecuencias.
Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por
ciento (pi).
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado.
La frecuencia acumulada es la frecuencia estadística F(XXr) con que el valor de un
variable aleatoria (X) es menor que o igual a un valor de referencia (Xr).
La frecuencia acumulada relativa se deja escribir como Fc(X≤Xr), o en breve (Xr), y se
calcula de
Fc (Hr) = HXr / N
donde MXr es el número de datos X con un valor menor que o igual a Xr, y N es
número total de los datos. En breve se escribe:
Fc = M / N
Cuando Xr=Xmin, donde Xmin es el valor mínimo observado, se ve que Fc=1/N, porque
M=1. Por otro lado, cuando Xr=Xmax, donde Xmax es el valor máximo observado, se ve
que Fc=1, porque M=N.
En porcentaje la ecuación es:
Fc(%) = 100 M / N
Intervalo ci ni Ni fi Fi
Total: 40 1
La media aritmética
La media aritmética es el valor obtenido por la suma de todos sus valores dividida
entre el número de sumadores. Por ejemplo, las notas de 5 alumnos en una prueba:
niño nota
1 6,0 ·Primero, se suman las notas:
2 5,4 6,0+5,4+3,1+7,0+6,1 = 27,6
3 3,1 ·Luego el total se divide entre la cantidad de alumnos:
4 7,0 27,6/5=5,52
5 6,1
· La media aritmética en este ejemplo es 5,52
La media aritmética es, probablemente, uno de los parámetros estadísticos más
extendidos.2 Se le llama también promedio o, simplemente, media.
Definición formal
Dado un conjunto numérico de datos, x1, x2, ..., xn, se define su media aritmética
como
Propiedades
Las principales propiedades de la media aritmética son:3
Inconvenientes de su uso
Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en
situaciones muy diversas, tiene también algunos inconvenientes, como son:
Moda
La moda es el dato más repetido de la encuesta, el valor de la variable con mayor
frecuencia absoluta.5 En cierto sentido la definición matemática corresponde con la
locución "estar de moda", esto es, ser lo que más se lleva.
Su cálculo es extremadamente sencillo, pues solo necesita un recuento. En variables
continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su
defecto, si es necesario obtener un valor concreto de la variable, se recurre a la
interpolación.
Por ejemplo, el número de personas en distintos vehículos en una carretera: 5-7-4-6-9-
5-6-1-5-3-7. El número que más se repite es 5, entonces la moda es 5.
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos
modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Cuando
en una distribución de datos se encuentran tres o más modas, entonces es
multimodal. Por último, si todas las variables tienen la misma frecuencia diremos que
no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha
de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.
La moda, cuando los datos están agrupados, es un punto que divide el intervalo modal
en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen
que:
calificaciones 1 2 3 4 5 6 7 8 9
Números de 2 2 4 5 8 9 3 4 2
alumnos
Propiedades
Sus principales propiedades son:
Cálculo sencillo.
Interpretación muy clara.
Al depender solo de las frecuencias, puede calcularse para variables
cualitativas. Es por ello el parámetro más utilizado cuando al resumir una
población no es posible realizar otros cálculos, por ejemplo, cuando se
enumeran en medios periodísticos las características más frecuentes de
determinado sector social. Esto se conoce informalmente como "retrato
robot".
Inconvenientes
Mediana
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos,
una vez que éstos están ordenados de menor a mayor.7 Por ejemplo, la mediana del
número de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2,
3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1,
2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:
Calificaciones 1 2 3 4 5 6 7 8 9
Números de 2 2 4 5 6 9 4 4 2
alumnos
Cálculo de la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho).
Si volvemos a utilizar la fórmula asociada a la mediana para n par, obtenemos X(38/2)
= X19 y basándonos en la fórmula que hace referencia a las frecuencias absolutas -->
Ni-1< n/2 < Ni = N18 < 19 < N19
Con lo cual la mediana será la media aritmética de los valores de la variable que
ocupen el decimonoveno y el vigésimo lugar.
En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6, (desde el
vigésimo hasta el vigésimo octavo)
con lo que Me = (5+6)/2 = 5,5 puntos.
Propiedades e inconvenientes
Las principales propiedades de la mediana son:8
MEDIDAS DE DISPERSIÓN.
Parámetros estadísticos que indican como se alejan los datos respecto de la media
aritmética. Sirven como indicador de la variabilidad de los datos. Las medidas de
dispersión más utilizadas son el rango, la desviación estándar y la varianza.
Rango
Indica la dispersión entre los valores extremos de una variable. se calcula como la
diferencia entre el mayor y el menor valor de la variable. Se denota como R.
Para datos ordenados se calcula como:
R = x(n) - x(1)
Donde: x(n): Es el mayor valor de la variable. x(n): Es el menor valor de la variable.
Desviación media
Es la media aritmética de los valores absolutos de las diferencias de cada dato respecto
a la media.
Donde:
xi:valores de la variable.
n: número total de datos
Desviación estándar
La desviación estándar mide el grado de dispersión de los datos con respecto a la
media, se denota como s para una muestra o como σ para la población. Se define
como la raíz cuadrada de la varianza según la expresión:
Obsérvese que el denominador es n - 1, a diferencia de la desviación media donde se
divide entre n; también existe la fórmula de desviación típica donde el denominador es
n pero se prefiere n-1.
Mientras menor sea la desviación estándar, los datos son más homogéneos, es decir
existe menor dispersión, el incremento de los valores de la desviación estándar indica
ina mayor variabilidad de los datos.
Varianza
Es otro parámetro utilizado para medir la dispersión de los valores de una variable
respecto a la media. Corresponde a la media aritmética de los cuadrados de las
desviaciones respecto a la media. Su expresión matemática es:
Coeficiente de Variación
Permite determinar la razón existente entre la desviación estándar (s) y la media. Se
denota como CV. El coeficiente de variación permite decidir con mayor claridad sobre
la dispersión de los datos. También puede ser expresado en por ciento.
¿QUÉ ES UNA TABLA DE DATOS AGRUPADOS?
Tabla en las bases de datos, se refiere al tipo de modelado de datos, donde se guardan
y almacenan los datos recogidos por un programa. Su estructura general se asemeja a
la vista general de un programa de hoja de cálculo. Registro: es cada una de las filas en
que se divide la tabla. Cada registro contiene datos de los mismos tipos que los demás
registros. Ejemplo: en una tabla de nombres, direcciones, etc., cada fila contendrá un
nombre y una dirección. A los campos se les puede asignar, además, propiedades
especiales que afectan a los registros insertados. El campo puede ser definido como
índice o autoincrementadle, lo cual permite que los datos de ese campo cambien solos
o sean el principal a la hora de ordenar los datos contenidos.
¿AMPLITUD DE INTERVALO?
Es la diferencia entre el límite superior e inferior de cada intervalo determinado.
Ii = [a;b[, entonces C = b – a
También podemos aplicar:
Donde:
R: Rango
k: número de intervalos de clase.
MARCA DE CLASE
La marca de clase es el punto medio de cada intervalo. La marca de clase es el valor
que representa a todo el intervalo para el cálculo de algunos parámetros como la
media aritmética o la desviación típica.
Se representa por ci o xi
Ejemplo
xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
BIBLIOGRAFÍA.
https://www.gestiopolis.com/que-es-estadistica-tipos-y-objetivos/
http://www.hrc.es/bioest/estadis_21.html
http://virtual.uptc.edu.co/ova/estadistica/docs/libros/ftp.bioestadistica.uma.es/libro/
node4.htm
https://es.wikipedia.org/wiki/Estad%C3%ADstica#Lenguaje_y_simbolog%C3%ADa
https://www.monografias.com/trabajos15/estadistica/estadistica.shtml
http://www.universoformulas.com/estadistica/descriptiva/tabla-frecuencias/
https://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_frecuencias
https://es.wikipedia.org/wiki/Medidas_de_tendencia_central
https://www.ecured.cu/Medidas_de_dispersi%C3%B3n
datos:
http://aplicaciones3.ecuadorencifras.gob.ec/BIINEC-
war/index.xhtml
https://www.youtube.com/watch?v=bKK0kXzwpgs
https://www.youtube.com/watch?v=1myBo87lYyU