Professional Documents
Culture Documents
Definición estadística:
¿Cuál su objetivo? La estadística es una ciencia que facilita la toma de
decisiones: mediante la presentación ordenada de los datos observados en
tablas y en gráficos estadísticos, red.
a. Planificación:
1. Definición de objetivos.
2. Definición del universo.
3. Diseño de la muestra.
4. Definición de las unidades de observación, escalas de clasificación
unidades.
5. Preparación del plan de tabulación y análisis.
b. Ejecución:
1. Recolección de la información.
2. Elaboración de la información.
3. Análisis de los resultados.
Aspectos básicos
3. Existe otro tipo de datos que por su naturaleza especial pueden ser
clasificados según tu conveniencia, estos son los cronológicos, por ejemplo
los años de la historia 2005,2006, 2007 puedes usarlos como discretos (años
enteros), continuos (años con subdivisiones en decimales de año), nominales
(por el nombre) o jerarquizados (ordenados), depende del uso.
Variables:
1. Variables continúas: es cuando los datos estadísticos se generan a través
de un proceso de medición se dice que estos son datos continuos; son
aquellas que aceptan valores en cualquier punto fraccionario de un
determinado intervalo.
2. Variables discretas: se generan a través de un proceso de conteo. Son
aquellas que no aceptan valores en puntos fraccionarios dentro de un
determinado intervalo, o sea, son aquellas que no aceptan fraccionamiento
dentro de un determinado intervalo.
Una variable discreta es una variable que solo puede tomar valores
dentro de un conjunto numerable, es decir, no acepta cualquier valor sino
solo aquellos que pertenecen al conjunto. En estas variables se dan de modo
inherente separaciones entre valores observables sucesivos.
c. Simultaneidad: cada persona debe ser enumerada, tan cerca como sea
posible, de un punto bien definido en el tiempo (por ejemplo la media
noche anterior al día del censo) con el fin de que el censo sea un reflejo
exacto, hasta donde sea posible, de la población en un momento
determinado.
¿Qué es una fuente? Una fuente de información es una persona u objeto que
provee datos.
1. Fuentes primarias (o directas): son los datos obtenidos "de primera mano",
por el propio investigador o, en el caso de búsqueda bibliográfica, por
artículos científicos, monografías, tesis, libros o artículos de revistas
especializadas originales, no interpretados.
Una fuente primaria es aquella que provee un testimonio o evidencia
directa sobre el tema de investigación. Las fuentes primarias son escritas
durante el tiempo que se está estudiando o por la persona directamente
envuelta en el evento. Algunos tipos de fuentes primarias son:
documentos originales ,
trabajos creativos,
artefactos,
diarios,
novelas prendas,
instrumentos musicales,
minutas,
arte visual,
ropa entrevistas,
poesía,
apuntes de investigación,
noticias,
fotografías,
autobiografías,
cartas,
discursos, entre otras.
Procedimiento
de muestreo.
libros de texto,
artículos de revistas,
crítica literaria y comentarios enciclopedias,
biografías.
Confiabilidad de las fuentes: al realizar una investigación, hay que tener en cuenta
el valor y confiabilidad de las fuentes. El valor se refiere a la relevancia que pueda
tener una fuente de información. La confiabilidad se refiere a qué tanto podemos
creer en la información que nos brinda.
Tipos de cuadro:
1. Generales o de referencia: se utilizan para presentar resultados de censos,
encuestas y otros con el mayor detalle. Son cuadros primarios Abarcan toda
la información disponible y se utilizan para análisis posteriores Usa mucho
el ordenamiento alfabético y usual para facilitar la consulta.
Media aritmética
En matemáticas y estadística, la media aritmética (también
llamada promedio o simplemente media) de un conjunto finito de números es el
valor característico de una serie de datos cuantitativos objeto de estudio que parte
del principio de la esperanza matemática o valor esperado, se obtiene a partir de la
suma de todos sus valores dividida entre el número de sumandos. Cuando el
conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno
de los principales estadísticos muestrales.
Por ejemplo, si en una habitación hay tres personas, la media de dinero que
tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo
a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir
la información de una distribución (dinero en el bolsillo) suponiendo que cada
observación (persona) tuviera la misma cantidad de la variable.
datos: .
Por ejemplo, si en una habitación hay tres personas, la media de dinero que
tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo
a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir
la información de una distribución (dinero en el bolsillo) suponiendo que cada
observación (persona) tuviera la misma cantidad de la variable.
Así, dados n números x1, x2, ... , xn la media armónica será igual a:
La media armónica no está definida en el caso de que exista algún valor nulo.
Ejemplo:
Ejemplo:
Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y
el dato de mayor valor Max= 8. El medio rango resolviéndolo mediante la
correspondiente fórmula sería:
Desviación estándar: la desviación estándar (DS/DE), también llamada desviación
típica, es una medida de dispersión usada en estadística que nos dice cuánto
tienden a alejarse los valores concretos del promedio en una distribución. De hecho,
específicamente, el cuadrado de la desviación estándar es "el promedio del
cuadrado de la distancia de cada punto respecto del promedio". Se suele
representar por una S o con la letra sigma .
Donde
Ejemplo:
Sustituyendo N por 6
Este es el promedio.
Sustituyendo N por 6;
El valor:
Ocurre cuando los datos son exactamente iguales e iguales a la media aritmética.
Exigimos que:
Se calcula:
Propiedades y aplicaciones:
Si una curva de Lorenz se encuentra siempre por encima de otra (y, por lo
tanto, está más cerca de la línea de 45 grados que la otra), entonces podemos decir,
sin ambigüedad, que la primera exhibe menor desigualdad que la segunda. Esta
comparación gráfica entre distribuciones de distintos dominios geográficos o
temporales es el principal empleo de las curvas de Lorenz. El indicador gráfico de
bienestar más usado es la Curva de Lorenz Generalizada (CLG), que es una
derivación de la curva de Lorenz habitual. La CLG sólo se diferencia de la de Lorenz
en que en la escala vertical no se representan las cantidades relativas acumuladas
sino las cantidades acumuladas (no relativas) divididas por el número N de
elementos de la población. La lógica pretendida es representar qué cantidad
absoluta corresponde a cada porcentaje de individuos. Para clarificar este aspecto,
supóngase que la curva de Lorenz normal de una población nos dice que el 50% de
los menos ricos poseen el 25% de la riqueza total. Se puede comprender que es
muy diferente la situación de bienestar de este 50% de la población según si la
riqueza total es muy pequeña o muy grande. Es obvio que es peor poseer el 50%
de una cantidad pequeña que poseer el 25% de una cantidad mucho mayor. El
dividir las cantidades acumuladas por el total de elementos N es necesario para
poder comparar riquezas entre poblaciones distintas que tengan un número
diferente de elementos: no es lo mismo una riqueza total de 1.000.000€ en un
conjunto de 10 personas que esa misma riqueza total en un conjunto formado por
1.000 personas.
Tomando, pues, la distribución normal como referencia, una distribución puede ser:
Si la distribución es leptocúrtica y
Si la distribución es platicúrtica y
Si la distribución es mesocúrtica y
traslaciones,
rotaciones,
Simetría cilíndrica o simetría axial si existe un eje tal que los giros alrededor
de él no conducen a cambios de posición en el espacio, matemáticamente
está asociado a un grupo de isometría SO(2).
Algunos tipos de simetría que combinan dos o más de los anteriores tipos
son:
(PnA)=P(A)P(B)
Combinación y permutación:
Cambios:
PRESIDENTE: Daniel Arturo Rafael Daniel
SECRETARIO: Arturo Daniel Daniel Rafael
TESORERO: Rafael Rafael Arturo Arturo
y su varianza,
Y se obtiene
DISTRIBUCIONES CONTINUAS
PRINCIPALES CARACTERÍSTICAS
Para una variable continua hay infinitos valores posibles de la variable y entre cada
dos de ellos se pueden definir infinitos valores más. En estas condiciones no es
posible deducir la probabilidad de un valor puntual de la variable; como se puede
hacer en el caso de variables discretas, pero es posible calcular la probabilidad
acumulada hasta un cierto valor (función de distribución de probabilidad), y se
puede analizar como cambia la probabilidad acumulada en cada punto (estos
cambios no son probabilidades sino otro concepto: la función de densidad.
1. 0 para toda .
2.
Donde:
Donde
Donde
Donde es igual a n − 1.
La función de distribución es
Distribuciones relacionadas
Y = f(x1,...,xn; θ1,...,θm)
donde:
Una vez decidido el tipo de función matemática que mejor se ajusta (o representa
nuestro
concepto de la relación exacta que existe entre las variables) se presenta el
problema de
elegir una expresión particular de esta familia de funciones; es decir, se ha
postulado una
cierta función como término del verdadero estado en la población y ahora es
necesario
estimar los parámetros de esta función (ajuste de curvas).
Como los valores de los parámetros no se pueden determinar sin errores por que
los
valores observados de la variable dependiente no concuerdan con los valores
esperados,
entonces la ecuación general replanteada, estadísticamente, sería:
Y = f(x1,...xn;θ1,...,θm) + ε
Y = ßo + ß1X + ε
donde:
Terminologia:
Promedios
n
y
y∑i=;
n
x
∑ xi =
= ∑(y − y) i
SCY
2
; = ∑(x −x) i
SCX
2
; SPXY = ∑(x − x)(y − y) i
i
Y = ßo + ß1X + ε
= ∑e = ∑(y − − x) i
Qiββ01
22
bybxo1
=−
scx
spxy
b =1
Si b1=0, se dice que no existe relación lineal entre las dos variables.
(y ) (y ) (y y )
iiii
yy
))
−=−+−
F. de Mendiburu
5
Se observa que la desviación total para un Yi en particular es igual a la suma de las
desviaciones explicada e inexplicada, simbolicamente.
Luego:
Suma de Cuadrados del Total (SCT), mide la dispersión (variación total) en los
valores
observados de Y. Este término se utiliza para el cálculo de la variancia de la
muestra.
Total n-1 SC Y
F. de Mendiburu
6
Para el ejemplo del grafico (año base 1990 = 0)
Años (X) 0 1 2 3 4 5 6 7 8 9
Madera Aserrada (Y) 489.25 475.24 495.72 585.2 565.78 630.22 624.92 482.27
590.27 834.67
Gl SC CM F F0.05 Pr>F
Regression 1 49223 49223 6,9941 5,31 0,0295
Residual 8 56303 7037.8
Total 9 105526
X = El periodo.
Intercepto = 467,42
Tasa = 24,42
Intervalos de Confianza
b1 - t0 Sb1 ≤ ß1 ≤ b1 + to Sb1
F. de Mendiburu
7
En función del modelo se puede hacer estimaciones para los siguientes años:
2000 711.7
2001 736.12
2002 760.55
Estas proyecciones son puntuales, en base al modelo; para año 2000, X=10, resulta
una
producción de 711 mil m3 de madera aserrada.
n SCX
S edicho CMresidual x x 0
1
_ Pr 1
2
Prueba de Hipotesis
F. de Mendiburu
8
Para el ejemplo planteado, se rechaza la hipotesis planteada, esto significa que
existe una
relación lineal significativa del tiempo y la producción de madera aserrada total.
ANALISIS DE CORRELACION
-1 ≤ r ≤ 1.
SCX SCY
SPXY
r
.
=
Para los datos de la producción de madera aserrada total entre los años 1990 a
1999,
existe una asociación de 0.68.
( )( ) .0 68
105525,86 82 5,
2015,17
r==
F. de Mendiburu
9
Mide el porcentaje de variación en la variable respuesta, explicada por la variable
independiente.
1 = SCR/SCT + SCE/SCT
R² = 1 - SCE/SCT = SCR/SCT
R² = SC regresion / SC total
Interpretación de R²:
Se interpreta como una medida de ajuste de los datos observados y proporciona el
porcentaje de la variación total explicada por la regresión.
Lo que se espera que ambos R², resulten similares, para dar una confianza al
coeficiente
de determinación.
5. MUESTREO:
Es un procedimiento por medio del cual se estudia una parte de la población llamada
muestra, con el objetivo de inferir con respecto a toda la población.
a) Costos reducidos.
- Pruebas de germinación.
- Análisis de sangre.
- Control de calidad.
TIPOS DE MUESTREO
Muestreo de cuota:
DISEÑOS DE MUESTREO
Muestreo estratificado
Por lo general, un índice mide el cambio en una variable durante un cierto período,
como en una serie temporal. Sin embargo, también se le puede utilizar para medir
diferencias en una variable dada en diferentes lugares. Esto se lleva a cabo
recolectando datos de manera simultánea en los diferentes lugares y luego
comparándolos.
Los números índices son importantes concernientes a las actividades de negocios
y económicos pueden clasificarse en tres tipos:
Índices de precios
Índices de cantidades
Índice de valores en algún punto anterior en el tiempo (periodo bases) y usualmente
el periodo actual.
Cuando solamente esta comprendido un solo producto o mercancía el índice se
llama índice simple en tanto que una corporación que comprende un grupo de
elementos recibe el nombre de número compuesto. Los números índices les ofrecen
una forma de medir tales cambios.
El índice de precios compara niveles de precios de un período a otro. El índice de
precios al consumidor (IPC) mide los cambios globales de precios de una variedad
de bienes de consumo y de servicios, y se le utiliza para definir el costo de vida.
El índice de cantidad mide qué tanto cambia el número o la cantidad de una variable
en el tiempo.
El índice de valor mide los cambios en el valor monetario total; es decir, mide los
cambios en el valor en pesos de una variable, combina los cambios en precio y
cantidad para presentar un índice con más información.
Los números índices son útiles cuando se quiere comparar variables o magnitudes
que están medidas en unidades distintas. Por ejemplo, con los números índices
podemos comparar los costes de alimentación o de otros servicios en una ciudad
durante un año con los del año anterior, o la producción de arroz en un año en una
zona del país con la otra zona.
Aunque se usa principalmente en Economía e Industria, los números índices son
aplicables en muchos campos. En Educación, por ejemplo, se pueden usar los
números índices para comparar la inteligencia relativa de estudiantes en sitios
diferentes o en años diferentes.
Muchos gobiernos se ocupan de elaborar números índice con el propósito de
predecir condiciones económicas o industriales, tales como: índices de precios, de
producción, salariales, del consumidor, poder adquisitivo, costo de vida, etc.
En la administración se utilizan como parte de un cálculo intermedio para entender
mejor otra información.
Los números índices son muy versátiles, lo que los hace aplicable a cualquier
ciencia o campo de estudio. Esencialmente se usan para hacer comparaciones.
En educación se pueden usar los números índices para comparar la inteligencia
relativa de estudiantes en sitios diferentes o en años diferentes.
Los gerentes se valen de los números índices como parte de un cálculo intermedio
para entender mejor otra información.
Los índices estaciónales sirven para modificar o mejorar las estimaciones del futuro.
En el campo donde los números índices son de mayor utilidad es, en la economía,
ya que esta se vale de indicadores económicos, para estudiar las situaciones
presentes y tratar de predecir las futuras, dichos indicadores económicos en esencia
son números índices, ejemplo de ello son IPC, PNI, deflactor implícito del PNI, entre
muchos otros.