You are on page 1of 24

ESTADSTICA

1.-Fundamentos Estadsticos:
Introduccin:
Desde hace siglos, la aplicacin de registros e instrumentos para estudiar una determinada poblacin
han sido utilizados por diversas naciones, tales como: roma, Egipto, china, entre otros. De all viene el
origen de la estadstica, la cual antes de ser una ciencia fue implementada por jefes de gobierno para
llevar los registros de datos numricos, de la poblacin de los nacimientos, y las disfunciones
ocurridas en uno o varios aos.

Definicin:
La estadstica es considerada como una coleccin de hechos numricos expresados en trminos de
una relacin sumisa, y que han sido recopilados a partir de otros datos numricos. Tambin podemos
considerarla como un valor resumido, calculado, como base en una muestra de observaciones que
generalmente, aunque no por necesidad, se considera como una estimacin de parmetro de
determinada poblacin; es decir, una funcin de valores de muestra.

Importancia:
La Estadstica Econmica tiene sus antecedentes en el siglo XVII y su mximo exponente fue William
Petty quin es considerado por Carlos Marx como el creador de esta ciencia sin olvidar a Gregory
King que tambin realiz clculos aproximados de los ndices econmicos sociales de esta ciencia.

Funcin:
La principal funcin de la estadstica es la recoleccin, recopilacin e interpretacin de datos para
llevar los registros de datos numricos, de la poblacin de los nacimientos, y las disfunciones
ocurridas en uno o varios aos aplicadas en las diferentes ramas de la ciencia como en salud,
economa ,etc.

Tipos:
La estadstica descriptiva o de ductiva, se dedica a los mtodos de recoleccin, descripcin,
visualizacin y resumen de datos originados a partir de los fenmenos en estudio. Los datos
pueden ser resumidos numrica o grficamente.
La estadstica inferencial o inductiva, se dedica a la generacin de los modelos, inferencias
y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta lo aleatorio e
incertidumbre en las observaciones. Se usa para modelar patrones en los datos y extraer
inferencias acerca de la poblacin de estudio.

2.- Poblacin, variable y muestra.


Poblacin:

Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales
intentamos sacar conclusiones. Una poblacin es un conjunto de elementos que presentan una
caracterstica comn.
Ejemplo:
Los miembros del Colegio de Ingenieros del Estado Peruano.

Muestra:
Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla. Una muestra es
una coleccin de algunos elementos de la poblacin, pero no de todos". "Una muestra debe ser
definida en base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra
solo podrn referirse a la poblacin en referencia.
Ejemplo;
El estudio realizado a 50 miembros del Colegio de Ingenieros del Estado Peruano.

Variable y tipos:
Al conjunto de los distintos valores numricos que adopta un carcter cuantitativo se llama variable
estadstica.

Variables cualitativas:

Son las variables que expresan distintas cualidades, caractersticas o modalidad. Cada modalidad que
se presenta se denomina atributo o categora y la medicin consiste en una clasificacin de dichos
atributos. Las variables cualitativas pueden ser ordinales y nominales.
Dentro de ellas podemos distinguir:
Variable cualitativa ordinal: La variable puede tomar distintos valores ordenados siguiendo una
escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por
ejemplo, leve, moderado, grave
Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de
orden como por ejemplo los colores o el lugar de residencia.

Variables cuantitativas:

Son las variables que se expresan mediante cantidades numricas. Las variables cuantitativas
adems pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores
que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los
distintos valores especficos que la variable pueda asumir. Un ejemplo es el nmero de hijos.
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo
especificado de valores. Por ejemplo el peso o la altura, que solamente limitado por la precisin del
aparato medidor, en teora permiten que siempre exista un valor entre dos cualesquiera.

3.-Tcnicas de recoleccin de datos


Las tres principales tcnicas de recoleccin de datos son:
1.Entrevistas
2.Laencuesta
3. La observacin
4. Sesin de grupo.
A.-LA ENTREVISTA.
Una entrevista es un dialogo en el que la persona (entrevistador), generalmente un periodista hace
una serie de preguntas a otra persona (entrevistado), con el fin de conocer mejor sus ideas, sus
sentimientos
su
forma
de
actuar.
El entrevistado
El entrevistado es la persona que tiene alguna idea o alguna experiencia importante que transmitir.
El entrevistador.
Es el que dirige la entrevista debe dominar el dialogo, presenta al entrevistado y el tema principal,
hace preguntas adecuadas y cierra la entrevista. La entrevista es tambin informacin y reportaje, las
entrevistas
pueden
ser
reales
o
imaginarias.
Partes de una entrevista.
La presentacin suele ser breve, pero no suficientemente informativa. En ella no se habla del
entrevistado,
sino
del
tema
principal
de
la
entrevista.
El cuerpo de la entrevista esta formado por preguntas y las respuestas. Entrevistado trasmita sus
experiencias. Tambin deben ser breves, claras y respetuosas. El cierre de la entrevista debe ser
conciso. El entrevistador puede presentar un resumen de lo hablado o hacer un breve comentario
personal.

B.-LA ENCUESTA.
Una encuesta es un conjunto de preguntas normalizadas dirigidas a una muestra representativa de la
poblacin o instituciones, con el fin de conocer estados de opinin o hechos especficos.
Ventajas y Desventajas
Ventajas
1. Bajo costo
2. Informacin ms exacta (mejor calidad) que la del Censo debido al menor nmero de
empadronadores
permite
capacitarlos
mejor
y
ms
selectivamente.
3. Es posible introducir mtodos cientficos objetivos de medicin para corregir errores.
4. Mayor rapidez en la obtencin de resultados.

5. Tcnica ms utilizada y que permite obtener informacin de casi cualquier tipo de poblacin.
6. Permite obtener informacin sobre hechos pasados de los encuestados.
Desventajas
El planeamiento y ejecucin de la investigacin suele ser ms complejo que si se realizara por censo.
1. Requiere para su diseo de profesionales con buenos conocimientos de teora y habilidad en su
aplicacin.
C.-LA OBSERVACIN:
consiste
en
observar
a
las
personas
cuando
efectan
su
trabajo.
Como tcnica de investigacin, la observacin tiene amplia aceptacin cientfica. Los socilogos,
siclogos e ingenieros industriales utilizan extensamente sta tcnica con el fin de estudiar a las
personas en sus actividades de grupo y como miembros de la organizacin. "Ver es creer! Observar
las operaciones la proporciona el analista hechos que no podra obtener de otra forma.
D.-SESIONES DE GRUPO.
Es una de las formas de los estudios cualitativos en el que se rene a un grupo de personas para
indagar acerca de actitudes y reacciones frente a un producto, servicio, concepto, publicidad, idea o
empaque.
Sin embargo, las sesiones de grupo tienen desventajas. El entrevistador tiene poco control sobre el
grupo y en ocasiones se pierde tiempo en asuntos de poca trascendencia.

4.-Tcnicas de muestreo:
Existen dos mtodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio y
el muestreo aleatorio (que incorpora el azar como recurso en el proceso de seleccin
Muestreo probabilstico
Forman parte de este tipo de muestreo, todos aquellos mtodos para los que puede calcular la
probabilidad de extraccin de cualquiera de las muestras posibles
Muestreo sistemtico
Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse en el tiempo.
Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego
hay que calcular una constante, que se denomina coeficiente de elevacin K= N/n; donde N es el
tamao del universo y n el tamao de la muestra. Determinar en qu fecha se producir la primera
extraccin, para ello hay que elegir al azar un nmero entre 1 y K; de ah en adelante tomar uno de
cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la periodicidad del
fenmeno.
Muestreo estratificado
Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen
homogneos con respecto a alguna caracterstica de las que se van a estudiar. A cada uno de estos
estratos se le asignara una cuota que determinara el nmero de miembros del mismo que
compondrn la muestra. Dentro de cada estrato se suele usar la tcnica de muestreo sistemtico, una
de las tcnicas de seleccin ms usadas en la prctica.

Asignacin proporcional: el tamao de la muestra dentro de cada estrato es proporcional al tamao


del estrato dentro de la poblacin.
Asignacin ptima: la muestra recoger ms individuos de aquellos estratos que tengan ms
variabilidad. Para ello es necesario un conocimiento previo de la poblacin.
Muestreo por estadios mltiples
Esta tcnica es la nica opcin cuando no se dispone de lista completa de la poblacin de referencia o
bien cuando por medio de la tcnica de muestreo simple o estratificado se obtiene una muestra con
unidades distribuidas de tal forma que resultan de difcil acceso.
Muestreo por conglomerados
Se utiliza cuando la poblacin se encuentra dividida, de manera natural, en grupos que se supone que
contienen toda la variabilidad de la poblacin, es decir, la representan fielmente respecto a la
caracterstica a elegir, pueden seleccionarse slo algunos de estos grupos o conglomerados para la
realizacin del estudio.
Muestreo no probabilstico
Es aqul para el que no puede calcularse la probabilidad de extraccin de una determinada muestra.
Se busca seleccionar a individuos que tienen un conocimiento profundo del tema bajo estudio, por lo
tanto, se considera que la informacin aportada por esas personas es vital para la toma de decisiones.
Muestreo por cuotas
Es la tcnica ms difundida sobre todo en estudios de mercado y sondeos de opinin. En primer lugar
es necesario dividir la poblacin de referencia en varios estratos definidos por algunas variables de
distribucin conocida (como el gnero o la edad). Posteriormente se calcula el peso proporcional de
cada estrato, es decir, la parte proporcional de poblacin que representan. Finalmente se multiplica
cada peso por el tamao de n de la muestra para determinar la cuota precisa en cada estrato. Se
diferencia del muestreo estratificado en que una vez determinada la cuota, el investigador es libre de
elegir a los sujetos de la muestra dentro de cada estrato.

5.- Metodos estadsticos y etapas.


A.-Concepto:
Es un conjunto de procedimientos que se aplican en una secuencia lgica con el fin de recopilar,
organizar, presentar, analizar e interpretar datos cuantitativos de fenmenos sujetos a variaciones.

B.-Etapas:
A.-ETAPA DE PLANEAMIENTO O PREPARACIN:
Comprende la justificacin del estudio, determinar los objetivos y variables, identificar las fuentes de
informacin, determinar el mbito, preparar el plan de ejecucin.
A.1.- Relacin dela estadstica con el mtodo cientfico:
Se relaciona por lo siguiente:

En el proceso de observacin: seala los hechos a observar.


Es el proceso de formulacin de hiptesis.
En el proceso de verificacin de hiptesis.

A.2.-Planeamiento de la investigacin:
El diseo de la investigacin o estudio se concibe en un plan o proyecto, cuyo contenido depende del
tipo de investigacin a llevar a cavo. Debemos de tener en cuenta los siguientes puntos.

Planeamiento del problema.


Formulacin de objetivos.
Definicin de la poblacin o universo .
Determinacin de variables.
Formulacin de hiptesis.
Determinacin de la informacin a recolectar.
Procedimiento de elaboracin y anlisis de la informacin.
Programacin y conduccin de la investigacin.
Informe de la investigacin.

B.- ETAPA DE RECOLECCIN DE DATOS:


Empieza la ejecucin de la investigacin, es decir el investigador pone en marcha la etapa de
planeamiento. A travs de la recoleccin, se obtienen los datos que se requieren para alcanzar los
objetivos
C.-ETAPA DE ORGANIZACIN Y PRESENTACIN DE DATOS:
Como tarea previa ala organizacin es indispensable realizar una evaluacin, correccin y ajuste de
datos
D.-ETAPA DE ANALISIS E INTERPRETACION DE DATOS:
En esta etapa se aplican los argumentos matemticos y tcnicos de la estadstica. A travs de
mtodos se calcula indicadores y medidas de resumen, se establecen relaciones entre variables, se
estiman valores, etc.
E.-ETAPA DE CONCLUCIONES Y PUBLICACIONES DE DATOS:
En toda investigacin debe analizarse el cumplimiento de los objetivos en funcin de los resultados
fundamentales .permite elaborar un resumen de los aspectos sustantivos que luego se expresaran en
formas de conclusiones.

6.-Graficos estadsticos:
Los principales grficos estadsticos son:

Grafico de de barras
Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de
tipo discreto.
Se representan sobre unos ejes de coordenadas, en el eje de abscisasse colocan los valores de la
variable, y sobre eleje de ordenadas las frecuencias absolutas o relativas o acumuladas.
Los datos se representan mediante barras de una altura proporcional a la frecuencia.

Ejemplo

Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguneo ha
dado el siguiente resultado:

Grupo
sanguneo

fi

AB

9
20

Grficos circular:
Se utiliza para representar datos cualitativos, ordinales y discretos para su elaboracin se utiliza la
circunferencia.

Grafico lineal o de tendencia:


Se usa para representar una distribucin de frecuencias dada en el tiempo (da, semanas meses y
aos ),llamada tambin serie cronolgica.
ci

fi

Fi

Ejemplo:

[50, 60)

55

Diagrama de frecuencias:

[60, 70)

65

10

18

[70, 80)

75

16

34

[80, 90)

85

14

48

[90, 100)

95

10

58

[100, 110)

105

63

[110, 120)

115

65

65

Se usa para representar las diferentes tipos de distribuciones


de frecuencias de datos cuantitativos discretos. Se pueden
efectuar grficos
Los diagramas se pueden elaborara as.
Ejemplo
El peso de 65 personas adultas viene dado por la
siguiente tabla:

Histograma de frecuencias:
Se usa para representar las distribuciones de frecuencia absolutas o relativas de datos
cuantitativos continuos agrupados en clases. Ejemplo
En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente)
obtenidas por un grupo de 50 alumnos.
fi

hi

[0, 5)

15

[5, 7)

20

10

[7, 9)

12

[9, 10)

50

Polgono de frecuencias:
S e obtiene uniendo los puntos medios de las bases superiores de los rectngulos en el histograma
de frecuencias absolutas o relativas.
Hor
a

Temperat
ura

12

12

14

15

11

18

12

21

10

24

Ejemplo

Las temperaturas en un da de otoo de una ciudad han sufrido las siguientes


variaciones:

Polgono de frecuencias acumuladas:


Es la representacin grafica de una distribucin absoluta acumulada o
frecuencias relativas acumuladas

7.-TABLAS DE FRECUENCIA:
La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos
estadsticos, asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencias

Frecuencia absoluta
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio
estadstico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee
suma o sumatoria.

Frecuencia relativa:
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero
total de datos.

Se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1.

Frecuencia relativa acumulada


La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado
valor y el nmero total de datos. Se puede expresar en tantos por ciento.
Ejemplo

Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34,
33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda
hacemos el recuento y en la tercera anotamos la frecuencia absoluta.
xi

Recuento

fi

Fi

ni

Ni

2
7

0.03
2

0.03
2

2
8

II

0.06
5

0.09
7

2
9

0.19
4

0.29
0

3
0

16

0.22
6

0.51
6

MEDIDAS DE TENDENCIA CENTRAL


Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un
solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos
se denomina medida o parmetro de tendencia central o de centralizacin. Cuando se hace referencia
nicamente a la posicin de estos parmetros dentro de la distribucin, independientemente de que
sta est ms o menos centrada, se habla de estas medidas como medidas de posicin. En este caso
se incluyen tambin los cantiles entre estas medidas.
Entre las medidas de tendencia central tenemos:
a) Media.
b) Media ponderada.
c) Media geomtrica.
d) Media armnica.

e) Mediana.
f) Moda.
A.-MODA
La moda se refiere al dato ms repetido, el valor de la variable con mayor absoluta. En cierto sentido
la definicin matemtica corresponde con la locucin "estar de moda", esto es, ser lo que ms se
lleva.
Su clculo es extremadamente sencillo, pues slo necesita un recuento. En variables continuas,
expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario
obtener un valor concreto de la variable, se recurre a la interpolacin.
Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-4-6-9-5-6-1-5-3-7. El
nmero que ms se repite es 5, entonces la moda es 5.
Siendo
la frecuencia absoluta del intervalo modal y
intervalos anterior y posterior, respectivamente.

las frecuencias absolutas de los

Las calificaciones en la asignatura de Matemticas de 39 alumnos de una clase vienen dadas por la
siguiente tabla (debajo):
Calificaciones

Nmero de alumnos

Propiedades
Sus principales propiedades son:

Clculo sencillo.

Interpretacin muy clara.

Al depender slo de las frecuencias, puede calcularse para variables cualitativas. Es por ello el
parmetro ms utilizado cuando al resumir una poblacin no es posible realizar otros clculos,
por ejemplo, cuando se enumeran en medios periodsticos las caractersticas ms frecuentes
de determinado sector social. Esto se conoce informalmente como "retrato robot". 3

Inconvenientes
Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones
mustrales. Por otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del
nmero de intervalos y de su amplitud.

Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la
moda, no afectan en modo alguno a su valor.

No siempre se sita hacia el centro de la distribucin.

Puede haber ms de una moda en el caso en que dos o ms valores de la variable presenten la
misma frecuencia (distribuciones bimodales o multimodales).

B.-Mediana
La mediana es un valor de la variable que deja por debajo de s a la mitad de los datos, una vez que
stos estn ordenados de menor a mayor.Por ejemplo, la mediana del nmero de hijos de un conjunto
de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una
vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2:

En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la variable, por lo
que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por
ejemplo, en el caso de doce datos como los siguientes:

Se toma como mediana


Clculo de la mediana para datos agrupados
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla del margen derecho).
As, aplicando la formula asociada a la mediana para n impar, obtenemos
X (39+1)/2 = X20 y basndonos en la frmula que hace referencia a las frecuencias absolutas:
Ni-1< n/2 < Ni = N19 < 19.5 < N20
Por tanto la mediana ser el valor de la variable que ocupe el vigsimo lugar. En nuestro ejemplo, 21
(frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable no
olvidar las unidades; en este caso como estamos hablando de calificaciones, sern puntos)
La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms.
Calificaciones

Nmero de alumnos

Ejemplo (N par)

Las calificaciones en la asignatura de Matemticas de 38 alumnos de una clase vienen dadas por la
siguiente tabla.

Calculemos la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho).
Si volvemos a utilizar la frmula asociada a la mediana para n par, obtenemos X(38/2) = X19 y
basndonos en la frmula que hace referencia a las frecuencias absolutas --> Ni-1< n/2 < Ni = N18 <
19 < N19
Con lo cual la mediana ser la media aritmtica de los valores de la variable que ocupen el
decimonoveno y el vigsimo lugar.
En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigsimo el 6, (desde el vigsimo hasta
el vigsimo octavo)
Con lo que Me = (5+6)/2 = 5,5 puntos.
Propiedades e inconvenientes
Las principales propiedades de la mediana son:

Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de


transcripcin en la serie del ejemplo anterior en, pongamos por caso, el ltimo nmero, deja a
la mediana inalterada.

Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso cuando
alguno de ellos no est acotado.

2.-MEDIDAS DE DISPERSIN O VARIABILIDAD:


Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una
distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn
muy alejadas de la mediana media. Cunto mayor sea ese valor, mayor ser la variabilidad, cuanto
menor sea, ms homognea ser a la mediana media. As se sabe si todos los casos son parecidos o
varan mucho entre ellos.
A.-Rango estadstico:
El rango o recorrido estadstico es la diferencia entre el valor mximo y el valor mnimo en un grupo
de nmeros aleatorios. Se le suele simbolizar con R.
Requisitos del rango

Ordenamos los nmeros segn su tamao.

Restamos el valor mnimo del valor mximo

Ejemplo
Para una muestra (8, 7, 6, 9, 4,5), el dato menor es 4 y el dato mayor es 9 (Valor unitario
inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en un
rango de:

El rango se obtiene dividiendo el nmero mayor con el menor de los datos estadsticos
B.-Medio rango o Rango medio:
El medio rango o rango medio de un conjunto de valores numricos es la media del mayor y menor
valor, o la tercera parte del camino entre el dato de menor valor y el dato de mayor valor. En
consecuencia, el medio rango es:

Ejemplo
Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor
Max= 8. El medio rango resolvindolo mediante la correspondiente frmula sera:

Representacin del medio rango:

C.-Varianza:
La varianza es una medida estadstica que mide la dispersin de los valores respecto a un valor
central (media), es decir, es el cuadrado de las desviaciones:

Propiedades
La varianza es siempre positiva o 0:

Si a los datos de la distribucin les sumamos una cantidad constante la varianza no se


modifica.

[1
]

Si a los datos de la distribucin los multiplicamos una constante, la varianza queda multiplicada
por el cuadrado de esa constante.

Propiedad distributiva:

cov

D.-Desviacin tpica:
La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadrticas. Para evitar
ese problema se define otra medida de dispersin, que es la desviacin tpica, o desviacin estndar,
que se halla como la raz cuadrada positiva de la varianza. La desviacin tpica informa sobre la
dispersin de los datos respecto al valor de la media; cuanto mayor sea su valor, ms dispersos
estarn los datos. Esta medida viene representada en la mayora de los casos por S, dado que es su
inicial de su nominacin en ingls.
Desviacin tpica muestral

Desviacin tpica poblacional

-->x = [17 14 2 5 8 7 6 8 5 4 3 15 9]
x = 17. 14. 2. 5. 8. 7. 6. 8. 5. 4. 3. 15. 9.
-->stdev(x)
ans = 4.716311
-->
Primero hemos declarado un vector con nombre X, donde introduzco los nmeros de la serie. Luego
con el comando stdev se hallar la desviacin tpica.
E.-Covarianza:
La covarianza entre dos variables es un estadstico resumen indicador de si las puntuaciones estn
relacionadas entre s. La formulacin clsica, se simboliza por la letra griega sigma () cuando ha sido
calculada en la poblacin. Si se obtiene sobre una muestra, se designa por la letra " ".

La formula suele aparecer expresada como:

Este tipo de estadstico puede utilizarse para medir el grado de relacin de dos variables si ambas
utilizan una escala de medida a nivel de intervalo/razn (variables cuantitativas).
La expresin se resuelve promediando el producto de las puntuaciones diferenciales por su tamao
muestral (n pares de puntuaciones, n-1 en su forma insesgada).

F.-Coeficiente de Correlacin de Pearson:


El coeficiente de correlacin de Pearson, r, permite saber si el ajuste de la nube de puntos a la recta
de regresin obtenida es satisfactorio. Se define como el cociente entre la covarianza y el producto de
las desviaciones tpicas (raz cuadrada de las varianzas).

Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de
las dos expresiones siguientes:
Ejemplo Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor
valor Max= 8. El medio rango resolvindolo mediante la Correspondiente frmula sera:

Propiedades

El coeficiente de correlacin, r, presenta valores entre 1 y +1.

Cuando r es prximo a 0, no hay correlacin lineal entre las variables. La nube de puntos est
muy dispersa o bien no forma una lnea recta. No se puede trazar una recta de regresin.

Cuando r es cercano a +1, hay una buena correlacin positiva entre las variables segn un
modelo lineal y la recta de regresin que se determine tendr pendiente positiva, ser
creciente.

Cuando r es cercano a -1, hay una buena correlacin negativa entre las variables segn un
modelo lineal y la recta de regresin que se determine tendr pendiente negativa: es
decreciente.es

3.-Medidas de Forma: Asimetra y Curtosis:


A.- Asimetra:
Es una medida de forma de una distribucin que permite identificar y describir la manera como los
datos tiende a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribucin.
Permite identificar las caractersticas de la distribucin de datos sin necesidad de generar el grfico.
TIPOS DE ASIMETRA
La asimetra presenta las siguientes formas:
Asimetra Negativa o a la Izquierda.- Se da cuando en una distribucin la minora de los datos est en
la parte izquierda de la media. Este tipo de distribucin presenta un alargamiento o sesgo hacia la
izquierda, es decir, la distribucin de los datos tiene a la izquierda una cola ms larga que a la derecha.
Tambin se dice que una distribucin es simtrica a la izquierda o tiene sesgo negativo cuando el valor
de la media aritmtica es menor que la mediana y ste valor de la mediana a su vez es menor que la
moda, en smbolos

Nota: Sesgo es el grado de asimetra de una distribucin, es decir, cunto se aparta de la simetra.
Simtrica.- Se da cuando en una distribucin se distribuyen aproximadamente la misma cantidad de los
datos a ambos lados de la media aritmtica. No tiene alargamiento o sesgo. Se representa por una
curva normal en forma de campana llamada campana de Gauss (matemtico Alemn 1777-1855) o
tambin conocida como de Laplace (1749-1827).Tambin se dice que una distribucin es simtrica
cuando su media aritmtica, su mediana y su moda son iguales, en smbolos Md=Mo
Asimetra Positiva o a la Derecha.- Se da cuando en una distribucin la minora de los datos est en la
parte derecha de la media aritmtica. Este tipo de distribucin presenta un alargamiento o sesgo hacia
la derecha, es decir, la distribucin de los datos tiene a la derecha una cola ms larga que a la
izquierda.

Tambin se dice que una distribucin es simtrica a la derecha o tiene sesgo positivo cuando el valor
de la media aritmtica es mayor que la mediana y ste a valor de la mediana a su vez es mayor que la
moda, en smbolos

MEDIDAS DE ASIMETRA:

Coeficiente de Karl Pearson

Donde:

= media aritmtica.
Md = Mediana.
s = desviacin tpica o estndar.
Nota:
El Coeficiente de Pearson vara entre -3 y 3
Si As < 0? la distribucin ser asimtrica negativa.
Si As = 0? la distribucin ser simtrica.
Si As > 0? la distribucin ser asimtrica positiva.

Medida de Yule Bowley o Medida Cuartlica

Nota:
La Medida de Bowley vara entre -1 y 1
Si As < 0? la distribucin ser asimtrica negativa.
Si As = 0? la distribucin ser simtrica.
Si As > 0? la distribucin ser asimtrica positiva.

Medida de Fisher

Para datos sin agrupar se emplea la siguiente frmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:

Para datos agrupados en intervalos se emplea la siguiente frmula:

Donde:
= cada uno de los valores;
n = nmero de datos;
= media aritmtica;
f = frecuencia absoluta
= cubo de la desviacin estndar poblacional;
Xm = marca de clase
Nota:
Si As < 0 ?Indica que existe presencia de la minora de datos en la parte izquierda de la media,
aunque en algunos casos no necesariamente indicar que la distribucin sea asimtrica negativa
Si As = 0? la distribucin ser simtrica
Si As > 0? Indica que existe presencia de la minora de datos en la parte derecha de la media, aunque
en algunos casos no necesariamente indicar que la distribucin sea asimtrica positiva
Ejemplo ilustrativo:
Calcular el Coeficiente de Pearson, Medida Cuartlica y la Medida de Fisher dada la siguiente
distribucin: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Calculando la media aritmtica se obtiene:

Para calcular los cuartiles se ordena los datos de menor a mayor

12

12

Calculando el cuartil uno se obtiene:

Calculando el cuartil dos se obtiene:

Calculando el cuartil tres se obtiene:

Calculando la desviacin estndar muestral se obtiene:

Calculando el Coeficiente de Pearson se obtiene:

Calculando la Medida de Bowley se obtiene

Calculando la desviacin estndar poblacional se obtiene:

12

15

17

Calculando la Medida de Fisher se obtiene


Datos
6

-166,375

-15,625

-15,625

12

0,125

12

0,125

12

0,125

15

42,875

17

166,375

Total

12

B.-CURTOSIS O APUNTAMIENTO:
La curtosis mide el grado de agudeza o achatamiento de una distribucin con relacin a la distribucin
normal, es decir, mide cun puntiaguda es una distribucin.
TIPOS DE CURTOSIS
La curtosis determina el grado de concentracin que presentan los valores en la regin central de la
distribucin. As puede ser:
Leptocrtica.- Existe una gran concentracin.
Mesocrtica.- Existe una concentracin normal.
Platicrtica.- Existe una baja concentracin.

MEDIDAS DE CURTOSIS
Medida de Fisher

Para datos sin agrupar se emplea la siguiente frmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:

Para datos agrupados en intervalos se emplea la siguiente frmula:

Donde:
= cada uno de los valores;
n = nmero de datos;
= media aritmtica;
= Cudruplo de la desviacin estndar poblacional;
f = frecuencia absoluta; xm = marca de clase
Nota:
Si a < 3 ? la distribucin es platictica
Si a = 3 ? la distribucin es normal o mesocrtica
Si a > 3 ? la distribucin es leptocrtica
Medida basada en Cuartiles y Percentiles

(letra griega minscula kappa) = Coeficiente percentil de curtosis


Nota:
Si < 0,263 ? la distribucin es platicrtica
Si = 0,263 ? la distribucin es normal o mesocrtica
Si > 0,263 ? la distribucin es leptocrtica
Esta medida no es muy utilizada.
Ejemplo ilustrativo: Determinar qu tipo de curtosis tiene la siguiente distribucin: 6, 9, 9, 12, 12, 12,
15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis.
Solucin: Calculando la media aritmtica se obtiene

Calculando la desviacin estndar poblacional se obtiene:

Calculando la Medida de Fisher se obtiene:


Datos
6

915,0625

39,0625

39,0625

12

0,0625

12

0,0625

12

0,0625

15

150,0625

17

915,0625

Total

2058,5

Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:

12 12 12 15 17

Calculando el cuartil uno se obtiene:

Calculando el cuartil tres se obtiene:

Calculando el percentil 90 se tiene:

Calculando el percentil 10 se tiene:

Calculando el coeficiente percentil de curtosis se obtiene:

Como a= 2,23 y la distribucin es platicrtica

You might also like