You are on page 1of 24

Ing. Adela Cruz C.

Clase 2
 De manera general, un fenómeno es regionalizado
cuando se desplaza en el espacio, manifestando una
cierta estructura.
 Las ciencias de la tierra, nos proporcionan numerosos
ejemplos. Si f(x) designa el valor en el punto x de
una característica “f” de este fenómeno, diremos
que f(x) es una V R. Se trata de un término neutro,
descriptivo, anterior, en particular a toda
interpretación probabilística. Del punto de vista
matemático, una V.R. es simplemente una función
f(x) del punto x, pero es, en general, una función
muy irregular: ejemplo: una ley en un depósito
minero.
 Una variable regionalizada se presenta bajo dos
aspectos contradictorios (o complementarios):
 un aspecto aleatorio (alta irregularidad, y
variaciones imprevisibles de un punto a otro)
 un aspecto estructurado (la V.R. debe sin
embargo reflejar a su manera las características
estructurales de un fenómeno regionalizado)
 La teoría de las V.R. se propone entonces dos
objetivos principales:
• en el plano teórico, expresar estas
características estructurales en una forma
matemática adecuada
• en el plano práctico, resolver el problema de
la estimación de una V.R. a partir de un
muestreo fragmentario.
ANALISIS EXPLORATORIO DE DATOS
ANALISIS EXPLORATORIO DE DATOS
 Media: Suma de datos dividido entre la cantidad
de los mismos (promedio).
 Media ponderada: se presenta cuando hay varias
observaciones del mismo valor; en un conjunto de

ANALISIS EXPLORATORIO DE DATOS


datos cada uno de ellos tiene una importancia
relativa (o peso).
por ejemplo, la nota de una asignatura donde el
examen final tiene un peso mayor al de un trabajo.
 Mediana: Dato central de un conjunto de valores
ordenados, si el conjunto de valores es par, se

ANALISIS EXPLORATORIO DE DATOS


saca la media de la pareja central.

157368
 Moda:
Datos que mas se repite. Si son dos es
BIMODAL.
 Esla sumatoria al cuadrado de la resta de cada

ANALISIS EXPLORATORIO DE DATOS


valor con la media, dividido entre el número de
valores existente menos uno.

 La desviación estándar, al igual que la media y


la varianza, es un índice muy sensible a las
puntuaciones extremas.
 Cuanta más pequeña sea la desviación
estándar mayor será la concentración de datos
alrededor de la media.
 La desviación estándar (σ) es la raíz cuadrada de
la varianza.
ANALISIS EXPLORATORIO DE DATOS
 Varianza es el cuadrado de la desviación
estándar: σ2
 Describe la variabilidad de la distribución.
Es la desviación o dispersión de la
distribución
 la desviación sirve para analizar el
comportamiento de los valores
alrededor de su promedio
ANALISIS EXPLORATORIO DE DATOS
394 mm

600 mm
470 mm
430 mm

170 mm 300 mm
ANALISIS EXPLORATORIO DE DATOS
Es correcto?

394 mm

Desviación promedio que existe entre las muestras


ANALISIS EXPLORATORIO DE DATOS
394 mm

Usando la desviación estándar tenemos una manera "estándar"


de saber qué es normal, o extra grande o extra pequeño.
indica la relación
existente entre la desviación estándar de una

ANALISIS EXPLORATORIO DE DATOS


muestra y su media.

Es el cociente (la división) entre el


error absoluto y el valor exacto.
Es la diferencia entre el valor de la
medida y el valor tomado como exacto
propone modelos para los
fenómenos aleatorios, es decir, los que se pueden
predecir con certeza, y estudia sus consecuencias
lógicas
 El tratamiento de la probabilidad básica como un
proceso de conteo discreto, es satisfactorio si

ANALISIS EXPLORATORIO DE DATOS


tratamos con números razonablemente pequeños,
como en el caso anterior. Pero si el número de eventos
es muy grande, entonces se puede calcular la
probabilidad por medio de una variable continua, de
modo que podemos usar métodos del cálculo.
 Para esto debemos entender como es que se
distribuye o comporta la variable. Existen diferentes
funciones de distribución:
ANALISIS EXPLORATORIO DE DATOS
 Se introdujo por Gauss para
estimar los errores en
observaciones enormes. En
el que la campana en forma
de curva conocida como
función gaussiana o curva de
Bell se utiliza para
representar la distribución
de la función de densidad de
probabilidad.

Cuando se trabaja con una variable de muchos individuos, los


valores se deben repartir en una curva simétrica en la cual la
mayoría de los datos se encuentran en la mitad, se encuentra
elevada con forma de campana y disminuye a medida que se alejan
de la media.
En la curva normal la mediana, moda y media son iguales.
 Ocurre cada vez que existe una variable

ANALISIS EXPLORATORIO DE DATOS


aleatoria X tal que su logaritmo natural es
una nueva variable aleatoria Y con
distribución normal, entonces X sigue el
modelo probabilístico llamado logaritmo
normal.
 Un histograma es una representación gráfica de una
variable en forma de barras. En el eje abscisas se

ANALISIS EXPLORATORIO DE DATOS


construyen unos rectángulos que tienen por base la
amplitud del intervalo, y por altura, la frecuencia
absoluta de cada intervalo.
 La superficie de cada barra es proporcional a la
frecuencia de los valores representados.
Para que sirve el histograma?
 Tipo de distribución (Normal, lognormal,..)
 Distribución uni-modal, multi-modal
 Aparición de valores extremos y outliers
 El estudio del histograma permite extraer
conclusiones sobre el tipo de distribución que siguen
los datos, la presencia de valores huracanados y la
posible existencia de poblaciones complejas
(bimodalidad).
 Distribución
en
campana, normal,
esperada.

ANALISIS EXPLORATORIO DE DATOS


Muchos procesos distinto

Distribución de peine

Error en datos o poco datos


ANALISIS EXPLORATORIO DE DATOS
 Determinar el tamaño del  Dato mayor + (1) – Dato menor
intervalo en el Histograma:
Num. De clases

ANALISIS EXPLORATORIO DE DATOS


Ejercicio 3
 Se tiene datos de velocidad de 45 conductores, los datos de
velocidad son:
ANALISIS EXPLORATORIO DE DATOS
ANALISIS EXPLORATORIO DE DATOS
ANALISIS EXPLORATORIO DE DATOS

You might also like