You are on page 1of 54

R User Group

Ecuador
GvSigEcuador

Miguel A. Flores

Felipe Gnzalez

Evelyn Bustos E

Guido Saltos

Febrero 2016
MINTEL
http://gvsigecuador.com #RGIS @fegones @mflores72000
CONVERGENCIA

http://gvsigecuador.com #RGIS @fegones @mflores72000


CONO DE APRENDIZAJE
Modelo de Edgar Dale & Bruce Nylan

Lectura
El 10% de lo que leemos
Smbolos verbales, smbolos visuales

Palabras odas: Grabaciones, radio, pintura


El 20% de lo que escuchamos

Dibujos observados: Imgenes en movimiento


El 30% de lo que omos y vemos

Mirar una pelcula / Ir a una Exposicin / Ver algo hecho en la


realidad: Recepcin visual, televisin, cine
El 50% de lo que omos y vemos

Participar en un debate / Tener una conversacin: Actividad A


receptiva y participativa, trabajos de campo, demostraciones C
El 70% de lo que decimos T
Realizar una representacin teatral / Simular experiencia I
reales / Hacer las cosas que se intentan aprender: Haciendo
experiencia dramatizadas, planificadas directas
V
O

http://gvsigecuador.com #RGIS @fegones @mflores72000


Contenido
Parte I: Estadstica
Modelo pedaggico

Objetivo

Metodologa

Clasificacin

Falacias y verdades a medias

Argot

http://gvsigecuador.com #RGIS @fegones @mflores72000


Modelo pedaggico
ACADMICO
MUNDO
IMAGINARIO
?? TEORA ?!

?? EXPERIENCI
?!
A

MUNDO
REAL EMPRESARIAL

http://gvsigecuador.com #RGIS @fegones @mflores72000


OBJETIVO DE LA ESTADSTICA

http://gvsigecuador.com #RGIS @fegones @mflores72000


Poblacin

http://gvsigecuador.com #RGIS @fegones @mflores72000


Poblacin Estadstica
Caracterstica de inters de un ente a investigar

http://gvsigecuador.com #RGIS @fegones @mflores72000


Muestra

http://gvsigecuador.com #RGIS @fegones @mflores72000


Mundo real: Obtener informacin de la poblacin a
partir de datos muestrales.

http://gvsigecuador.com #RGIS @fegones @mflores72000


Estadstica descriptiva

http://gvsigecuador.com #RGIS @fegones @mflores72000


La estadstica slo sirve para tabular datos y hacer
histogramas, grficas y diagramas de pastel y de
barras?.

http://gvsigecuador.com #RGIS @fegones @mflores72000


Metodologa
Imaginario
X Variable aleatoria

Real Caracterstica de
Muestreo estudio

Estadstica
Inferencial Estadstica
Descriptiva Teora de Muestreo
Estrategias de muestreo

Teora de Probabilidades
Inferir
Poblacin Muestra Teorema Central de Lmite
estadstica Estimadores
Parmetros

http://gvsigecuador.com #RGIS @fegones @mflores72000


Distribucin Normal

http://gvsigecuador.com #RGIS @fegones @mflores72000


Mundo Imaginario: describir la caracterstica de
inters de un fenmeno aleatorio (patrn) a
travs de un modelo probabilstico.

http://gvsigecuador.com #RGIS @fegones @mflores72000


http://gvsigecuador.com #RGIS @fegones @mflores72000
http://gvsigecuador.com #RGIS @fegones @mflores72000
http://gvsigecuador.com #RGIS @fegones @mflores72000
http://gvsigecuador.com #RGIS @fegones @mflores72000
Clasificacin
Descriptiva Paramtrico Univariante
Inferencial No paramtrico Multivariante
Bayesiano Funcional

Objetivo Enfoque Anlisis

Estadstica Descriptiva Estadstica Inferencial


Tendencia central Estimacin puntual
Dispersin (variabilidad) Estimacin por intervalo
Forma Pruebas de hiptesis
Posicin

Patrones Modelos
Data Mining
www-gvsigecuador/r
http://gvsigecuador.com
/ #RGIS @fegones
@fegones @mflores72000
@mflores72000
Clasificacin
Descriptiva Paramtrico Univariante
Inferencial No paramtrico Multivariante
Bayesiano Funcional

Objetivo Enfoque Anlisis


Paramtrico: Se asume que el No Paramtrico: Se asume que Bayesiano: Se asume que el
comportamiento de la el comportamiento de la comportamiento de la
caracterstica de estudio se caracterstica de estudio se caracterstica de estudio se
modela mediante una modela mediante la distribucin puede modelar mediante una
distribucin probabilstica (Se que los datos observados distribucin a priori y a
define a priori). proporcionan. posteriori.

Cumplir supuestos Alta dimensin Grado de certeza

http://gvsigecuador.com #RGIS @fegones @mflores72000


Clasificacin
Descriptiva Paramtrico Univariante
Inferencial No paramtrico Multivariante
Bayesiano Funcional

Objetivo Enfoque Anlisis


Univariante: Consiste en Multivariante: Consiste en Funcional: Consiste en realizar
realizar el anlisis de una realizar el anlisis de varias el anlisis de varias
caracterstica de inters de un caracterstica de inters de un caracterstica de inters de un
ente a investigar. Sin considerar ente a investigar. Considerando ente a investigar pero su
la relacin con otras la relacin entre caractersticas dimensin es mucho ms
caractersticas del mismo ente. del mismo ente. grande que el dimensin de los
Dato un escalar Dato un vector datos. Dato una funcin

p = 1; n >=30 p > 1; n >=30 pero n>p p > 1; n >=30 pero n<<p

http://gvsigecuador.com #RGIS @fegones @mflores72000


Cultura estadstica
Se refiere a dos componentes interrelacionados:

a) capacidad para interpretar y evaluar crticamente la


informacin estadstica, los argumentos apoyados en datos o
los fenmenos estocsticos que las personas pueden
encontrar en diversos contextos, incluyendo los medios de
comunicacin, pero no limitndose a ellos, y

b) capacidad para discutir o comunicar sus opiniones respecto a


tales informaciones estadsticas cuando sea relevante

Gal, 2002, pp.


2-3
http://gvsigecuador.com #RGIS @fegones @mflores72000
Ejemplos: Falacias
estadsticas y verdades
a medias
Promedios engaosos
Malas comparaciones
Muestra
Nivel de confianza
Error de estimacin
Escalas grficas

http://gvsigecuador.com #RGIS @fegones @mflores72000


EJEMPLOS DE FALACIAS

Libro : Equvocos y falacias en la interpretacin


de estadsticas. Stephen, Campbell

http://gvsigecuador.com #RGIS @fegones @mflores72000


"La estadstica es una ciencia que demuestra que
si mi vecino tiene dos coches y yo ninguno, los dos
tenemos uno"

George Bernard Shaw (1856-1950) Escritor


irlands.

http://gvsigecuador.com #RGIS @fegones @mflores72000


Qu es el Promedio?
Qu es la variabilidad?
Tendencia central La media aritmtica de un conjunto finito
de nmeros es el valor caracterstico de una
serie de datos cuantitativos objeto de
estudio que parte del principio de la
esperanza matemtica o valor esperado

Variabilidad La varianza es una medida de la


variabilidad que da cuenta del grado de
homogeneidad de los datos.

La desviacin estndar es simplemente el


"promedio" o variacin esperada con
respecto a la media aritmtica.

http://gvsigecuador.com #RGIS @fegones @mflores72000


Qu es el Promedio?
Qu es la variabilidad?
9 Dispersin:
(++)
=

Serie 1: 9 9 9 = 27
9 (++)
Dispersin: = ,

Serie 2: 5 12 10 = 27
9 (++)
Dispersin: =

Serie 3: 2 7 18 = 27

http://gvsigecuador.com #RGIS @fegones @mflores72000


Malas comparaciones
La produccin de acero en el ao fue de 4.2 millones de toneladas, se
prevea una produccin de 10.3 millones de toneladas para el ao
siguiente, la produccin real en el ao siguiente fue de 5.9 millones de
toneladas, un incremento del 1.7 millones en vez de 6.1 millones, o
sea, el 28% de la expansin planeada.

2013 2014
Real 4.2 5.9
Plan 0 10.3

http://gvsigecuador.com #RGIS @fegones @mflores72000


Malas comparaciones
Para levantar la moral de los empleados de la fabrica de
acero el reporte fue el siguiente:

Se pretenda alcanzar 10.3 millones de toneladas de acero y obtuvimos el 5.9


millones, por tanto nuestro plan se cumpli al 57 %.

http://gvsigecuador.com #RGIS @fegones @mflores72000


Muestra
Verdades a medias
Marco muestral
Mientras ms grande la muestra mejor
Nivel de confianza 95%
Error de estimacin 5%
Variable de estudio cualitavo

Resultados de una investigacin de mercado:

Votacin Mnima Votacin Mxima


estimada Estimada
Candidato A 48.23 % 51.34 %

Candidato B 49.30 % 52.84 %

Cuando esto sucede mencionan lo siguiente:


Existe un empate tcnico

http://gvsigecuador.com #RGIS @fegones @mflores72000


Muestra
Caractersticas de una muestra
Tamao ptimo
Conservar la estructura
Ponderacin de los casos

Casos de estudio:

Realizar un estudio a nivel nacional, para determinar el nivel de penetracin y uso


de las TICs.

Problemas:
Sobre dimensionamiento de la muestra
No cumpla la estructura de la muestra
No se poda extrapolar a la poblacin

http://gvsigecuador.com #RGIS @fegones @mflores72000


Muestra
Ponderacin de los casos

Cuando se cumple el diseo muestral Cuando no se cumple el diseo muestral

Poblacin Poblacin

Muestra Muestra

Mujeres (50) Mujeres (50) Mujeres (8)


Mujeres (5)

Hombres (5) Hombres (2)

Hombres (50) Hombres (50)

http://gvsigecuador.com #RGIS @fegones @mflores72000


Argot estadstico
Ente Nominales
Universo Ordinal
Poblacin Intervalo
Muestra Razn
Marco muestral

Conceptos Escalas

Variables Variables
estudio aleatorias
Cualitativas Discretas
Cuantitativas Continuas

http://gvsigecuador.com #RGIS @fegones @mflores72000


Qu grfico elegir?

http://gvsigecuador.com #RGIS @fegones @mflores72000


Qu mide la estadstica?
V
a
Actividades econmicas r
Progreso Social i
a
Hbitos de Consumo b
ndices de Popularidad l
e
Inteligencia e
s
Deportes p
Clima a
c
Salud i
a
l

http://gvsigecuador.com #RGIS @fegones @mflores72000


" Un da llegar en que el pensamiento estadstico
ser tan necesario para ejercer la ciudadana con
eficiencia, como la capacidad de leer y escribir"

H.G. Wells (1866 1946) Historiador, filsofo y


escritor ingls.

http://gvsigecuador.com #RGIS @fegones @mflores72000


Preguntas
Conoces qu es Data Mining y las
tcnicas que se utilizan?

Sabes qu es el software estadstico


R?; Has usado antes R?

Has usado R en tus proyectos o


investigaciones?

Data Mining
www-gvsigecuador/r
http://gvsigecuador.com
/ #RGIS @fegones
@fegones @mflores72000
@mflores72000
Qu es R?
Interaccin
(motor de
clculo) con
muchos
entornos
grficos y bases
de datos

R es fcilmente
extensible (
4,728 paquetes
disponibles en
CRAN2 )
Sept. 2013.
R1 es un software
libre para la
estadstica
computacional y
elaboracin de
grficos
dinmicos.

Data Mining
www-gvsigecuador/r
http://gvsigecuador.com
/ #RGIS @fegones
@fegones @mflores72000
@mflores72000
Por qu R?

Data Mining
www-gvsigecuador/r
http://gvsigecuador.com
/ #RGIS @fegones
@fegones @mflores72000
@mflores72000
Artculo original

Data Mining
www-gvsigecuador/r
http://gvsigecuador.com
/ #RGIS @fegones
@fegones @mflores72000
@mflores72000
R User Group
Ecuador

Data Mining
www-gvsigecuador/r
http://gvsigecuador.com
/ #RGIS @fegones
@fegones @mflores72000
@mflores72000
R User Group
Ecuador

Data Mining
www-gvsigecuador/r
http://gvsigecuador.com
/ #RGIS @fegones
@fegones @mflores72000
@mflores72000
R User Group
Ecuador

Data Mining
www-gvsigecuador/r
http://gvsigecuador.com
/ #RGIS @fegones
@fegones @mflores72000
@mflores72000
R User Group
Ecuador

Data Mining
www-gvsigecuador/r
http://gvsigecuador.com
/ #RGIS @fegones
@fegones @mflores72000
@mflores72000
DESCUBRIMIENTO DE
CONOCIMIENTO EN BASES DE
DATOS
( Knowledge Discovery in Data Bases)
CONOCIMIENTO
Mensalvas 1998
INTERPRETACION Y EVALUACION

DATA MINING
Modelos
CODIFICACION
Datos transformados en
Informacin
LIMPIEZA
Datos Procesados

SELECCION Datos Objetivo

Datos
http://gvsigecuador.com #RGIS @fegones @mflores72000
Big Data?

http://gvsigecuador.com #RGIS @fegones @mflores72000


Source?

http://gvsigecuador.com #RGIS @fegones @mflores72000


Source?

http://gvsigecuador.com #RGIS @fegones @mflores72000


Source?

http://gvsigecuador.com #RGIS @fegones @mflores72000


Source?

http://gvsigecuador.com #RGIS @fegones @mflores72000


Data Mining?

http://gvsigecuador.com #RGIS @fegones @mflores72000


Data Science?
Contar
Historias

Arte y Tcnica

http://gvsigecuador.com #RGIS @fegones @mflores72000


Google Trends?

http://gvsigecuador.com #RGIS @fegones @mflores72000

You might also like