You are on page 1of 9

title: "Grupal estadistica" author: "Grace Rodrguez - Josselyn Negrete - Lady Mora - Evelyn

Salazar - Mercedes Mendoza" date: "8 de Noviembre de 2017" output: pdf_document ***
#1.CAPTULO I datos
INTRODUCCIN

DEFINICIONES Y CONCEPTOS BSICOS.-


La palabra Estadstica procede del vocablo "Estado", ya que precisamente en sus orgene
era este ente el encargado de establecer registros e informacin de los principales hechos
que acontecan en el estado y la dinmica de la poblacin.

Estadstica.-
Se puede definir a la estadstica como la ciencia encargada de recolectar, analizar e
interpretar la informacin, para aportar en el proceso de toma de decisiones de una forma
ms efectiva. Adems la estadstica constituye una herramienta fundamental en la
investigacin cientfica, busca explicar las relaciones y las dependencias que existen entre
fenmenos, ya sea que estos ocurran de manera aleatoria o condicional.
A la estadstica para su comprensin se la puede clasificar en dos grandes grupos que son:
####La estadstica Descriptiva.- Que se encarga de describir (ya sea grfica o
numricamente) la informacin obtenida, de tal manera que se la pueda resumir y observar
con la mayor claridad y exactitud posible

La Estadstica Inferencial.-
Que se encarga de realizar modelos que permitan inferir y/o predecir parmetros de una
poblacin, a partir de la informacin proporcionada por una muestra representativa. A la
estadstica inferencial para distinguirla de acuerdo al tipo de informacin que utiliza en la
muestra se la puede clasificar en estadstica paramtrica o no paramtrica.

2. CAPTULO II
Fundamentos de R
Qu es R?
R es un lenguaje de programacin, principalmente encaminado a desarrollar anlisis
estadstico de la informacin, sea esta cuantitativa o cualitativa, y su respectiva
representacin grfica en los casos que sea posible. Fue iniciado en 1995 por Robert
Gentleman y Ross Ihaka (de sus nombres deriva el nombre de "R") del Statistics
Department "University of Auckland".
R Console
Es el lugar donde se desarrollar todo el trabajo "WorkSpace", desde esta consola el
usuario podr escribir todas las entradas que sean de inters, y as mismo podr visualizar
todas las salidas que puedan producir dichas entradas. Sin duda al escribir en la consola de
R podemos hacer uso de la variedad de objetos que posee este software.

R Studio
El RStudio no es un lenguaje de programacin, sino ms bien se lo puede considerar como
una interfaz que est basada en el lenguaje R, del cual acabamos de hablar.

Paquetes de R
Un paquete o librera no es sino un conjunto de funciones o comandos desarrollados, que
tienen en comn que estn perfeccionados para resolver problemas particulares, por lo que
mediante su uso podemos obtener resultados para necesidades especficas, segn sea el
ambiente de trabajo o rea en la cual nos estemos desenvolviendo.

Ingresando Informacin en R
Para asignar una variable, a cualquier objeto, utilizaremos el operador de asignacin "->", o
en sentido inverso "<-".

vectores
Se trata de la estructura de datos ms sencilla, puesto que es una matriz de dimensin "1 x
p", si lo quisiramos ver como un vector fila, o una matriz "p x 1", si se tratara de un vector
columna.

Matrices
Una matriz es un arreglo bidimensional de nxp elementos dentro de un conjunto ordenado,
donde n representa el nmero de filas y p el nmero de columnas. Dimensin de una
matriz.- Para conocer la dimensin de una matriz ingresada, lo hacemos con el comando
dim( ), el cual nos da como resultado unvector fila con 2 elementos, el primero de ellos
indica el nmero de filas y el 2 elnmero de columnas.

Ingresando una matriz de datos


La forma ms comn que existe en R para ingresar una matriz de datos, donde las filas
representan a los individuos, mientras que las columnas son las variables que se miden
sobre cada uno de estos individuos es con la funcin data.frame( ).
Matrices de Datos en R
R por defecto tiene matrices de datos, las cuales estn formadas por variables cuantitativas
y/o cualitativas, y que pueden ser de ayuda para practicar diversas tcnicas con ellas. Para
saber cules son las matrices de datos existentes, procedemos a escribir el comando data(
), el cual desplegar una lista de todas las matrices existentes en la memoria dentro de una
pestaa llamada "R Data Sets".

3. CAPTULO III
ANLISIS DE FRECUENCIAS Y REPRESENTACIN GRFICA DE DATOS
Recordemos que la estadstica descriptiva se encarga de describir (ya sea grfica o
numricamente) los datos obtenidos, de tal forma que se puedan resumir y observar con la
mayor claridad y exactitud posible. Se puede definir a un dato como la informacin
recolectada o medida, acerca de una propiedad que tiene un sujeto u objeto, por medio de
algn plan de muestreo.

Anlisis Univariado de Frecuencias


Cuando manejamos datos de una variable y queremos resumirlos, una manera de hacerlo
es describir con qu frecuencia estos ocurren. Se trata de determinar cuan repetitivos (en
valor absoluto y porcentaje) son los distintos valores o categoras que toma dicha variable,
tal vez este anlisis sea sencillo e incluso innecesario mientras tengamos poca cantidad de
informacin a analizar, pero mientras ms grande sea el conjunto de datos con el que
estemos trabajando ms importante ser tener un resumen de esta informacin, la cual nos
muestre cules son los datos que estn apareciendo en el conjunto y con qu frecuencia lo
hacen.
Frecuencia absoluta.- En un conjunto de N datos, se denomina frecuencia absoluta ni del i-
simo dato, al nmero total de veces que se repite dicho dato. Si existen un total de h datos
distintos en todo el conjunto, se cumple: = . . . = 1 >
Frecuencia Absoluta Acumulada.- Se denomina frecuencia absoluta acumulada Ni del i-
simo dato, al nmero de observaciones menores o iguales a dicho valor.
Frecuencia Relativa.- Se denomina frecuencia relativa fi del i-simo dato a la proporcin
que representa su respectiva frecuencia absoluta dentro de todo el conjunto de
observaciones.La sumatoria de todas las frecuencias relativas cubrir el 100% de las
observaciones
Frecuencia Relativa Acumulada.- Se denomina frecuencia relativa acumulada Fi del i-
simo dato, a la proporcin de la informacin que es menor o igual a dicho dato.
Grficas para representar frecuencias de datos simples
Las grficas ms comunes que se utilizan para describir las frecuencias de datos son:
Grfico de pastel y Grfica de Barras. A continuacin vamos a mostrar los comandos
respectivos tanto en R como en MATLAB.

Anlisis de frecuencias para datos agrupados


Cuando una variable posee una gran cantidad de datos, y adems las categoras o distintos
datos son muchos, es conveniente agrupar esta informacin por intervalos y determinar la
frecuencia o repitencia de datos que existe dentro de dicho intervalo.

ANLISIS ESTADSTICO - EJERCICIO


El siguiente trabajo estadstico, se basa en la cuantificacin de Concentracin de CO2
Atmosfrico Mauna Loa.
Las concentraciones atmosfricas de CO2 se expresan en partes por milln (ppm) y se
informan en la escala preliminar de la fraccin molar manomtrica SIO de 1997.
Formato
Una serie temporal de 468 observaciones; mensualmente desde 1959 hasta 1997.
Detalles
Faltan los valores de febrero, marzo y abril de 1964 y se han obtenido interpolando
linealmente entre los valores de enero y mayo de 1964.
Fuente
Keeling, C. D. y Whorf, T. P., Scripps Institution of Oceanography (SIO), Universidad de
California, La Jolla, California, EE. UU. 92093-0220.
Por lo cual se analizar, de forma simple la recoleccin de datos obtenidos sobre las distintas concentraciones de
CO2 que se han recolectado:

ANLISIS DE DATOS
Recoleccin de datos simples
df <- CO2
v1 <- df$conc
n <- length(v1) #Nmero de datos

#Frecuencia absoluta
fa <- table(v1)
f.abs <- as.vector(fa)
#Frecuencia absoluta acumulada
faa <- cumsum(fa)
f.abs.ac <- as.vector(faa)

# Frecuencia relativa
fr <- (fa/n)*100
f.re <- as.vector(fr)

# Frecuencia relativa acumulada


fra <- cumsum(fr)
f.re.ac <- as.vector(fra)

#Tabla de frecuencias
mf <- data.frame(f.abs, f.abs.ac, f.re, f.re.ac)
mf

## f.abs f.abs.ac f.re f.re.ac


## 1 12 12 14.28571 14.28571
## 2 12 24 14.28571 28.57143
## 3 12 36 14.28571 42.85714
## 4 12 48 14.28571 57.14286
## 5 12 60 14.28571 71.42857
## 6 12 72 14.28571 85.71429
## 7 12 84 14.28571 100.00000

names <- c("95", "175", "250", "350", "500", "675", "1000")


row.names(mf) <- names
mf

## f.abs f.abs.ac f.re f.re.ac


## 95 12 12 14.28571 14.28571
## 175 12 24 14.28571 28.57143
## 250 12 36 14.28571 42.85714
## 350 12 48 14.28571 57.14286
## 500 12 60 14.28571 71.42857
## 675 12 72 14.28571 85.71429
## 1000 12 84 14.28571 100.00000

#Grafica Frecuencia absoluta


col <- c("green", "pink", "red", "blue", "orange", "yellow", "brown")
pie(x = fa, labels = names, radius = 1, main = "Grafica de pastel", col =
col)
barplot(fa, names.arg = names, main = "Grafica de barras", col =col)
# Grafica frecuencia absoluta acumulada grafica
barplot(faa, names.arg = names, main = "Barras", col = col)

En este apartado se da a conocer un ejemplo claro, sobre la


recoleccin de datos agrupados, basado en un paquede de datos
disponibles en R.
Recoleccin de datos agrupados
z<-BJsales.lead
v<-which.max(z)
v1<-z[which.max(z)]
j<-which.min(z)
j1<-z[which.min(z)]
Rango<-v1-j1
ni <-3.32 *log10(150)
Amplitud<-Rango/7.22
b<-c(seq(9.75, 13.25, 0.5), 13.87)
h<-hist(x=z, plot = F, breaks = b)
f.a<-h$counts
f.a.a<-cumsum(f.a)
f.r<-(f.a/150)*100
f.r.a<-cumsum(f.r)
mf<-data.frame(f.a,f.a.a,f.r,f.r.a)
nam<-c("9.75-10.25","10.25-10.75","10.75-11.25","11.25-11.75","11.75-
12.25","12.25-12.75","12.75-13.25","13.25-13.87")
row.names(mf)<-nam
mf2<-data.frame(mf, row.names = nam)

INTERPRETACIN
Dentro de la interpretaciones de datos que se analizaron en la Base "Mauna Loa
Atmospheric CO2 Concentration", podemos encontrar que en la Planta Qn1 de tipo Quebec,
la cual consta de una concentracin dbl de 95 ppm, encontramos una frecuencia absoluta
de 12, es decir que encontramos 12 veces una concentracin de 95 ppm. De la misma
manera, encontramos el mismo valor dentro de la frecuencia abosoluta, es decir que habr
12 observaciones menores o iguales a 95. Para la frecuencia relativa, podemos constatar
que, existe 14.28571, dato a la proporcin que representa su respectiva frecuencia absoluta
dentro de todo el conjunto de observaciones. Finalmente, dentro de la misma
concentracin, encontramos un valor de 14.28571 en frecuencia relativa acumulada,
misma que representa la proporcin de la informacin menor o igual que 95.Cabe recalcar
que, dentro de los siguientes valores analizados, como son; 175, 250, 350, 500, 675, 1000,
encontramos una frecuencia absoluta del mismo valor [12], y una frecuencia relativa de
igual proporcin a la primera, es decir 14.28571. Sin embargo, como se puede visualizar en
las grficas, las frecuencias absolutas y relativas acumulados, tienen varianza en sus
valores.

R Markdown
This is an R Markdown document. Markdown is a simple formatting syntax for authoring
HTML, PDF, and MS Word documents. For more details on using R Markdown see
http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as
well as the output of any embedded R code chunks within the document. You can embed an
R code chunk like this:
summary(cars)

## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00

Including Plots
You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the code chunk to prevent printing of
the R code that generated the plot.

You might also like