Professional Documents
Culture Documents
Salazar - Mercedes Mendoza" date: "8 de Noviembre de 2017" output: pdf_document ***
#1.CAPTULO I datos
INTRODUCCIN
Estadstica.-
Se puede definir a la estadstica como la ciencia encargada de recolectar, analizar e
interpretar la informacin, para aportar en el proceso de toma de decisiones de una forma
ms efectiva. Adems la estadstica constituye una herramienta fundamental en la
investigacin cientfica, busca explicar las relaciones y las dependencias que existen entre
fenmenos, ya sea que estos ocurran de manera aleatoria o condicional.
A la estadstica para su comprensin se la puede clasificar en dos grandes grupos que son:
####La estadstica Descriptiva.- Que se encarga de describir (ya sea grfica o
numricamente) la informacin obtenida, de tal manera que se la pueda resumir y observar
con la mayor claridad y exactitud posible
La Estadstica Inferencial.-
Que se encarga de realizar modelos que permitan inferir y/o predecir parmetros de una
poblacin, a partir de la informacin proporcionada por una muestra representativa. A la
estadstica inferencial para distinguirla de acuerdo al tipo de informacin que utiliza en la
muestra se la puede clasificar en estadstica paramtrica o no paramtrica.
2. CAPTULO II
Fundamentos de R
Qu es R?
R es un lenguaje de programacin, principalmente encaminado a desarrollar anlisis
estadstico de la informacin, sea esta cuantitativa o cualitativa, y su respectiva
representacin grfica en los casos que sea posible. Fue iniciado en 1995 por Robert
Gentleman y Ross Ihaka (de sus nombres deriva el nombre de "R") del Statistics
Department "University of Auckland".
R Console
Es el lugar donde se desarrollar todo el trabajo "WorkSpace", desde esta consola el
usuario podr escribir todas las entradas que sean de inters, y as mismo podr visualizar
todas las salidas que puedan producir dichas entradas. Sin duda al escribir en la consola de
R podemos hacer uso de la variedad de objetos que posee este software.
R Studio
El RStudio no es un lenguaje de programacin, sino ms bien se lo puede considerar como
una interfaz que est basada en el lenguaje R, del cual acabamos de hablar.
Paquetes de R
Un paquete o librera no es sino un conjunto de funciones o comandos desarrollados, que
tienen en comn que estn perfeccionados para resolver problemas particulares, por lo que
mediante su uso podemos obtener resultados para necesidades especficas, segn sea el
ambiente de trabajo o rea en la cual nos estemos desenvolviendo.
Ingresando Informacin en R
Para asignar una variable, a cualquier objeto, utilizaremos el operador de asignacin "->", o
en sentido inverso "<-".
vectores
Se trata de la estructura de datos ms sencilla, puesto que es una matriz de dimensin "1 x
p", si lo quisiramos ver como un vector fila, o una matriz "p x 1", si se tratara de un vector
columna.
Matrices
Una matriz es un arreglo bidimensional de nxp elementos dentro de un conjunto ordenado,
donde n representa el nmero de filas y p el nmero de columnas. Dimensin de una
matriz.- Para conocer la dimensin de una matriz ingresada, lo hacemos con el comando
dim( ), el cual nos da como resultado unvector fila con 2 elementos, el primero de ellos
indica el nmero de filas y el 2 elnmero de columnas.
3. CAPTULO III
ANLISIS DE FRECUENCIAS Y REPRESENTACIN GRFICA DE DATOS
Recordemos que la estadstica descriptiva se encarga de describir (ya sea grfica o
numricamente) los datos obtenidos, de tal forma que se puedan resumir y observar con la
mayor claridad y exactitud posible. Se puede definir a un dato como la informacin
recolectada o medida, acerca de una propiedad que tiene un sujeto u objeto, por medio de
algn plan de muestreo.
ANLISIS DE DATOS
Recoleccin de datos simples
df <- CO2
v1 <- df$conc
n <- length(v1) #Nmero de datos
#Frecuencia absoluta
fa <- table(v1)
f.abs <- as.vector(fa)
#Frecuencia absoluta acumulada
faa <- cumsum(fa)
f.abs.ac <- as.vector(faa)
# Frecuencia relativa
fr <- (fa/n)*100
f.re <- as.vector(fr)
#Tabla de frecuencias
mf <- data.frame(f.abs, f.abs.ac, f.re, f.re.ac)
mf
INTERPRETACIN
Dentro de la interpretaciones de datos que se analizaron en la Base "Mauna Loa
Atmospheric CO2 Concentration", podemos encontrar que en la Planta Qn1 de tipo Quebec,
la cual consta de una concentracin dbl de 95 ppm, encontramos una frecuencia absoluta
de 12, es decir que encontramos 12 veces una concentracin de 95 ppm. De la misma
manera, encontramos el mismo valor dentro de la frecuencia abosoluta, es decir que habr
12 observaciones menores o iguales a 95. Para la frecuencia relativa, podemos constatar
que, existe 14.28571, dato a la proporcin que representa su respectiva frecuencia absoluta
dentro de todo el conjunto de observaciones. Finalmente, dentro de la misma
concentracin, encontramos un valor de 14.28571 en frecuencia relativa acumulada,
misma que representa la proporcin de la informacin menor o igual que 95.Cabe recalcar
que, dentro de los siguientes valores analizados, como son; 175, 250, 350, 500, 675, 1000,
encontramos una frecuencia absoluta del mismo valor [12], y una frecuencia relativa de
igual proporcin a la primera, es decir 14.28571. Sin embargo, como se puede visualizar en
las grficas, las frecuencias absolutas y relativas acumulados, tienen varianza en sus
valores.
R Markdown
This is an R Markdown document. Markdown is a simple formatting syntax for authoring
HTML, PDF, and MS Word documents. For more details on using R Markdown see
http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as
well as the output of any embedded R code chunks within the document. You can embed an
R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
Including Plots
You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the code chunk to prevent printing of
the R code that generated the plot.