Professional Documents
Culture Documents
MANEJO DE DATOS
En el programa de R se pueden manejar diversos tipos de datos, para reconocer su
funcionamiento comenzaremos con un ejemplo sencillo, donde los datos se encuentran
dentro de un archivo CSV para su lectura.
LECTURA DE DATOS
Es muy comn que tengamos datos en un archivo CSV listos para procesarlos. Para seguir
este ejemplo descarga los archivos museos.R y museos.csv.
En el archivo museos.csv se encuentra registrado el nmero de museos en cada estado
de la Repblica Mexicana. Los datos se extraen del Censo de Poblacin y Vivienda 2011
en un archivo CSV.
Para leer los datos, utilizaremos la instruccin read.csv() que se encuentra dentro del
archivo museos.R, cuyo argumento principal es la ruta donde se encuentra el archivo.
Dicha ruta la puedes copiar de la barra de direcciones y cambiar las diagonales invertidas
por normales:
attach(data)
Manejo de datos |1
RESULTADO
entidad museos
1
Aguascalientes 14
2
Baja California 24
3 Baja California Sur 10
4
Campeche
6
5
Coahuila 39
6
Colima 20
7
Chiapas 48
8
Chihuahua 51
9
Distrito Federal 152
10
Durango 47
11
Guanajuato 46
12
Guerrero 27
13
Hidalgo 34
14
Jalisco 103
15
Mxico 80
16
Michoacn 36
17
Morelos 34
18
Nayarit 17
19
Nuevo Len 47
20
Oaxaca 45
21
Puebla 64
22
Quertaro 18
23
Quintana Roo 12
24
San Luis Potos 27
25
Sinaloa 26
26
Sonora 38
27
Tabasco 22
28
Tamaulipas 21
29
Tlaxcala 16
30
Veracruz 52
31
Yucatn 29
32
Zacatecas 39
Manejo de datos |2
Trmino
Definicin
intervalo de clase
Marca de clase
Frecuencia absoluta
Frecuencia relativa
n=sum(museos)
fi=museos
hi=museos/n
Fi=cumsum(hi)
Hi=cumsum(museos/n)
Puedes observar las columnas una por una o incorporadas en una tabla:
tabla_frec<-data.frame(entidad=entidad,fi=fi,
hi=round(hi,4),Fi=Fi,Hi=round(Hi,4))
Ahora crearemos un histograma con un polgono de frecuencias:
Manejo de datos |3
hg=hist(museos,main="Histograma
y
Polgono
de
Frecuencias",col="orange",border="white",xlab="Museos")
lines(c(min(hg$breaks),hg$mids,max(hg$breaks)),c(0,hg$co
unts,0), type="b",pch=8,col="blue")
RESULTADO
Para entender mejor el cdigo detrs de cada grfica, te ofrecemos la siguiente informacin:
Manejo de datos |4
Funcin
Descripcin
main=Ttulo
sub=Subttulo
xlab=Etiqueta
ylab=Etiqueta
xlab=c(mx, mn)
ylab=c(mx, mn)
axes=T ( F)
col=color
type=p
type=l
type=h
type=b
type=s
type=S
lty=i
lwd=i
TAREITA
Para complementar los comandos de las grficas, investiga
dos comandos que no se hayan mencionado o explicado y
comntalos en el foro.
Manejo de datos |5