Professional Documents
Culture Documents
INFORMACIO
N DE
TALENTO
201
HUMANO
0
Los archivos son el conjunto organizado de informaciones del
MANEJO DE
mismo tipo, que pueden utilizarse en un mismo tratamiento; ARCHIVOS E
como soporte material de estas informaciones. INFORMACIÓ
N
SERVICIO NACIONAL DE APRENDIZAJE (SENA)
CENTRO DE GESTION ADMINISTRATIVA
MARICELA FARFAN MARTINEZ
GRUPO 66413
AGOSTO 19 DE 2010
BOGOTA D.C.
GRUPO 66413
AGOSTO 19 DE 2010
BOGOTA D.C.
INDICE
1.RECUPERACIÓN DE LA INFORMACIÓN.
2. COPIAS DE SEGURIDAD DE LA INFORMACIÓN.
3. COSTOS DE ALMACENAMIENTO.
4. MEDIOS DE ALMACENAMIENTO
5. CLASES DE ARCHIVOS.
1. RECUPERACIÓN DE LA INFORMACIÓN.
La recuperación de información, llamada en inglés information retrieval (IR), es la
ciencia de la búsqueda de información en documentos, búsqueda de los mismos
documentos, la búsqueda de metadatos que describan documentos, o, también, la
búsqueda en bases de datos, ya sea a través de internet, intranet, para textos,
imágenes, sonido o datos de otras características, de manera pertinente y relevante.
La recuperación de información es un estudio interdisciplinario. Cubre tantas disciplinas
que eso genera normalmente un conocimiento parcial desde tan solo una u otra
perspectiva. Algunas de las disciplinas que se ocupan de estos estudios son la
psicología cognitiva, la arquitectura de la información, diseño de la información, el
comportamiento humano hacia la información, la lingüística, la semiótica, informática,
biblioteconomía y documentación.
Los buscadores, tales como Google, Lycos y Copernic, son algunas de las aplicaciones
más populares de la recuperación de información. Básicamente hay que construir un
Vocabulario, que es una lista de términos en lenguaje natural, un algoritmo que
incluya las reglas lógicas de la búsqueda {Tabla de verdad} y una valoración de los
resultados o cantidad de información lograda o posible. Este motor de búsqueda es
pues el que permite plantear una pregunta con no menos de dos términos (en algunos
casos pueden ser menos de dos términos) y mostrar los resultados mínimos y el
logaritmo natural de las interacciones será alrededor de 3.
Algunos de los estudiosos más destacados dentro de esta subdisciplina son Gerard
Salton, W Bruce Croft, Karen Spärck Jones, Keith van Rijsbergen y Ricardo Baeza-
Yates.
A veces se plantean ciertos problemas a la hora de recuperar información provocados
por el uso del lenguaje natural (entre otras razones) como el silencio (debido a la
sinonimia), el ruido (debido a la polisemia), homografía, ambigüedad, etc.
Recuperación de información
El proceso de recuperación se lleva a cabo mediante consultas a la base de datos
donde se almacena la información estructurada, mediante un lenguaje de interrogación
adecuado. Es necesario tener en cuenta los elementos clave que permiten hacer la
búsqueda, determinando un mayor grado de pertinencia y precisión, como son: los
índices, palabras clave, tesauros y los fenómenos que se pueden dar en el proceso
como son el ruido y silencio documental. Uno de los problemas que surgen en la
búsqueda de información es si lo que recuperamos es "mucho o poco" es decir,
dependiendo del tipo de búsqueda se pueden recuperar multitud de documentos o
simplemente un número muy reducido. A este fenómeno se denomina Silencio o Ruido
documental.
Silencio documental: Son aquellos documentos almacenados en la base de datos
pero que no han sido recuperados, debido a que la estrategia de búsqueda ha sido
demasiado específica o que las palabras clave utilizadas no son las adecuadas para
definir la búsqueda.
Ruido documental: Son aquellos documentos recuperados por el sistema pero que no
son relevantes. Esto suele ocurrir cuando la estrategia de búsqueda se ha definido
demasiado genérica.
Concepto de sistema de recuperación de información
Proceso donde se accede a una información previamente almacenada, mediante
herramientas informáticas que permiten establecer ecuaciones de búsqueda
específicas. Dicha información ha debido de ser estructura previamente a su
almacenamiento.
2. COSTOS DE ALMACENAMIENTO.
EJEMPLO DE COSTO DE ALMACENAMIENTO
Las memorias se han convertido en el sistema de almacenamiento y transporte
personal de datos más utilizado, desplazando en este uso a los tradicionales disquetes,
y a los CD. Se pueden encontrar en el mercado fácilmente memorias de 1, 2, 4, 8, 16,
32, 64, 128 y hasta 256 GB; siendo impráctico a partir de los 64GB por su elevado
costo. Esto supone, como mínimo, el equivalente a 180 CD de 700MB o 91.000
disquetes de 1.44 MB aproximadamente. Su gran popularidad le ha supuesto infinidad
de denominaciones populares relacionadas con su pequeño tamaño y las diversas
formas de presentación, sin que ninguna haya podido destacar entre todas ellas. El
calificativo USB o el propio contexto permite identificar fácilmente el dispositivo
informático al que se refieren.
Los sistemas operativos actuales pueden leer y escribir en las memorias sin más que
enchufarlas a un conector USB del equipo encendido, recibiendo la energía de
alimentación a través del propio conector que cuenta con 5 voltios y 2,5 vatios como
máximo. En equipos algo antiguos (como por ejemplo los equipados con Windows 98)
se necesita instalar un controlador de dispositivo (driver) proporcionado por el
fabricante. Linux también tiene soporte para dispositivos de almacenamiento USB
desde la versión 2.4 del núcleo.
3. COPIAS DE SEGURIDAD DE LA INFORMACIÓN.
5. MEDIOS DE ALMACENAMIENTO
De leer datos porque sin leer datos ni tan siquiera podría ponerse en marcha y
de archivar datos porque si no podemos guardar nuestro trabajo ¿para qué
queremos el ordenador?.
• DISQUETES
Con una capacidad en principio de 360 Kb (una sola cara) pasó en 1.986 al
formato DS o Double Side (2 caras x 360 Kb.) y posteriormente, en el año
1.987, a los disquetes de alta densidad (HD o High Density), de 1.44 Mb. (2
caras x 720 Kb.).
Estos son los mismos que utilizamos hoy en día, convirtiendo a las disqueteras
de 3.5' en el elemento que menos ha evolucionado en la historia del PC, ya que
no ha cambiado en nada en los últimos 20 años (de hecho, una disquetera de
1.987 es exactamente igual a una de 2.006 y funciona perfectamente en
cualquier ordenador actual, por potente y avanzado que sea, al igual que el
disquete correspondiente).
Los disquetes, aunque cada vez se usan menos, siguen siendo útiles como
medio de arranque del PC y para transportar archivos de pequeño tamaño
(hasta 1.4 megas).
En el año 1.995, Sony sacó al mercado unos discos ópticos denominados LS-
120, en formato 3 ½', con una capacidad de 120 Mb, que debido a la lentitud
de lectura y al alto precio tanto de los disquetes como de las disqueteras (estas
ultimas también podían leer los disquetes de 3 ½' normales) y a que eran
bastante sensibles al medio (temperatura, polvo, humedad), tampoco tuvieron
demasiado éxito.
• DISCOS DUROS
Por el tipo de interface o conexión, los discos duros pueden ser IDE (ATA),
Serial ATA y SCSI, pudiendo ir estos conectados bien directamente al
ordenador o utilizarse como medios externos, mediante una caja con conexión
USB, SCSI o FireWire.
SCSI
Estos discos deben estar conectados a una controladora SCSI. Han sido mas
rápidos que los IDE y de mayor capacidad hasta la aparición del ATA/100,
permitiendo una velocidad de trasmisión de hasta 80 MBps, y discos con una
velocidad de giro de unas 10.000 rpm.
PISTAS
Que son un conjunto de circunferencias concéntricas dentro de cada cara.
CILINDROS
Que es un conjunto de pistas de todas las caras (2 por disco), alineadas
verticalmente.
SECTORES
Que son cada una de las divisiones de las pistas. Actualmente tienen un tamaño
fijo de 512 bytes. Antiguamente, el numero de sectores por pista era fijo, con lo
que al ser estas circunferencias, se desperdiciaba mucho espacio. Con la
aparición de la tecnología ZBR (Zone Bit Recording, o grabación de bits por
zona) se solucionó este problema, al hacer que cada pista tenga mas sectores
que la anterior. Esto hace por un lado que la capacidad de los discos, a igual
tamaño físico, sea mayor y por otro que la velocidad de lectura se incremente
según las pistas se alejan del centro, al leer el cabezal más información en cada
giro del disco.
TABLA DE PARTICIONES
Alojada en el MBR, a partir del byte 446. Consta de 4 particiones de 16 bytes,
llamadas particiones primarias, en las que se guarda toda la información de las
particiones.
PARTICIONES
Son las partes en que dividimos el disco duro. El tema de las particiones es
bastante largo de explicar, por lo que baste decir que un disco solo puede tener
4 particiones, una extendida y 3 primarias, si bien dentro de la extendida se
pueden hacer particiones lógicas, que son las que el HDD necesita para que se
pueda dar un formato lógico del Sistema Operativo.
FAT32
Guarda las direcciones en clúster de 32 bits, por lo que permite discos de hasta
32 Gb, aunque con herramientas externas a Microsoft puede leer particiones
mayores, con un límite en el tamaño de archivo de 4 Gb, lo que lo hace poco
apto sobre todo para trabajos multimedia. Apareció con Windows 95 OSR2 y
para pasar un HDD de FAT a FAT32 era necesario formatear el HDD hasta que
Windows 98 incorporó una herramienta que permitía pasar de FAT16 a FAC32
sin necesidad de formatear.
NTFS
Diseñado para Windows NT, esta basado en el sistema de archivos HPFS de
IBM/Microsoft, usado por el sistema operativo OS/2 de IBM.
Permite definir clúster de 512 bytes, que es lo mínimo en lo que se puede
dividir un disco duro, por lo que a diferencia de FAT y FAT32 desperdicia
poquísimo espacio.
Debemos tener en cuanta que la unidad básica de almacenamiento es el
clúster, y que en FAT32 el clúster es de 4 Kb, por lo que un archivo de 1 Kb
ocupará un clúster, del que se estarán desperdiciando 3 Kb.
Además, NTFS admite tanto compresión nativa de ficheros como encriptación
(esto a partir de Windows 2000). NTFS tiene algunos inconvenientes, como que
necesita reservarse mucho espacio del disco para su uso, por lo que no se debe
usar en discos de menos de 400 Mb, no es es accesible desde MS-DOS ni con
sistemas operativos basados en el y es unidireccional, es decir, se puede
convertir una partición FAT32 a NTFS sin formatear ni perder datos, pero no se
puede convertir una partición NTFS a FAT32.
Reseñar que el programa Fdisk, utilizado para crear las particiones, al estar
basado en DOS, reconoce las particiones NTFS como Non-DOS.
LAPICES DE MEMORIA
Creados por IBM en 1.998 para sustituir a los disquetes en las IBM Think Pad,
los lápices de memoria (también llamados Memory Pen y Pendrive) funcionan
bajo el Estándar USB Mass Storage (almacenamiento masivo USB).
Los actuales Pendrive usan el estándar USB 2.0, con una transferencia de hasta
480 Mbit/s, aunque en la práctica trabajan a 160 Mbit/s.
Una variante de los lápices de memoria son los reproductores de MP3 y MP4.
Estos no son más que lápices de memoria a los que se les ha incorporado una
pila, una pantallita, una salida de audio y un chip programado para leer y
reproducir ciertos archivos, de música en el caso de los MP3 y de música y
video en los MP4, y controlar las demás funciones.
Evidentemente, un MP3 también nos puede servir para transportar datos de un
ordenador a otro, ya que, en la inmensa mayoría de los casos, los ordenadores
lo reconocen como sistema de almacenamiento masivo.
TARJETAS DE MEMORIA
Mini MMC
Usadas sobre todo en telefonía móvil. Con adaptador para lectores de tarjetas.
Este medio esta en plena evolución, por lo que las capacidades son solo
orientativas. Entre ellas existen diferencias, tanto de velocidad de transmisión
de datos (incluso entre tarjetas del mismo tipo) como, sobre todo, de forma y
tamaño.
UNIDADES ZIP
•
•
CDs
DVDs
Por su mayor capacidad (de 4.5 Gb en los normales y de 8,5 Gb en los de doble
capa) y mayor calidad en la grabación, es el medio ideal para multimedia de
gran formato y copias de seguridad de gran capacidad.
Existen dos tipos diferentes de e DVD: DVD –R y DVD +R. Ambos tipos son
compatibles en un 90% de los lectores y su diferencia se debe mas a temas de
patentes que a temas técnicos (aunque existen algunas pequeñas diferencias).
Al igual que ocurre con los cds, una vez cerrada su grabación, esta no se puede
alterar, pero también existen DVDs regrabables, tanto +R como –R. Hay
también DVD de 8 cm. que son usados por algunas videocámaras digitales en
sustitución de la tradicional cinta de 8 mm.
Podemos dividir los archivos en dos grandes grupos. Éstos son los ejecutables y los no
ejecutables o archivos de datos. La diferencia fundamental entre ellos es que los
primeros están creados para funcionar por si mismos y los segundos almacenan
información que tendrá que ser utilizada con ayuda de algún programa.
De todos modos, la mayoría de los programas llevan otros archivos que resultan
necesarios aparte del ejecutable. Estos archivos adjuntos que requieren los programas
son necesarios para su buen funcionamiento, y aunque puedan tener formatos
distintos no pueden ser separados de su programa original. O al menos si queremos
que siga funcionando bien.
Dentro de los archivos de datos se pueden crear grupos, especialmente por la temática
o clase de información que guarden. Así lo haremos en este tutorial. Separaremos los
grupos en archivos de imágenes, de texto, de vídeo, comprimidos... y nombraremos
algunos programas asociado
7. CONCEPTOS BÁSICOS DE MICROFILMACIÓN Y DIGITALIZACIÓN DE
LA INFORMACIÓN APLICADOS A LA GESTIÓN DE LA INFORMACIÓN