Professional Documents
Culture Documents
ORGANIZANDO DATOS
GESTIÓN DE LA INFORMACIÓN
AUTOR: Edgar Leonardo Becerra Reyes
INICIO
Introducción
Recomendaciones académicas
2 POLITÉCNICO GRANCOLOMBIANO
INTRODUCCIÓN
En
esta
cartilla
se
presenta
la
importancia
de
la
información
definidos
por
datos
o
registros.
Los
datos
son
para
las
compañías
un
valor
fundamental,
puesto
que
dependen
de
estos
para
todas
sus
operaciones.
Es
por
ello
que
es
fundamental
tener
bien
almacenados
estos
datos,
es
decir
de
una
manera
ordenada,
ya
que
estos
permiten
la
toma
de
decisiones
de
manera
acertada
y
ágil.
RECOMENDACIONES ACADÉMICAS
Se
recomienda
al
estudiante
realizar
la
lectura
de
esta
cartilla,
con
el
objetivo
de
poder
entender
y
comprender
los
diferentes
conceptos
y
elementos
que
serán
de
gran
utilidad
durante
el
desarrollo
del
módulo.
Una
vez
finalizada
esta
lectura,
se
recomienda
que
cada
estudiante
realice
una
revisión
de
los
conceptos
y
definiciones
clave
tratadas
durante
el
módulo,
con
el
objetivo
de
afianzar
la
comprensión
de
las
temáticas.
Además
se
debe
recordar
que
en
cada
semana
se
cuenta
con
una
serie
de
recursos
adicionales
que
les
permitirá
a
los
participantes
complementar
el
proceso
de
aprendizaje.
Por
último,
se
recomienda
que
los
participantes
interactúen
con
los
compañeros
y
con
el
tutor
a
través
del
correo
y
de
manera
sincrónica
a
través
de
las
sesiones
de
Elluminate,
para
entender
y
comprender
diferentes
puntos
de
vista.
GESTIÓN DE LA INFORMACIÓN 3
Tener
todos
los
datos
importantes
de
una
compañía
en
desorden,
podría
dificultar
la
comprensión
de
éstos,
ya
que
los
datos
por
si
solos
no
nos
dicen
nada.
El
tener
los
datos
organizados
es
fundamental
para
la
comprensión
y
posteriores
procesamientos.
Vamos
a
repasar
algunos
conceptos
del
Capítulo
3
y
el
Capítulo
5,
en
primer
lugar,
vamos
a
revisar
un
resumen
del
modelo
Relacional
y
en
segundo
lugar
conceptos
de
criterios
y
condiciones.
4 POLITÉCNICO GRANCOLOMBIANO
¿Qué
es
un
modelo?
El
modelo
relacional
es
el
más
utilizado
en
la
actualidad
con
el
fin
de
modelar
problemas
reales
y
efectuar
la
administración
de
datos
dinámicamente.
El
autor
de
los
postulados
de
este
modelo
en
1970
fue
Edgar
Frank
Codd,
de
los
laboratorios
IBM
en
San
José
(California).
¿Cuál es la estructura en el modelo de datos relacional?
GESTIÓN DE LA INFORMACIÓN 5
La
definición
de
modelo
relacional
tiene
su
base
en
la
relación
natural
que
existe
entre
el
elemento
básico
del
modelo
y
su
entorno.
El
modelo
relacional
plasma
en
un
computador
el
esquema
definido
por
entidades
y
relaciones
representadas
físicamente
en
una
base
de
datos
como
tablas
y
relaciones
semejantes
a
matrices
rectangulares,
que
almacenan
líneas
de
datos
concretas.
La
estructura
del
modelo
de
datos
relacional
es
la
asociación
de
las
entidades
a
través
de
sus
atributos,
definiendo
entidades
como
una
clase
de
objetos
o
conceptos
claramente
identificable
dentro
de
la
realidad
a
representar.
Una
base
de
datos
transaccional
es
un
conjunto
de
una
o
más
tablas
con
una
estructura
de
filas
y
columnas,
relacionadas
unas
con
otras
a
través
de
atributos
en
común.
6 POLITÉCNICO GRANCOLOMBIANO
Una
Tabla
o
Relación
están
compuestas
por:
• Columnas:
es
el
nombre
de
los
atributos
que
físicamente
en
la
tabla
se
identifican
como
campos
y
su
tipo
de
datos.
• Filas:
cada
fila
de
la
tabla
es
un
registro,
que
debe
garantizarse
como
único
en
la
tabla.
• Valor:
es
la
información
contenida
en
una
fila
y
columna
específica
dentro
de
la
tabla.
• Campo
Clave:
es
la
columna
de
la
tabla
que
contiene
un
valor
único
que
identifica
al
registro.
GESTIÓN DE LA INFORMACIÓN 7
Una
o
varias
columnas
que
identifican
de
forma
única
a
un
registro
dentro
del
total
de
registros
de
una
tabla
es
denominado
como
clave
primaria.
Es
una
o
varias
columnas,
que
contienen
valores
que
identifican
de
forma
única
al
registro
dentro
del
conjunto
de
registros
total
almacenado
en
la
tabla.
Debido
a
que
existe
la
posibilidad
de
tener
más
de
una
columna
o
conjunto
de
columnas
que
cumplan
con
las
características
de
esta
definición,
es
necesario
tener
en
cuenta
el
concepto
de
claves
candidatas.
Claves
candidatas:
se
define
como
el
campo
o
conjunto
de
campos
que
identifican
en
forma
única
el
registro,
son
candidatas
para
ser
clave
primaria.
Pero
la
selección
de
la
clave
primaria
se
efectúa
eligiendo
la
clave
candidata
con
menor
número
de
columnas.
8 POLITÉCNICO GRANCOLOMBIANO
El
establecimiento
de
una
relación
entre
dos
tablas
se
efectúa
a
través
de
la
identificación
de
la
columna
que
es
clave
primaria
de
la
tabla
que
es
referencia
de
otra.
Es el conjunto de uno o más atributos (columnas) que son clave primaria en otra tabla.
Condicionales y criterios
Los
siguientes
criterios
pueden
ser
aplicados
a
cualquiera
de
los
campos
dentro
de
la
fuente
de
información.
Numéricos
• •
Mayor
que
o
menor
que:
retorna
aquellos
valores
que
sean
superiores
o
inferiores
en
número
al
criterio
dado.
Ejemplo:
en
una
tabla
de
inventarios,
dentro
de
campo
“Cantidad”,
que
indica
la
cantidad
de
productos
disponibles,
al
aplicar
el
criterio
Cantidad
>
200,
devolverá
los
resultados
de
aquellos
productos
en
los
que
haya
más
de
200
unidades
disponibles.
• •
Mayor
o
igual
que
o
menor
o
igual
que:
retorna
aquellos
valores
que
sean
superiores
o
inferiores
en
número
al
criterio
dado.
Ejemplo:
en
un
campo
“Edad”,
al
aplicar
el
criterio
Edad
>=
18,
devolverá
los
resultados
de
aquellas
personas
que
sean
mayores
de
edad,
incluidos
aquellos
que
tengan
18
años.
• •
Comienza
con
o
No
comienza
con:
busca
las
cadenas
de
texto
dentro
del
campo
que
comiencen
o
no
comiencen
con
el
criterio
dado.
Por
ejemplo,
filtrar
por
los
apellidos
que
comienzan
por
la
letra
C,
sería:
Apellido
begins
with
‘C’
• •
Finaliza
con
o
No
finaliza
con:
busca
las
cadenas
de
texto
dentro
del
campo
que
finalicen
o
no
finalicen
con
el
criterio
dado.
• •
Contiene
o
no
contiene:
busca
cadenas
de
texto
que
contengan
en
cualquier
lugar
del
campo
el
criterio
dado.
Por
ejemplo,
NombreProducto
contains
‘juguete’
busca
dentro
de
los
productos
aquellos
que
contengan
juguete.
GESTIÓN DE LA INFORMACIÓN 9
Numéricos
y
alfanuméricos
o
de
texto
igual
o
no
igual:
este
criterio
puede
ser
utilizado
en
cualquier
campo.
Básicamente
busca
dentro
del
campo
aquellas
cadenas
de
texto
o
números
que
sean
exactamente
iguales
al
criterio
dado.
Por
ejemplo,
si
queremos
filtrar
la
información
referente
a
la
ciudad
de
Bogotá,
el
criterio
sería:
Ciudad
=
‘Bogotá’.
Si
para
el
ejemplo
anterior
el
criterio
fuera
enviado
así:
Ciudad
=
‘Bogotá’,
no
devolvería
los
mismos
resultados
que
el
criterio
inicial,
ya
que
‘Bogotá’
es
diferente
a
‘Bogotá’.
Si
se
obtienen
resultados
con
ambos
criterios,
se
podría
utilizar
por
ejemplo
el
criterio
de
la
siguiente
manera:
Ciudad
begins
with
‘Bog’
y
obtendríamos
indistintamente
resultados
de
cualquiera
de
los
dos
textos.
Es
importante
aclarar
que
un
criterio
mal
aplicado
podría
devolver
resultados
erróneos
respecto
a
la
realidad
de
la
información.
Por
ejemplo,
si
se
trata
de
utilizar
un
criterio
numérico
sobre
uno
de
texto,
como
en
Ciudad
>
‘Bogotá’,
el
reporte
no
devolverá
resultados
ya
que
Ciudad
es
un
campo
de
texto
al
que
se
está
aplicando
el
criterio
‘Mayor
que’,
que
corresponde
a
un
criterio
para
campos
numéricos.
Los
criterios
anteriores
nos
dan
la
opción
de
generar
nuevas
visualizaciones
de
los
datos
sobre
los
orígenes
de
información,
aplicando
cada
uno
de
ellos
a
un
campo
específico.
Sin
embargo,
es
también
posible
tener
más
de
un
criterio
seleccionado
en
la
información,
es
decir,
podemos
a
más
de
un
campo
aplicar
un
filtrado,
reduciendo
y
simplificando
aún
más
la
información,
centrándonos
cada
vez
más
en
la
información
que
necesitamos.
Para
combinar
estos
criterios,
debemos
utilizar
entre
ellos
unas
condiciones
adicionales
llamadas
conectores
condicionales.
Estos
conectores
condicionales
son
simplemente
un
criterio
más
que
une
dos
criterios
básicos.
Los
dos
más
comúnmente
usados
son:
AND
y
OR.
• El
conector
AND
condiciona
que
los
dos
criterios
deben
cumplir
con
ambos
requisitos,
es
decir,
incluirá
información
de
ambos
criterios.
• •El
conector
OR
hace
que
la
información
venga
de
uno
u
otro
criterio.
Por
ejemplo,
si
queremos
obtener
el
listado
de
personas
cuyo
apellido
comienza
por
la
letra
‘C’
y
que
pertenecen
a
la
ciudad
de
Bogotá,
utilizaríamos
los
dos
siguientes
criterios,
unidos
por
el
conector
AND:
10 POLITÉCNICO GRANCOLOMBIANO
En
este
filtro
utilizamos
dos
criterios
básicos
(‘comenzar
con’
e
‘igual
a’)
unidos
por
el
conector
AND.
Hasta
ahora,
hemos
utilizado
criterios
con
textos
o
números
que
generalmente
coinciden
con
el
contenido
almacenado
en
los
campos.
Por
ejemplo,
si
queremos
buscar
todas
las
personas
que
viven
en
cierta
ciudad,
hemos
colocado
el
nombre
de
la
ciudad
tal
como
fue
grabado
en
la
base
de
datos.
Sin
embargo,
algunas
veces
es
de
mucha
utilidad
utilizar
caracteres
especiales
que
pueden
reemplazar
parte
de
los
textos
con
el
fin
de
traer
mayor
cantidad
de
datos
que
tal
vez
antes
eran
omitidos.
Estos caracteres especiales son conocidos como comodines y son los siguientes los más utilizados:
• Comodín
‘?’
que
reemplaza
carácter
por
carácter
dentro
de
una
cadena
de
texto
•
Comodín
‘*’
que
reemplaza
una
cadena
de
caracteres
dentro
de
una
cadena
de
texto
El filtro Ciudad = ‘Bogot?’ retornará aquellos valores cuya ciudad sea Bogotá o
Bogota.
El
filtro
Apellido
=
‘Ro*’
retornará
aquellas
personas
cuyo
Apellido
comience
por
Ro,
como
por
ejemplo
Rodríguez,
Romero,
Roa,
etc.
El
filtro
Apellido
=
‘Rodr?gue?’
retornara
aquellas
personas
cuyo
Apellido
sea
Rodríguez,
Rodriguez,
Rodrigues,
Rodrígues.
Los
criterios
anteriores
nos
dan
un
campo
de
acción
bastante
amplio
para
el
filtrado
de
información.
Podemos
combinar
todos
los
criterios
básicos,
los
conectores
condicionales
y
los
comodines
de
reemplazo
de
caracteres
para
crear
unos
filtros
mucho
más
avanzados
que
los
que
hemos
visto
hasta
ahora,
con
lo
que
la
nueva
visualización
que
tendremos
de
la
información
será
mucho
más
específica
y
resumida.
Por
ejemplo,
si
queremos
extraer
de
la
fuente
de
información,
las
mujeres
que
viven
en
Bogotá,
que
son
mayores
de
edad
y
que
han
adquirido
productos
de
belleza
en
el
último
año,
una
opción
de
filtro
sería
de
la
siguiente
manera:
(asumimos
que
el
año
actual
es
2009
y
que
el
formato
de
fecha
utilizado
por
el
gestor
de
base
de
datos
es
Día/Mes/Año)
GESTIÓN DE LA INFORMACIÓN 11
Ciudad = ‘Bogotá’ and Edad >= 18 and CategoriaProducto = ‘Belleza’ and
FechaCompra = ‘??-‐‑??-‐‑2009’
La
siguiente
opción
nos
traerá
aún
más
información,
pero
cumpliendo
los
mismos
criterios
anteriores:
Ciudad
=
‘Bogot?’
and
Edad
>=
18
and
CategoriaProducto
contains
‘Belleza’
and
FechaCompra
=
‘??-‐‑??-‐‑2009’
Algunas
herramientas
dan
la
posibilidad
de
poder
ubicar
cada
uno
de
estos
criterios
en
diferentes
campos
dentro
de
la
misma
tabla,
de
modo
que
la
edición
de
los
criterios
pueda
realizarse
con
mayor
facilidad.
Estos
campos
especiales
que
contienen
criterios,
son
ubicados
en
un
lugar
específico
de
modo
que
la
herramienta
sabe
que
estos
campos
corresponden
a
criterios
de
filtrado.
Las
zonas
que
contienen
campos
de
criterios
son
conocidas
como
áreas
de
criterios.
Para uno de los filtros de ejemplo mostrado en la página anterior
Ciudad
=
‘Bogotá’
and
Edad
>=
18
and
CategoriaProducto
=
‘Belleza’
and
FechaCompra
=
‘??-‐‑??-‐‑
2009’,
el
área
de
criterios
tendría
4
campos,
cada
uno
con
el
criterio
indicado.
Del
mismo
modo,
las
herramientas
especifican
la
ubicación
de
los
datos
de
una
manera
específica,
de
manera
que
se
pueda
saber
si
los
diferentes
campos
de
criterio
son
unidos
por
conectores
OR
o
AND.
12 POLITÉCNICO GRANCOLOMBIANO
2. Creando
y
organizando
datos
Al
ingresar
los
registros
en
una
Tabla,
generalmente
se
lleva
a
cabo
sin
tener
en
cuenta
un
orden
y
eso
hace
que
en
ocasiones
no
tengamos
una
visión
general
adecuada
de
la
base
de
datos.
Surge
la
necesidad
de
ordenarlos
para
tener
diferentes
visiones
de
las
tablas
de
la
base
de
datos,
es
por
ello
que
las
herramientas
de
bases
de
datos
permiten
ordenar
los
datos
convenientemente
de
acuerdo
a
las
necesidades
y
de
esta
manera
poder
localizar
los
datos
con
mayor
facilidad.
Según contenido
Se
puede
ordenar
alfanuméricamente
de
manera
ascendente
(de
menor
a
mayor)
o
descendente
(de
mayor
a
menor).
También
se
puede
con
un
criterio
personalizado,
por
ejemplo,
por
fecha,
mes,
día
de
la
semana,
lógico
(verdadero
o
falso)
entre
otros,
ya
sea
de
manera
ascendente
o
descendente.
Para cada columna o nivel se debe ordenar según contenido y criterio de ordenamiento.
GESTIÓN DE LA INFORMACIÓN 13
El
proceso
de
ordenamiento
de
datos
consiste
en
organizar
los
registros
de
una
tabla
mediante
un
campo
de
cualquier
tipo.
Se
pueden
generar
ordenamientos
pro
campos
alfanuméricos,
numéricos,
fechas
y
lógicos.
Para
ordenar
una
tabla,
lista
o
ente,
se
debe
seleccionar
en
primer
lugar
toda
la
fuente
a
ordenar
incluyendo
títulos
y
registros,
normalmente
en
la
mayoría
de
los
motores
de
bases
de
datos
esto
es
automático.
Segundo
se
deben
definir
los
criterios
de
ordenamientos,
es
decir
que
campos
se
van
usar
para
la
operación.
Al
definir
el
campo
se
establece
como
va
a
hacer
el
tipo
de
ordenamiento
ascendente
o
descendente,
cabe
anotar
que
si
se
eligen
más
de
dos
campos
la
tabla
no
va
a
quedar
ordenada
por
los
dos
campos
al
mismo
tiempo,
lo
que
el
sistema
hará
es
ordenar
por
el
primer
campo
y
se
encuentra
repetidos
por
ese
campo
usara
el
segundo
campo
o
criterio
para
realizar
el
ordenamiento.
3. Validando datos
La validación de datos tiene muchas funcionalidades, entre las cuales se encuentran:
Hace
validaciones
de
datos
que
vienen
por
defecto
y
adicionalmente
se
puede
incluir
fórmulas
matemáticas.
La
validación
es
un
mecanismo
que
garantiza
la
calidad
y
la
integridad
de
los
datos
de
un
sistema
de
información.Esta
tarea
consiste
en
clasificar
la
información
que
se
va
a
ingresar
a
la
base
de
datos,
esta
información
puede
contener
fechas,
nombres,
saldos,
ventas,
pérdidas,
etc.,
que
son
representados
por
números,
texto
o
ambos,
en
este
caso
lo
conveniente
es
ubicar
los
mismos
tipos
de
datos.
Es
decir,
si
se
tiene
la
columna
con
título:
FechaIngreso,
los
datos
que
deben
ir
en
las
columnas
deben
ser
únicamente
de
tipo
fecha.
Un
ejemplo
puede
ser
definir
el
citereo:
permitir
números
enteros,
entre
un
valor
“x”
y
entre
un
valor
“y”,
donde
“x”
y
“y”
pueden
ser
valores
o
un
conjunto
de
celdas
que
tienen
datos
enteros.
14 POLITÉCNICO GRANCOLOMBIANO
4. Filtrando
datos
Filtrar
es
seleccionar
un
conjunto
de
datos
acorde
a
criterios
definidos
con
anterioridad
para
luego
ser
mostrados.
Los
filtros
dentro
del
lenguaje
de
Excel
son
herramientas
que
toman
un
criterio
y
lo
aplican
a
un
conjunto
de
datos.
Absolutamente
todo
se
puede
filtrar,
desde
números,
texto,
o
ambos,
o
caracteres
especiales.
Los
filtros
toman
como
base
criterios
matemáticos
como
los
números
que
sean
mayores
o
menores
a
determinada
suma.
Los
filtros
permiten
hacer
un
ordenamiento
en
forma
descendente
y
ascendente,
ya
sea
para
tipo
de
datos
numéricos
o
alfabéticos.
El
proceso
de
filtrar
consiste
en
seleccionar
información
bajo
un
criterio,
el
criterio
normalmente
está
constituido
por
el
nombre
del
campo
y
un
valor
del
campo,
esto
permite
seleccionar
los
registros
que
nos
interesa
de
la
tabla
o
base
de
datos.
Para filtrar se debe tener en cuenta que debe contar con tres elementos importantes:
La
lista
o
tabla
de
datos
que
se
desea
filtrar,
los
criterios
de
selección
o
evaluación,
y
la
salida
de
los
datos.
La
lista
o
tabla
de
datos
es
la
tabla
conformada
por
registros
y
organizados
por
columnas
llamados
campos,
el
cual
será
analizada
para
extraer
los
registros
que
cumplan
con
la
condición.
Los criterios son campos con valores que deben cumplir los registros a seleccionar.
El rango de salida contiene los títulos de campos que se desea mostrar.
GESTIÓN DE LA INFORMACIÓN 15
REFERENCIAS
Referencias bibliográficas
• Heijden,
H.
(2009).
Designing
management
information
systems.
New
York,
USA:
Oxford
University
Press.
• Lache,
L.,
León,
A.,
Bravo,
E.,
Becerra,
L.,
&
Forero,
D.
(Mayo
de
2016).
Las
tecnologías
de
información
y
comunicación
como
prácticas
de
referencia
en
la
gestión
de
conocimiento:
una
revisión
sistemática
de
la
literatura.
UIS
Ingenierías,
15(01),
27-‐40.
• Oz,
E.
(2009).
Management
Information
Systems
(6ta
ed.).
Pennsylvania,
USA:
Thomson,
course
technology.
16 POLITÉCNICO GRANCOLOMBIANO