You are on page 1of 18

Universidad Nacional de Asuncin

FACULTAD POLITCNICA

Licenciatura en Ciencias Informticas

Informtica I

Tema: Buscadores de Informacin.

Docente: Lic. Juan Carlos Barreto C.

Alumno: Ever Hugo Vega Ortiz


Miki Canatta

Grupo: I
INTRODUCCIN

En esta investigacin monogrfica, se encontrar lo ms relevante informacin


sobre los buscadores de informacin, detallando su definicin y concepto
habitual que se conoce de buscador.

Conociendo los conceptos ms fundamentales, se localizara cul es su funcin


de un buscador, as como su clasificacin, su objetivo principal y los tipos de
buscadores que nosotros nos podemos encontrar en internet.

Al igual, se adentrar a fondo cual son los componentes de los buscadores;


donde se definir sus mecanismos, como los los robots de rastreo, algoritmo de
indexacin y el interfaz, ya que estos elementos son fundamentales, que nos
ayudan a generar nuestra bsqueda y encontrar la informacin que nosotros
requerimos.

Ya que tambin se mostrarn cules son algunas tcnicas y estrategias, para


lograr una buena bsqueda por internet. Al igual que algunos consejos para ser
ms fcil nuestra bsqueda.

Al final de esta investigacin se darn a conocer algunos buscadores de


informacin, ya que estos buscadores son los ms importantes y ms actuales
del mundo. Por lo que hay muchas formas y herramientas que nos ayudan a
lograr una excelente bsqueda, por lo que hay que hay que considerar que no
solo existe un solo buscador, si no miles.
1. BUSCADOR

1.1 Buscador

1.1.1 Historia de los buscadores

1994:

EInet Galaxy--------Directorio de 1994

El primer directorio como tal y como ahora lo conocemos en la actualidad .

En abril de 1994 David Filo y Jerry Yang crearon Yahoo!. Comenz


como un directorio, por lo que tuvo que evolucionar incorporando
un buscador para ese directorio

Brian Pinkerton presento WebCrawlerEn realidad este buscador era


de escritorio pero tiempo despus ya era un buscador en un robot de
la red 20 de abril de 1994

Dos aos despus; en 1996

El proyecto Google comienza a desarrollarse en enero de 1996 Sergey


Brin y Larry Page. Hay que destacar dos razones por las que Google se
hizo muy interesante: una interfaz muy clara y sencilla (como la de
AltaVista en sus inicios) y unos resultados muy relevantes

Ocho aos despus:

En marzo de 2004 algunos buscadores comenzaron a utilizar la base de


datos de Yahoo!

Comenzaron a aparecer nuevos proyectos muy interesantes. Uno de


ellos es Nutch, un motor de bsqueda en cdigo abierto hecho por Java.
Aunque su desarrollo es costoso, ha conseguido el apoyo de Yahoo!

En noviembre de 2004, MSN Search y de la mano de Christopher Payne


y Oshoma Momoh pusieron en marcha una primera fase publicada del
motor de Microsoft, que se hizo publicada el 20 de enero del 2005. El 1
de noviembre de 2005 se presentaba la plataforma Windows Live que
sera la nueva interfaz del motor de bsqueda.

En 2006 y 2007

Hakia y Powerset motor de bsqueda semntica

La bsqueda semntica es un proceso utilizado para mejorar la bsqueda por


Internet mediante el uso de datos de las redes semnticas para desambiguar las
consultas y el texto de la web con la finalidad de encontrar los resultados ms
relevantes en relacin a la demanda del usuario.
1.1.1 Definicin de buscadores

Los buscadores son los sitios ms frecuentados de internet, y por lo
general, el mejor punto de partida de todo recorrido por la red.
A los buscadores tambin se les denomina web crawlers ya que van

avanzando por la red (crawl, en ingls, ir a rastras).

Un buscador o motor de bsqueda es un


sistema o aplicacin informtica que permite la bsqueda de
todo tipo de trminos y palabras clave a partir del desarrollo de ndices
de archivos almacenados en servidores web.

La utilizacin de buscadores web se ha convertido en uno de los principales


motivos de uso de Internet, facilitando la obtencin de informacin y el trabajo de
fondo investigativa pero tambin con fines sociales, recreativos y personales.

Los buscadores poseen enormes bases de datos que contienen informacin


referente a pginas web. Estas bases de datos se generan por las altas de
usuarios que han creado sus pginas web (esto equivaldra a poner tus datos en
un listn telefnico). En muchos buscadores, si el creador de la pgina no se da
de alta en el buscador, la pgina no aparecer. Para las empresas es muy
importante promocionar sus pginas en los buscadores para que la gente las
encuentre fcilmente.

Los buscadores son o bien motores de bsqueda, es decir, bases de datos que
incorporan nuevos trminos en forma constante y automtica, o bien, ndices
temticos, sistemas que requieren de un componente humano y manual para el
ingreso y asignacin de sitios web a palabras clave y categoras.

1.1.2 Funcin de los buscadores

Proporcionar al usuario informacin sobre todas las pginas Web relacionado con
el tema que le hemos indicado.

El internet es algo tan complejo que siempre es difcil encontrar exactamente la


informacin que busca.

Web spiders. Estas araas (spiders, en ingls) son programas que registran la red
buscando documentos mientras usted va siguiendo hipervinculado de las pginas
web.

Los buscadores utilizan a menudo esas araas. Cuando una de ellas descubre
una pgina relativa a la temtica indicada, aparece un agente de software, que
enva el documento y, adems, informacin sobre l y un software de indexacin.

El software de indexacin recibe del agente los documentos y las direcciones


URL.
Si busca informacin a travs de un buscador, lo normal es introducir una palabra
clave relativa al rea o al tema que le interese. La base de datos del buscador es
examinada segn los datos que usted haya introducido.

1.1.3 Objetivos de los buscadores

Encontrar los documentos que contengan las palabras claves


introducidas. Habitualmente localiza las pginas Web que mejor se
adapten a las palabras introducidas.

1.1.4 Clasificacin de los buscadores

Los buscadores se pueden clasificar a travs de navegacin y el otro


mtodo es buscando por medio de un buscador, el mtodo de navegar
es ir abriendo ligas en las pginas, estas ligas son creadas por otros
usuarios, sin embargo, para el mtodo de buscar se utiliza forzosamente
un buscador.

CLASIFICACIN DE LOS BUSCADORES

1. NDICES O DIRECTORIOS: Son los primeros buscadores que


aparecieron. Un directorio permite buscar informacin separando
los temas en categoras generales las cuales se dividen en
subcategoras cada vez ms especficas.

2. MOTORES DE BSQUEDA: Se trata de la evolucin natural de


los directorios. Permite localizar informacin al escribir con las
palabras desplegando una lista de pginas web que contiene
datos relacionados con las palabras que se han escrito.

3. METABUSCADORES: Tambin llamados buscadores mltiples

ya que realizan varias bsquedas simultneas en los dems


buscadores y muestran los resultados ordenados de acuerdo a
cada buscador y el ms conocido es METACRAWLER.

4. BUSCADORES ESPECFICOS: Son aquellos que solo contienen


informacin sobre un tema concreto es importante resaltar que
utilizan ndices especializados para acceder a la informacin de
una manera ms especfica y fcil.
1.1.5 Tipos de buscadores

BSQUEDAS BSICAS: Se llevan a cabo al escribir lo que se desea encontrar


en el cuadro de texto de los buscadores. A veces es necesario ser lo ms
especfico posible al momento de escribir para obtener el resultado deseado.

BSQUEDAS AVANZADAS: Los mecanismos de la bsqueda nos permiten


utilizar palabras especiales llamadas operadores lgicos u operadores booleanos
para modificar su criterio de bsqueda y existen 3 tipos de operadores lgicos que
se utilizan en ocasiones en la bsqueda de la web y es: Y (AND), O (OR), y NO
(NOT).

1.1.6 Componentes de un buscador

Los tres componentes de un buscador

Un robot de rastreo,
Un programa o algoritmo de indexacin
interfaz de bsqueda.

Los robots de rastreo

Los robots de rastreo tienen otros nombres: araas de rastreo, crawlers o bots
rastreadores. Pero en definitiva son simplemente programas automatizados que

recorren la web, buscando sitios web y las pginas que los componen, y en
general todos los archivos que pueda encontrar en la red.

Los robots de rastreo recorren la web y visitan los diferentes sitios web de una
manera generalmente aleatoria. As pues, las visitas de las araas rastreadores
pueden ser ocasionales o muy frecuentes. Pero aun cuando sean ocasionales las
visitas, estas siempre llegarn y verificarn cambios en el contenido de la web o
de las pginas, modificaciones, eliminaciones, adiciones, etc.

La araa o robot de rastreo de Google se llama GoogleBot, y en realidad no es


una sola araa, es decir, no hay un nico Googlebot, sino varias copias del
mismo que se originan en diferentes mquinas de Google.

La araa de rastreo de Yahoo, tiene el nombre de Slurp, y la araa de rastreo de


Bing recibe el nombre de MSNBot por sus orgenes en el ahora extinto Microsoft
Live Search.

El trabajo de todos estos rastreadores es, de manera ideal, rastrear y recolectar


informacin de todas las pginas y archivos que existan en la web, sin embargo,
esto no siempre es as, de hecho de una manera indeseablemente frecuente son
incapaces de encontrar y rastrear el contenido total de muchos sitios web. En
otros casos, se les prohbe rastrear y recopilar informacin. Son dos casos
diferentes: incapacidad y prohibicin.
La Interfaz de bsqueda

La puerta de acceso a las pginas de resultados de los buscadores es la interfaz


de bsqueda. Todos y cada uno de los motores de bsqueda, llmese Google,
Bing, Yahoo, Ask, etc., tienen su propia y particular interfaz de bsqueda, desde
las minimalistas hasta aquella que constituyen verdaderos portales web, en los
cules la bsqueda es simplemente un elemento ms.

Al parecer, a la mayora de las personas les interesaba una interfaz de bsqueda


simple y exclusivamente dedicada a servir slo como puerta de acceso a lo que
estaba buscando, de ah que Google inicialmente termin siendo la opcin
elegida, aunque obviamente no fue ese el nico motivo.

Se puede decir que la interfaz de bsqueda, se presenta bajo dos formatos: antes
de cualquier bsqueda y con los resultados de las bsquedas.

Antes de la bsqueda, muchos buscadores slo muestran la casilla para introducir


nuestra palabra o frase de bsqueda, y con los resultados que esta devuelve la
pgina se puebla con enlaces patrocinados, o sea, aquellos que son promovidos y
pagados por algn anunciante, y el resto de resultados o enlaces que
corresponden a sitios que resultan relevantes al criterio de bsqueda usado, a
estos se denominan resultados de bsqueda orgnicos. Cada uno de los
buscadores usa algoritmos de calificacin propios que, evaluando los diferentes
aspectos que considera pertinentes para un criterio de bsqueda determinado,
presenta los resultados de mayor a menor relevancia, de arriba a abajo en la
pgina, y as luego en las siguientes. Cada buscador ofrecer un resultado de
bsqueda diferente al de otro buscador.

En Resumen de los componentes de un buscador

Un buscador est formado fundamentalmente por tres componentes. El primero


de ellos recoge informacin, se llama robot, spider o crawler y navega por internet
de forma totalmente automtica. Toda montaa de informacin encontrada, el
ndice, se enva a la administracin. El segundo elemento es el software de
indexacin, que estructura y hacen examinables los datos transmitidos. El tercer y
ltimo componente examina la consulta realizando por el usuario y enva el
trmino de bsqueda al ordenador con los datos para, desde ah, presentar al
usuario los resultados de su bsqueda.
2.1 Tcnicas y estrategias de bsqueda.

TCNICAS DE BSQUEDA.

Planificar bien la bsqueda y saber que cada bsqueda es diferente.

Mirar la ayuda que cada buscador ya que hay pequeas diferencias


entre uno y otro.

Acotar los trminos de bsqueda que los operadores


booleanos o de cercana, comodines, etc.

Usar si se puede varios buscadores.

Si es posible y lo permite la bsqueda hacer las


acotaciones desde bsqueda avanzada.

ESTRATEGIAS DE BSQUEDA.

Utilizacin de operadores booleanos: AND (+), NOT (-), NEAR.

Usar expresiones literarias, se ponen entre comillas

Uso de comodines: ejemplo. comercio electrnico + conta.

El uso de maysculas y minsculas.

Acentos y . es mejor consultar la ayuda de cada buscador

2.2 Algunos consejos para la bsqueda

Sugerencia: internet cuenta con diferentes servidores WWW que mantienen


contacto con todos los grandes buscadores.

Solo debe introducirse un trmino y ser enviado a eso buscadores y catlogos.

En primer lugar se encuentran las conexiones lgicas entre trminos de bsqueda


y, en segundo trmino, el contenido semntico del tema sobre el cual el usuario
busca informacin, es decir debe presentar sobre el cual el usuario busca
informacin. Por ello debe utilizar las opciones avanzadas de los buscadores.

Tambin es necesario utilizar con precaucin conexiones de varios trminos con


el operador.

Puede unir palabras con +, Y o AND, es decir, los trminos unidos por esos
operadores deben aparecer en las lista de resultados. Un signo menos (-), o
NOT excluye la palabra, que no debe aparecer en la presentacin de resultados.
Resumen
Se definen, describen y caracterizan un grupo de los principales motores de bsqueda
que operan en Internet. Se analizan los mtodos reconocidos para su evaluacin y
seleccin, as como se ofrecen algunos consejos para perfeccionar el proceso de
bsqueda con el fin de mejorar sus resultados. Se exponen, de forma general, sus
semejanzas y diferencias, ventajas y desventajas y se analizan sus tendencias actuales
de uso.

Clasificacin: Artculo de revisin

Descriptores (DeCS): INTERNET/clasificacin

Descriptores (DeCI): INTERNET; MOTORES DE BUSQUEDA; TECNICAS DE EVALUACION


ESTRATEGIAS DE BUSQUEDA/tendencias; METABUSCADORES
Desde hace muchos aos, ya en la era moderna, cuando alguien necesitaba informacin
de carcter cientfico, comercial o de entretenimiento sola encaminarse hacia una
biblioteca pblica, especializada o acadmica, en la que un bibliotecario o referencista lo
orientaba; l poda tambin consultar los tradicionales catlogos de autor, ttulo, materia
u otro que describiera los documentos existentes. En el peor de los casos, el problema se
resolva cuando se remita el usuario a otra biblioteca, pero inevitablemente se produjo
un crecimiento exponencial de la literatura, sobre todo cientfica, que aun cuando coloca,
a disposicin de la comunidad acadmica, una gran variedad de recursos, requiere de
una inversin importante de tiempo y esfuerzo para su consulta, evaluacin y
asimilacin.
El desarrollo cientfico y tecnolgico, con su crecimiento agigantado, ha generado, entre
otros fenmenos, el incremento y perfeccionamiento acelerado de las nuevas tecnologas
de informacin y comunicacin, justamente en funcin de un mejor registro,
procesamiento, bsqueda y diseminacin de la informacin; sin embargo, el problema
para acceder slo a la informacin relevante persiste.
Sin necesidad de analizar la evolucin de las tecnologas de informacin, est claro que
su resultado ms importante es Internet. Si se retoma la idea inicial, puede pensarse
que ahora, cuando alguien necesita realizar una bsqueda, incluso en el tema ms
sencillo, piensa en Internet y no en una biblioteca tradicional, y es que Internet, es como
una gran biblioteca, con mltiples departamentos especializados en diferentes materias,
es una biblioteca tan grande, como una ciudad que es muy fcil perderse.
Sucede que Internet es indiscutiblemente un medio de publicacin rpido, libre de
arbitraje, requisitos y normas, con cobertura internacional, que hace de ella el soporte
preferido, smese a esto el hecho de que muchos documentos que se editan en soporte
impreso, tienen versiones en Internet precisamente a favor de su acceso y visibilidad,
estos aspectos explican por s solos el hecho de que la cantidad de informacin
disponible en el web sea abrumadora.
Afortunadamente, a la par del crecimiento de Internet se han desarrollado y
perfeccionado los motores de bsqueda, dirigidos a facilitar la navegacin y el hallazgo
de la informacin necesaria.
Evidentemente, si se comparan los motores de bsqueda de hace unos aos atrs con
los actuales ser fcil percatarse de que la cantidad de informacin procesada en sus
bases de datos es mucho mayor, debido precisamente a que la informacin en la red se
multiplica a diario. Por otra parte, se estima que, mientras en 1995, apenas exista una
docena de motores de bsqueda, hoy se calculan en alrededor de 2000, cada uno con
caractersticas diferentes, facilidades particulares, formas de funcionamiento e interfaz
propia. Si bien es cierto que en el inicio los motores de bsqueda, la preocupacin de los
navegantes era encontrar alguno cuyo host estuviera disponible en el momento en que
fuera a hacerse uso de l o simplemente saber cul realizara la bsqueda de manera
ms fcil, en la actualidad el primer problema est en identificar, seleccionar y decidirse
por uno de ellos.1
Indiscutiblemente, aunque ellos constituyen un importante paso de avance, no son la
solucin al problema. El propio incremento de los motores de bsqueda, disponibles en
la red, ha impuesto la necesidad, para la mayora de los navegantes, de "hacer
bsqueda de buscadores" con el fin de determinar cul es el mejor para un determinado
tema, incluso antes de formular la bsqueda que necesita para resolver su problema de
investigacin.
Mucho se considera el tiempo que los navegantes requieren para encontrar informacin
relevante en Internet sobre un tema determinado, aun cuando poseen una ruta ms o
menos especfica para buscarla; sera demasiado emplear el tiempo en hacer bsquedas
en uno y otro buscador con el propsito de evaluar sus resultados particulares cada vez
que se navegue y, a partir de ello, determinar cul es el ms relevante para responder a
su demanda.
Para solucionar este problema, surgieron entonces los metabuscadores. Ellos tratan de
simplificar el proceso, al consultar, de manera simultnea, varios buscadores; dicho
proceso es transparente para el usuario. Incluso cuando se consideran un avance,
debido al ahorro de tiempo y su amplia cobertura, estas herramientas tienen tambin
sus desventajas, determinadas en lo fundamental, por sus diferentes formas de
funcionamiento que generan resultados de diferentes niveles de relevancia a pesar de
responder a una misma pregunta.
El cuestionamiento actual est en saber qu tipo de buscador utilizar para obtener una
mayor eficiencia en el proceso de bsqueda; como no existe una respuesta definitiva al
respecto, la nica alternativa es seguir muy de cerca su desarrollo, as como estudiar sus
ventajas y desventajas para determinar cul emplear en correspondencia con lo que se
busca.
Hacia esa lnea est dirigido el presente trabajo, es as que se pretende actualizar los
conocimientos acerca del desarrollo de los buscadores en Internet y realizar un anlisis
de las tendencias actuales de su uso, todo a partir de los diferentes puntos de vista de
algunos expertos en la materia.

Mtodos
La bsqueda en el web mediante Google.com, por trminos como "motores de
bsqueda" y "search engines", devolvi entre los resultados ms importantes sitios
como: http://www.allsearchengines.com y http://www.searchenginewatch.com, ambos
con una gran cantidad de enlaces importantes a trabajos sobre estos temas. Producto de
una lectura crtica de la bibliografa consultada, se obtuvo un grupo de conclusiones
importantes en cuanto a definiciones y tipos de los buscadores, funcionamiento,
estrategias para un uso ms efectivo, ventajas y desventajas.
Buscadores en Internet. Conceptos, clasificacin y caractersticas
Muchos son los nombres que han recibido los buscadores de acuerdo con su estructura y
funcionamiento. Algunos autores los clasifican en ndices, robots y metabuscadores,2
otros los agrupan en directorios y buscadores,3 o bien en ndices y motores de
bsqueda.4,5 Todos estos trminos tienen su equivalente en ingls, sin embargo, en
esta lengua adems de "index", "meta- search engine" "directory" y "search engine",
para los 2 ltimos aparecen en la literatura sinnimos como "crawler o spider" y
"human-powered" respectivamente. Veamos a continuacin algunas definiciones.
En el artculo "Buscadores: Los puntos de partida en la red"2 se plantea que se dividen
bsicamente en ndices, robots y metabuscadores. Aqu se consideran los ndices como
los pioneros en Internet, ellos funcionan mediante la incorporacin constante de nuevas
pginas a su base de datos, generalmente disponen de un evaluador que minimiza el
nmero de pginas que ingresan al sistema y asegura su calidad; los robots (llamados
por la gran mayora motores de bsqueda) disponen de programas "araas" que
recorren la red e incluyen de forma automtica "todo cuanto encuentran", esto genera
grandes dificultades para los navegantes al momento de seleccionar los recursos, sobre
todo en el caso de bsquedas con un alto recobrado; por ltimo, los metabuscadores se
limitan a redirigir la pregunta que reciben a varios buscadores a la vez, y segn el
estado de opinin prevaleciente, suele ser difcil pero recomendable el trabajo con ellos,
cuando no se encuentra informacin en los ndices y motores.
Efectivamente, de acuerdo con las diferentes formas de funcionamiento, es acertado
establecer estas 3 categoras para clasificar los buscadores, pero cabra preguntar qu
significa "todo lo que encuentran" los robots, o ser que realmente no hay lmites en lo
que ellos recogen en la red.
En otra clasificacin, se dividen en directorios y buscadores. Se dice que los directorios
son catlogos de direcciones que tienen relativamente pocos sitios (cientos o miles),
pero ellos se seleccionan y verifican; esto supone cierta calidad, incluso, algunos
directorios que contienen una evaluacin del sitio que indica cun bueno es, otros
presentan un breve resumen, escrito por un reseador o evaluador, que explica el
contenido (la mayora slo tienen una descripcin que proporciona el propio autor del
sitio); por otra parte, se definen los buscadores como enormes ndices que comnmente
registran millones de pginas y donde las bsquedas producen miles de sitios como
respuesta.3
En estas clasificaciones, si bien es cierto que la definicin de los directorios es muy
amplia y clara, el concepto de buscador se queda sin explicar cmo funciona esta
herramienta?, adems por qu llamarle buscador?, acaso no son buscadores tambin
los directorios?; por otra parte, estos llamados "buscadores" no deben considerrseles
ndices precisamente, porque ellos no muestran listas de trminos o categoras a los
navegantes, el ndice no es ms que una parte interna donde se almacena una copia de
cada una de las pginas identificadas.
Otras 2 clasificaciones, tal vez menos comunes, son buscadores de categoras y
buscadores de contenido (o de palabras por contexto), al primero se le llama tambin
ndices, que est claro que se refieren a los directorios y aunque no se describen
conceptos los ejemplos hablan por s solos: por categoras, Yahoo y por contexto,
Altavista.6
Es oportuno sealar que aun cuando los motores de bsqueda no se estructuran por
categoras temticas como los directorios, existen tambin motores especializados en
reas geogrficas y temticas, por tipos de recursos, entre otros.
Sullivan,7 un importante autor vinculado al tema de los motores de bsqueda, editor de
la revista Search Engine Watch, plantea que el trmino "motor de bsqueda" se emplea
indistintamente para los motores basados en los programas "crawler" o "spider", y para
los directorios accionados por humanos, pero enfatiza en las diferencias entre ambos
justamente porque los primeros trabajan automticamente y los segundos dependen del
factor humano.
Un aspecto importante, tratado por este autor, son las partes de los motores de
bsqueda: el primer elemento es el "spider" o "crawler", encargado de visitar las pginas
web, leerlas y analizar sus enlaces a otras pginas, esta operacin se repite cada cierto
tiempo en busca de cambios. El segundo elemento es el ndice, tambin llamado
catlogo donde se almacena una copia de cada pgina web que se encuentra, cada vez
que cambia la pgina se actualiza con la nueva informacin, claramente transcurre un
tiempo desde que se encuentra la pgina hasta que se indiza y no es hasta entonces que
est disponible en el motor de bsqueda. El tercer elemento es el software, programa
que se encarga de examinar los millones de pginas web contenidas en el ndice, busca
aquellas que contengan las palabras iguales a las solicitadas en la bsqueda, para luego
ordenarlas segn su relevancia. Para muchos navegantes es una interrogante saber si
realmente el orden de los registros es aleatorio o responde a un determinado mtodo de
ordenamiento, ms adelante se ofrecern algunas consideraciones al respecto.7
Como puede apreciarse, en cada una de las definiciones, la funcin de cada una de estas
herramientas es la misma: "buscar en la red", todos entonces se sitan en una gran
categora general: buscadores. Son pginas web que analizan la red con el objetivo de
que los navegantes encuentren los sitios donde se encuentra la informacin que ellos
necesitan, ponen a su disposicin "alternativas" para moldear las bsquedas con ayuda
de sus propios lenguajes de interrogacin, la diferencia est en el funcionamiento de
cada uno; segn esto, se dividen en 3 subcategoras, que en la opinin de la autora la
manera ms acertada de agruparlos es en:
Directorios (se refiere a los llamados ndices o buscadores de categoras).
Motores de bsqueda (que algunos le llaman buscadores, robots, araas o
buscadores de contenido).

Metabuscadores (que se abordarn ms adelante).
Si se analizan detenidamente los conceptos referentes a las 2 primeras categoras es
fcil encontrar ventajas y desventajas en cada una, por ejemplo, los directorios son
excelentes para buscar por temas o categoras y los resultados se ordenan por dichas
categoras, pero ellos no catalogan tantas direcciones como un motor de bsqueda; por
su parte, los motores de bsqueda son muy tiles para buscar datos especficos y
permiten encontrar "casi todo", pero esto, a su vez, produce como resultado demasiados
sitios de todo tipo y calidad (miles) en una respuesta tpica.
Pero hablar en la actualidad de buscadores, obliga necesariamente a hablar de los
metabuscadores, innumerables trabajos, en la literatura especializada, abordan el tema,
debaten sobre aspectos como funcionamiento, ventajas, desventajas y eficiencia, entre
otros. A pesar de los beneficios indiscutibles de los motores de bsqueda y de los
directorios temticos, su crecimiento condujo a la creacin de estas nuevas
herramientas.1,8-12
Segn Tyner,11 se conoce como metabuscadores, a aquellos que permiten interrogar
varias bases de datos simultneamente desde una nica interfaz; aunque ellos no
ofrecen el mismo nivel de control sobre la lgica y la interfaz de bsqueda que los
motores y directorios, la mayora son bastante rpidos. Apunta, adems que la tendencia
es mejorar sus capacidades con la incorporacin de opciones de bsqueda al uso de los
operadores convencionales, entre ellas, se destaca la posibilidad de poder escoger los
motores de bsqueda donde debe buscarse, la bsqueda por campos (ttulo, URL, etc.),
entre otras.
Otras cualidades se agregan a la definicin anterior, se plantea que al no tener sus
propias bases de datos, a diferencia de los motores de bsqueda y los directorios
temticos, los metabuscadores no almacenan pginas web, no agregan direcciones, ni
clasifican y resean sitios web, sino que envan una solicitud de bsqueda a varios
buscadores a la vez.8
Stanley,1 considera que los metabuscadores constituyen el prximo eslabn dentro de la
cadena alimenticia de la informacin en los motores de bsqueda convencionales, se
consideran son superiores. Muy claramente expone aquellos elementos que considera
sus ventajas esenciales:
Se accede a una sola pgina web para formular la bsqueda.

Se necesita slo conocer la interfaz de una pgina para la bsqueda.

Se formula slo una vez la estrategia de bsqueda.

Los resultados permiten redireccionar la bsqueda a otros buscadores.

Se obtienen los resultados integrados, a partir de varios buscadores.
Una importante reflexin de la autora apunta al siguiente hecho: que los
metabuscadores no dispongan de sus propias bases de datos sino que interroguen las de
otros buscadores, significan una importante reduccin en los costos por concepto de
hardware para los productores. Ciertamente podra considerarse esta, una causa para el
auge de los metabuscadores y su aceptacin entre los navegantes.
No es menos cierto que los elementos descritos por Stanley1 sobre los metabuscadores,
constituyen ventajas para el proceso de bsqueda; sin embargo, otros autores, que
enfatizan en los problemas que puede causar su uso, llaman la atencin de los
navegantes para que los tengan siempre muy en cuenta, reconocen, por tanto, que son
una herramienta muy til.
Liu8 expone algunos elementos que son vlidos anotar, sobre todo porque otros autores,
que han escrito sobre el tema de los metabuscadores, no los tratan. l plantea que es
totalmente imposible que estas herramientas puedan unificar todas las ventajas de cada
uno de los motores y que, por consiguiente, las bsquedas booleanas pueden generar
resultados diferentes en diversos buscadores, las bsquedas por frases puede que no se
ejecuten en alguno de ellos, y otros elementos como el uso de limitadores pueden
sacrificarse. Apunta que los metabuscadores no devuelven, desde cada buscador, todas
las pginas que se corresponden con la solicitud sino que toman un rango entre 10 y 100
registros de cada uno, por lo que efectivamente permiten redireccionar la bsqueda,
como apunta Stanley,1 una vez que se escoja el motor, que ms resultados relevantes
arroj, para continuar la bsqueda.
Algunos autores aseguran que la mayora de los grandes buscadores utilizan lenguajes
similares para interrogar sus bases de datos. Por esto, los resultados de la bsqueda en
los metabuscadores pueden verse favorecidos si se conocen, en alguna medida, los
lenguajes utilizados por los buscadores que estos procesan. Afortunadamente algunos
metabuscadores ofrecen al navegante la opcin de escoger dentro de un grupo
determinado de buscadores disponibles, cules incluir en su metabsqueda. Si se
escogen aquellos conocidos por su confiabilidad, potencia y rapidez, los resultados de la
bsqueda sern mejores.1
Cierto es, que cada categora difiere de la otra sustancialmente por el funcionamiento y
por las herramientas para la bsqueda en la red, pero incluso dentro de una misma
categora se diferencian unos de otros. Son eBlast y Yahoo directorios temticos, pero no
son iguales, son Altavista y Northern Light motores de bsqueda, pero son diferentes, de
igual forma son Metacrawler y Savvy Search metabuscadores, y difieren uno del otro.
El uso de estos 3 mecanismos no presenta grandes diferencias a primera vista, por lo
que es posible que los navegantes no distingan en cul de ellos realizan habitualmente
sus bsquedas, todos muestran un recuadro para introducir las palabras claves que se
desean encontrar, solo que vara la forma en que se debe plantear la cuestin, porque,
en algunos casos, puede complicarse con elaboradas reglas lgicas. Esta tabla resume
brevemente la naturaleza de cada categora de buscador.

Tabla. Caracterizacin de las diversas categoras de buscadores


Directorios temticos Motores de bsqueda Metabuscadores

Bases de datos ms Bases de datos ms No tiene bases de datos


pequeas, menos amplias y actualizadas. propias, sino que buscan
actualizadas, y ms automticamente en las de
elaboradas gracias a la otros buscadores.
presencia del factor
humano.

Colocan la informacin por No almacenan informacin


temas y categoras, una Colocan la informacin, porque no dependen de
vez recopilada, de forma que sean capaces de bases de datos propias.
manual en sus ndices. recoger en la red, en sus
ndices sin ordenarlas por
temas, de manera
automtica y peridica.

No realizan las bsquedas No realizan las bsquedas


en Internet "en vivo", en Internet "en vivo", sino Envan su bsqueda a varios
almacenan los datos de los en las copias de las motores, sus resultados
sitios y ofrecen enlace a pginas que almacenan en dependen de que estos
stos. sus ndices. estn disponibles en el
momento de la bsqueda, o
se descarguen en el perodo
de tiempo permisible.

Son fciles de usar, Son ms difciles, se Son difciles de usar para


permiten, en primer lugar, requiere explotar al bsquedas muy precisas,
ubicar la bsqueda en un mximo las opciones de porque tienen menos control
tema determinado. bsqueda porque de la bsqueda al interrogar
contienen ms varias bases de datos con
informacin. interfaces diferentes.
Son convenientes para Se utilizan para buscar Se r ecomienda para temas
buscar informacin informacin ms escasa, "oscuros", difciles de
general, institucional especializada, actualizada encontrar.
porque devuelve o incluida en pginas
resultados a las pginas personales.
principales.

Ejemplos

LookSmart Altavista Metacrwler


(http://www.looksmart.co (http://www.altavista.com (http://metacrawler.com)Ne
m)Open Directory )Google tLocator
(http://dmoz.org)Yahoo (http://www.google.com)H (http://nln.com)StartingPoin
(http://www.yahoo.com) otBot t (http://www.sptp.com)
(http://hotbot.lycos.com)

Mucho se ha debatido sobre la necesidad de conocer las herramientas con que se busca
en la red, precisamente por la gran variedad que existe, donde unos suelen ser ms
eficientes que otros. Un aspecto importante a considerar para seleccionar los buscadores
es la evaluacin de sus bases de datos. Como se ha explicado anteriormente, los
resultados de las bsquedas, obtenidos de cada buscador no son ms que la "salida en
pantalla" de la informacin de sus bases de datos, despus que esta se localiza, procesa,
evala y ordena. Por supuesto, no es comparable la evaluacin de una base de datos en
CD con otra en Internet, esta ltima es mucho ms difcil.
Notess13 expone, de manera muy sencilla, sus puntos de vista al respecto, plantea que
el mayor problema para evaluar una base de datos en Internet es que sus registros
nunca son estticos, porque existen muchas pginas "efmeras" que se indizan en el
tiempo en que se crea o actualiza la base de datos y poco tiempo despus se mueven,
cambian o redisean completamente; sin embargo, aun cuando el contenido de los
registros es variable, plantea el autor, que las bases de datos en Internet pueden
evaluarse en cuanto a alcance, estructura y actualidad. Se explica en este artculo, que
para determinar el alcance de la base de datos se debe consultar la ayuda o las FAQs, se
sugiere tambin, que el examen de la estructura es efectivo, por ejemplo, si el nico
acceso a los registros individuales es por una bsqueda de palabras claves, cabra
entonces, pensar que es una base de datos que se genera automticamente, mientras
que, si tiene una estructura jerrquica de materias, debe construirse selectivamente.
Ciertamente, estos son aspectos importantes, pero no se pueden obviar otros ms
elementales, sobre todo, para los buscadores de tipo directorio, como el ttulo de la
pgina, que se supone sea claro y refleje, con exactitud, el contenido del sitio y la
consulta del "about" que ofrece informacin general.
Wighton14 concede tambin, una especial importancia a la consulta de las FAQs de los
buscadores, antes de formular una bsqueda, enfatiza, que esto permite saber cmo se
puede buscar y hasta dnde se puede llegar y, a partir de aqu, elegir o desechar el
buscador.
Notess,13 explica que la estructura de los registros de la base de datos, que se muestra
en los resultados, puede parecer un elemento difcil de evaluar, sobre todo, porque a
diferencia de otras, en las bases de datos en Internet, los campos no aparecen
explcitamente, sin embargo, generalmente son fciles de identificar, incluso existen
buscadores como Google que explican detalladamente en su ayuda, a qu se refiere
cada dato expuesto en los resultados de la bsqueda, la mayora de los buscadores
entregan sus resultados con los siguientes campos: ttulo, descripcin del contenido,
categora de materia y URL.
Realmente el navegante nunca podr ver la estructura de la base de datos, por esto
resulta un poco difcil saber cmo se maneja una bsqueda, una vez formulada la
pregunta a la base de datos, pero conocer a qu se refiere cada elemento mostrado en
los resultados puede ser un factor determinante a la hora de decidir cules son los
registros ms relevantes.
Otro aspecto enunciado por este autor para evaluar las bases de datos, es su modo de
actualizacin, es difcil encontrar un motor que actualice constantemente cada uno de los
sitios; para los grandes motores, porque tendran una gran demanda en cuanto al ancho
de banda y para los directorios, aunque ms pequeos en volumen de informacin,
porque exigira una sobrexplotacin del recurso humano. Plantea este autor, que es muy
difcil determinar la frecuencia de actualizacin de una base de datos, pero el anlisis de
algunos de los resultados devueltos puede ser una va para esto. Por ejemplo, en un
intento de acceso a los enlaces que luego no se pueden alcanzar, o que te ofrecen un
mensaje de que la pgina se ha movido a otra direccin sera conveniente fijarse en la
fecha de la pgina si es posible, esto proporciona una medida del tiempo que lleva sin
actualizarse; la ltima fecha de actualizacin de los sitios que forman parte de los
resultados de la bsqueda muchas veces son de un ao, 2 o ms, ello indica que el
creador del sitio cambi de empleo o sencillamente perdi el inters, un motor de
bsqueda que se respete no debe incluir este tipo de sitios en sus ndices.13
Existen varios trabajos donde se exponen diversos anlisis y comparaciones entre
buscadores, estos pueden ayudar a una mejor comprensin de su
funcionamiento.6,11,12,15-22
Internet es una gran biblioteca, solo que a diferencia de la biblioteca tradicional no tiene
libros y revistas impresas, materiales audiovisuales o diapositivas sino que sus
documentos son sitios web sin control bibliogrfico, no disponen de un equivalente al
ISBN, que identifica los libros, tampoco existen sistemas anlogos para su catalogacin y
clasificacin, como los establecidos por la Biblioteca del Congreso, mucho menos, existe
un catlogo central que registre todas sus pginas y, ni siquiera lo ms elemental,
muchos de los documentos que se encuentran en Internet carecen de autor y fecha de
publicacin.11
Evidentemente, como Internet es un medio libre para publicar, no existen normas
estndares para hacerlo ni para indizar la informacin que fluye por ella. Las bases de
datos de los buscadores no reconocen e indizan los mismos campos, y su funcionamiento
para recuperar la informacin es diferente. De todo lo anterior, se infiere que para que
los buscadores se conviertan en una herramienta eficaz es necesario que se conozcan
muy bien.
Como se ha explicado anteriormente, la tendencia inevitable es la especializacin de las
herramientas de bsqueda en el web. Esto ha provocado la aparicin de una gran
variedad de buscadores, que generalmente resultan difciles de evaluar por el
navegante; por otra parte, en muchos casos han devenido, incluso en portales, aaden
entonces a su oferta, un conjunto ms o menos homogneo de servicios, como noticias,
bolsas de vivienda, chats o correo electrnico. Son gratuitos y se financian mediante la
publicidad, debido a esto, el acceso a sus pginas principales es, a veces, la primera
causa para que el navegante se sienta perdido entre tantos efectos especiales,
comerciales y propagandas.
Muchos son los expertos que han sugerido los aspectos que deben considerar los
navegantes para buscar en el web. En algunos casos, se apunta a que el navegante solo
debe preocuparse por buscar la caja de dilogo, que permite introducir las palabras
claves por las que pretende realizar la bsqueda, el cual tiene al lado un botn o un
grfico con las palabras "buscar", "search", "go", "go to get it", donde el navegante
mediante un click inicia el proceso de bsqueda, es recomendable buscar, cerca de esta
caja de dilogo, opciones para seleccionar el nmero de registros a mostrar por pgina,
los dominios donde buscar, los tipos de recursos o el tipo de lgica a emplear.6
Gresham23 opina que encontrar resultados relevantes en Internet es una mezcla de
experiencia, tcnicas, aptitudes, inventiva y buena suerte, todas combinadas con la
habilidad de proceder en una direccin clara y metdica, en otras palabras, es
simplemente "navegar con un propsito", apunta adems que depende ms de la
estrategia de bsqueda que de la propia herramienta a utilizar. Sugiere la siguiente
secuencia lgica de pasos:
Determinar el tipo de informacin que se necesita (artculos cientficos,
estadsticas, documentos gubernamentales) y luego determinar qu tipo de
organizaciones pueden ofrecer estos documentos.

Crear una lista de todas las palabras claves posibles y de sus sinnimos.

Determinar qu tipo de herramienta utilizar en la bsqueda (directorio, motor


general o especializado, metabuscador) en dependencia de lo que se busca.

Construir la estrategia de bsqueda y conducirla (en dependencia del buscador,


se definirn las combinaciones de bsquedas, se debe ser lo ms preciso posible
y explotar las opciones disponibles).

Evaluar los resultados de la bsqueda (si los primeros 15 registros no se


consideran relevantes debe considerarse replantear la estrategia varias veces o
cambiar de buscador, si el resultado persiste, si los resultados son relevantes
debe valorarse la actualidad de los registros y si el sitio proviene de una fuente
confiable).
Referencias bibliogrficas
1. Stanley T. Search engines corner meta-searching on the Web [texto en lnea],
Febrero 2001. Disponible en: <URL: http://
www.ariadne.ac.uk/issue14/search-engines/>. [Acceso 25 de Diciembre 2001].
2.
3. Buscadores: Los puntos de partida en la red. Revista Consumer [publicacin en
lnea], 2001:abr(43).Disponible en:
<URL:http://www.consumer-revista.com/web/es/20010401/internet/28193.jsp>.
[Acceso 2 de Noviembre 2001].
4.
5. Cmo Buscar en Internet? (Explicaciones y tips) [texto en lnea]. Disponible en:
<URL: http://pp.terra.com.mx/~hugalde/comobusc.html#ini>. [Acceso 9 de
Noviembre 2001].
6.
7. Buscadores: Pequeos trucos para usar los buscadores. [texto en lnea].
Disponible en: <URL:http://personal.redestb.es/necora/buscador/3.htm>.
[Acceso 12 de Noviembre 2001].
8.
9. Flanagan D. Finding it online: web search strategies [texto en lnea] 1999.
Disponible en: <URL: http://
http://home.sprintmail.com/~debflanagan/main.html>. [Acceso 25 de Diciembre
2001].
10.
11. Principales motores de bsqueda [texto en lnea], 1999. Disponible en: <URL:
http:// www.uco.es/investiga/grupos/rea/search/descripcion.htm>. [Acceso 10
de Diciembre 2001].
12.
13. Sullivan D. How Search engines rank web pages [texto en lnea],. Disponible en:
<URL: http:// www.searchenginewatch.com/webmasters/rank.html>. [Acceso 10
de Diciembre 2001].
14.
15. Liu J. Guide to meta-search engines [texto en lnea], 1999. Disponible en: <URL:
http:// www.indiana.edu/~librcsd/search/meta.html>. [Acceso 25 de Diciembre
2001].
16.
17. Multi search engines: a comparison [texto en lnea]. Disponible en: <URL: http://
http:// www.philb.com/msengine.htm >. [Acceso 25 de Diciembre 2001].
18.
19. Notess G. Toward more comprehensive web searching: single searching versus
megasearching. Online [publicacin en lnea], 1998:22(2). Disponible en:
<URL:http:// http:// www.onlineinc.com/onlinemag/OL1998/net3.html >.
[Acceso 25 de Diciembre 2001].

You might also like