You are on page 1of 70

1

Tehnici de cutare i regsire a


informaiei n Internet -
Motoare de cutare
Curs:
Tehnologia informaiei
n cercetare
Mat. Gabriela MAILAT
Ing. Corina POP
Prof.dr.ing. Elena HELEREA
2
CUPRINS
1. Introducere
2. Ce este o baz de date Web
3. Metode de indexare
4. Programe de selectare
5. Tehnici de cutare a informaiei
in Internet
6. Concluzii
3
Introducere
World Wide Web (www) - cea mai important
component a Internetului.
www - interfa multimedia care presupune
posibilitatea accesului la surse ce includ
grafice i figuri, imagini, sunete i filme
bazate pe tehnologia hypertext.
www - leag documentele ntre ele prin
conexiuni, formnd un pienjeni (web).
4
Regsirea documentelor pe Web este
dificil:
nu exist un format standard de descriere
a resurselor din Internet
exist diferite instrumente de cutare care
opereaz n moduri diferite
nu este o metod indicat pentru
regsirea informaiilor referitoare la un
anumit subiect.
Introducere
5
Metode de regsire a informaiilor:
cutarea dup cuvinte cheie sau expresii,
mecanismele booleene,
proximitatea,
trunchierea etc.
OBS. Regsirea unei resurse folosind adresa (URL)
este util i rapid dar exist posibilitatea modificrii
URL-ului datorit caracterului dinamic al Internet-
ului.
Introducere
6
Ce este o baz de date Web
(Web database) ?
O baz de date Web este
- o list organizat de pagini web din internet,
un gigantic repertoar ce conine o copie a
fiecrei pagini nregistrate n list (practic
pri mici din acea pagin, cum ar fi titlul,
antetul etc).
7
Ce este o baz de date Web
(Web database) ?
Pentru utilizatorul final, baza de date web
furnizeaz o interfa ce are ca i
caracteristic
un cmp special n care utilizatorul tasteaz
cuvintele dup care va efectua cutarea
(vezi interfaa cu utilizatorul de la Google),
o list cu directoare din care utilizatorul
poate alege legtura dorit (vezi Yahoo
directories).
8
Metode de indexare
Crearea listei cu copiile paginilor poart numele de
indexare i fiecare baz de date web o realizeaz n
stilul su caracteristic.
Exist dou modaliti mai importante de indexare a
informaiei n timpul generrii bazelor de date web:
indexarea full-text
indexarea manual.
9
Metode de indexare
Indexarea full-text
- include toate cuvintele dintr-o pagin n baza
de date pentru cutare, cu ajutorul unor
programe speciale de calculator numite
pianjeni sau roboi (spiders sau robots).
Altavista i Google folosesc pe scar larg
aceast tehnic de indexare.
Indexarea full-text permite s regsim toate
referirile la un anumit termen din documentul
indexat.
10
Metode de indexare
Indexarea manual
- o persoan examineaz paginile ce urmeaz a
fi indexate i decide asupra ctorva cuvinte
(fraze) cheie ce descriu cel mai bine informaia
coninut n respectiva pagin. Ex. (Yahoo
directories sau Magellan).
Avantaj:
- permite utilizatorului s regseasc mai multe
legturi utile n urma cutrii, tocmai pentru c
un om i nu o main a ales cuvintele cheie ce
au fost incluse n indexul bazei de date.
11
Programe de cautare
Foarte multe servicii de cutare folosesc
programe automate, numite "spiders" sau
"robots" (pianjeni sau roboi), ce cltoresc
de la site la site ( coleci de pagini web)
cutnd pagini www nou aprute sau
modificate substanial.
12
Programe de cautare
Exist trei clase de baze de date web:
baze de date ce gestioneaz TOATE categoriile de
pagini WWW;
baze de date ce gestioneaz NUMAI paginile WWW
considerate populare (n principiu cele cu numr
mare de vizitatori);
baze de date ce gestioneaz NUMAI paginile WWW
ce ndeplinesc anumite criterii (legate fie de calitatea
informaiei furnizate, fie de tipul de informaie urmrit
ex. medical, tiinific, tiri etc).
13
Tehnici de cutare a informaiei pe
Internet
i. Motoare de cutare
ii. Directoare web (anuare online, repertoare
tematice)
iii. Biblioteci virtuale
iv. Invisible (deep) Web
v. Motoare de meta-cutare (metasearch engine)
vi. Utilitare de cutare de tip desktop
14
Tehnici de cutare a informaiei pe
Internet
i. Motoare de cutare
Este definit ca un serviciu de regsire a
informaiilor stocate n bazele de date, care
descrie principalele resurse din Web.
15
Motoare de cutare
Este o baz de date coninnd pagini Web ce
pot fi regsite pe baza unor cuvinte cheie i
care continu s scaneze Internetul, cu
ajutorul unor programe automate (spiders,
robots) n cutare de pagini noi. Informaia
rezultat n urma activitii roboilor este apoi
indexat i stocat n baza de date.
Tehnici de cutare a informaiei pe
Internet
16
La lansarea unei cutri se exploreaz de
fapt coninutul bazelor de date, n care sunt
stocate informaii colectate automat de roboi
i nu Web-ul n mod direct.
Se recomand utilizarea a cel puin dou
utilitare pentru aceeai cerere formulat
datorit modului propriu de funcionare a
fiecrui motor de cutare i a paginilor web
existente (diferite de la un utilitar la altul).
Tehnici de cutare a informaiei pe
Internet
Motoare de cutare
17
Tehnici de cutare a informaiei pe
Internet
Instrumentele de cutare sunt programe destinate
obinerii de informaii. Metodele de cutare pot fi
diferite:
arborescent sau de tip director (directory ex.
LookSmart),
mecanism de cutare (search engine ex. Alta
Vista),
o combinatie ntre tipurile arborescent i mecanism
de cutare (directory/search engine ex. Excite,
Yahoo) i
multi-mecanism (multiengine ex. All-In-One,
Metacrawler).
Motoare de cutare
18
1. Motoare care funcioneaz dup modelul
directorului (arborelui de subiecte), de fapt
dup un ghid web n care locaiile sunt
organizate pe subiecte i subsubiecte, ntr-o
structur ierarhic, pornind de la un subiect
general i ajungnd la subiecte cu caracter
din ce n ce mai specifice.
Motoare de cutare
Tehnici de cutare a informaiei pe
Internet
19
2. Motoare care funcioneaz dup modelul
indexului de cutare, n cazul crora soft-urile sunt
cale care efectueaz cutarea dup cuvinte cheie,
bazndu-se pe tehnici de indexare computeriate,
rezultatele obinute fiind prezentate ntr-una sau
mai multe pagini web, care ofer o list de locaii
aranjat n ordinea probabilitii de potrivire a ceea
ce se caut (Alta Vista, Google etc.)
Motoare de cutare
Tehnici de cutare a informaiei pe
Internet
20
3. A treia metod de cutare este o metod
combinat: directory/search engine.
- folosesc ambele metode descrise mai sus, i se
bazeaz pe un sistem de cutare ierarhic, la fiecare
pas putndu-se accesa un mecanism de cutare,
efectundu-se apoi, dac se dorete, o cutare dup
cuvinte-cheie. Aceste utilitare de cutare adaug
selectiv materiale la baza de date i revizuiesc site-
urile bazate pe coninut.
Motoare de cutare
Tehnici de cutare a informaiei pe
Internet
21
Ele pot exclude site-urile ce conin materiale
inacceptabile, sau pot accepta doar acele
site-uri, pe care le consider potrivite. Se
folosesc de o varietate de criterii pentru a
evalua site-urile posibile, incluznd calitatea
materialului i cantitatea materialului.
Exemplu de utilitar de cutare specific:
Magellan.
Tehnici de cutare a informaiei pe
Internet
22
4. A patra metod multi-mecanism (multi-
engine ex. All-In-One, Metacrawler,
Mamma etc.) face referire la acele motoare
de cutare care analizeaz coninutul tuturor
celorlalte categorii de motoare. Nu totdeauna
aceste motoare de cutare sunt i cele mai
practice din cauza numrului foarte mare de
rezultate afiate.
Motoare de cutare
Tehnici de cutare a informaiei pe
Internet
23
Tehnici de cutare a informaiei pe
Internet
Dac n urma unei cutri, dup cuvnt-
cheie, rezultatele cercetrii pentru cuvntul
respectiv sunt pe ultima pagina a motorului
de cutare utilizat, atunci se reformuleaz
interogaia sau se schimb motorul de
cutare.
Motoare de cutare
24
Tehnici de cutare a informaiei pe
Internet
Motoarele de cutare funcioneaz autonom i pot fi
identificate adrese diferite utiliznd aceeai
interogaie pe motoare de cutare diferite, sau s fie
identificate aceleai adrese utiliznd ns interogaii
diferite pe acelai motor de cutare. Cteva reguli
generale care pot ajuta la cutarea informaiei n
Internet vor fi prezentate n continuare.
Motoare de cutare
25
Tehnici de cutare a informaiei pe
Internet
1. Formulai interogaii ct mai scurte i utilizai
cuvinte-cheie.
Este necesar s reinei faptul c un calculator,
nu o persoan, va analiza ceea ce a fost supus
examinrii/cercetrii. Supunnd cercetrii
interogaii lungi precum A vrea sa tiu cine a
fost Einstein va ngreuna munca motorului de
cutare i va duce la rezultate nerelevante. O
formulare mult mai adecvat poate fi simpla
introducere a numelui lui Einstein i eventual a
domeniului fizic.
26
Operatorii sunt reguli sau instruciuni speciale
folosite ntr-o cutare pe baz de cuvinte cheie,
pentru a formula ntrebri sau cereri. Cutarea pe
baz de cuvinte cheie se ncepe prin scrierea unui
cuvnt n caseta "search box" a paginii "home" a
motorului de cutare. Pentru a construi o cerere, se
pot folosi operatorii adecvai din motorul de cutare
n care se desfoar sesiunea de lucru. n timp ce
fiecare motor de cutare are operatori proprii, exist
civa comuni pentru toate utilitarele de cutare:
2.Utilizai operatori logici pentru a va formula interogaia
Tehnici de cutare a informaiei pe
Internet
27
Tehnici de cutare a informaiei pe
Internet
a) Operatorii AND, OR, NEAR si NOT pot fi folosii pentru
a conecta cuvinte i termeni n cadrul unei cereri, cu
sensurile lor logice:
AND nseamn c ambele cuvinte sunt prezente n
cadrul documentelor.
28
Tehnici de cutare a informaiei pe
Internet
NEAR nseamn c un termen trebuie s fie gsit n
cadrul unui numr specificat de cuvinte. OR nseamn
c cel puin un termen este prezent, iar NOT exclude
prezena unui termen.
29
b) Cnd folosii aceti operatori, nu uitai s-i scriei cu litere
mari, fr s lsai un spaiu ntre operator i termenii
care i urmeaz.
c) Semnele + i -;
+ naintea unui termen (fr spaii) ajut la regsirea doar
a documentelor coninnd acel termen i este similar cu
AND;
- este similar lui NOT, regsind documentele care nu
conin respectivul termen.
d) Apostrofurile () sau ghilimelele () marcheaz cuvinte
care trebuie tratate exact cum sunt. Aceste semne sunt
similare cu operatorul NEAR.
Tehnici de cutare a informaiei pe
Internet
30
e) Parantezele sunt utilizate ca i semnele de la c), dar cuvntul
dintre paranteze este considerat o singur entitate.
f) Cuvintele scrise cu majuscule sunt tratate ca un nume propriu.
Virgulele separ numele proprii.
g) Un asterisc ndeplinete funcia de lrgire a rdcinilor.
Plasai un asterisc * la sfritul cuvntului pentru a gsi
toate cuvintele ce ncep cu literele tiprite. Spre exemplu,
cutnd istorie, el creeaz legturi cu paginile Web cu
cuvintele istorie, istorici, istoriografie.
h) Utilizai operatorul logic ADJ (adiacent) dac dorii s gsii
documente n care termenii apar unul lng altul, n orice
ordine.
Tehnici de cutare a informaiei pe
Internet
31
Tehnici de cutare a informaiei pe
Internet
i) Operatorul FAR (departe) este opus operatorului
NEAR. Cnd utilizai FAR, vor fi gsite documentele n
care termenii se afl la o distan mai mare de 25 de
cuvinte unul de altul. (expl.: Lycos). FAR se utilizeaz
foarte des mpreun cu alte expresii. De exemplu, putei
s cutai istorie FAR antic NOT "istorie antic" i vei
gsi pagini ce conin ambele cuvinte dar nu istorie antic.
j) Operatorul BEFORE (nainte) funcioneaz foarte
asemntor cu AND. Unica deosebire este c termenii
trebuie s apar n ordinea pe care o specificai, dar pot
s se afle la orice distan n acelai document.
32
Observaii
1). Marcai cu Bookmark (sau Favorites), fiecare
instrument de cutare preferat, pentru a facilita
utilizarea ulterioar. De asemenea, marcai i unele
"home pages" folosite des i care au nume lungi i
complicate.
2). Unele instrumente de cutare ofer opiuni de
cutare n diferite domenii i categorii, care ajut la
limitarea focalizrii n cutarea d-voastr. Selectnd
una sau mai multe dintre aceste opiuni, putei s
mrii relevana potrivirilor din cutare. Aceste
opiuni sunt scrise, de obicei, lng casetele de
cutare.
Tehnici de cutare a informaiei pe
Internet
33
Tehnici de cutare a informaiei pe
Internet
3). Pot fi cazuri cnd un instrument de cutare nu se
conecteaz la o locaie Web, dintr-un anumit motiv:
- ai uitat s scriei sau ai scris greit un cuvnt n
adres, aa c verificai!
- exist probleme la accesarea locaiei, ori chiar locaia
este deconectat, din diverse motive. n astfel de
cazuri, revenii mai trziu.
- locaia a fost deconectat definitiv, dar s-au pstrat
anumite legturi. Uneori exist trimiteri ctre noua
locaie a documentului.
4). Folosii seciunea de Help a mecanismelor de cutare
pe care le utilizai cel mai des.
34
Tehnici de cutare a informaiei pe
Internet
5). La cutrile pe baz de cuvinte cheie, cel mai bine
este s formulai cereri n concordan cu
mecanismul de cutare particular pe care l utilizai.
Aceasta presupune o bun cunoatere i nelegere
a regulilor de formulare a cererilor. O cerere bine
formulat este hotrtoare pentru relevana
rspunsurilor i reduce numrul de potriviri
necorespunztoare.
6). Un numr extraordinar de mare de potriviri se
datoreaz unei cereri de cutare pe baz de cuvinte
individuale, de aceea este bine s folosii cuvinte
legate ntre ele, ca un cuplu de cuvinte.
35
Tehnici de cutare a informaiei pe
Internet
7). Unele locaii Web conin multe elemente grafice pe
care nu le putei omite. n cazul n care calculatorul
vostru efectueaz transferul prea ncet, este mai
bine s folosii instrumente de cutare care nu au
prea multe elemente grafice. Printre acestea sunt:
Hotbot, Infoseek i Mamma. Cu multe imagini
grafice sunt LookSmart i OneKey.
8). Cnd formulai o cerere, ncercai s folosii cuvinte
obinuite, exceptnd cazurile n care trebuie s
apar cuvinte sau sintagme speciale. Altfel, vei
obine un numr enorm de potriviri.
36
Tehnici de cutare a informaiei pe
Internet
Motoare de cutare renumite:
Google (www.google.com)
AlltheWeb (www.alltheweb.com)
MSN (www.msn.com)
Teoma (www.teoma.com)
AltaVista (www.altavista.com)
WiseNut (www.wisenut.com)
37
Tehnici de cutare a informaiei pe
Internet
ii. Directoare web (anuare online, repertoare
tematice)
Un serviciu de directoare web este o colecie de
pagini Web selecionate i organizate ierarhic n
categorii de subiecte de ctre un editor uman.
Un concept mai selectiv este cel de bibliotec
virtual, care este un director web ce include legturi
spre pagini cu informaie de nalt specializare, pe
domenii alese de editor.
38
Tehnici de cutare a informaiei pe
Internet
Serviciile de directoare acoper i indexeaz
o poriune mult mai mic din paginile WEB
existente, comparativ cu motoarele de
cutare. Dar folosirea lor poate duce la
regsirea unor rezultate ale cutrii mult mai
relevante pentru utilizator.
39
Tehnici de cutare a informaiei pe
Internet
Cele mai extinse servicii de directoare web
indexeaz cel mult cteva milioane de
pagini, comparativ cu cele cteva miliarde
indexate de ctre motoarele de cutare mai
importante. Serviciile de directoare NU
interogheaz direct paginile WEB, ci caut n
interiorul bazei lor de date. Rezultatul cutrii
poate duce la returnarea unor rezultate, care
nu mai au relevan.
40
Tehnici de cutare a informaiei pe
Internet
O serie de motoare de cutare sunt de fapt
unelte hibride, fiind n acelai timp att
motoare de cutare ct i servicii de
directoare (Google, de exemplu, unul
dintre cele mai cunoscute motoare de
cutare, are i un serviciu de directoare,
bazat pe soluia Open Directory Project).
41
Tehnici de cutare a informaiei pe
Internet
Dintre serviciile de directoare web, mai
cunoscute sunt :
Yahoo! (www.yahoo.com)
Google Directory (www.google.com)
Open Directory Project (ODP) (http://dmoz.org)
Zeal (www.zeal.com)
JoeAnt (www.joeant.com)
Gimpsy (www.gimpsy.com)
42
Tehnici de cutare a informaiei pe
Internet
Motoare de cutare versus servicii
de directoare
Cele mai uzuale modaliti de accesare a
paginilor WEB se regsesc n aa numitele
motoare de cutare, respectiv n aa
numitele directoare web.
43
Tehnici de cutare a informaiei pe
Internet
Modaliti de cutare a informaiei
Motoarele de cutare permit utilizatorului s
foloseasc orice termeni de cutare
(combinaie de termeni) dorete, motorul
cutnd aceti termeni n baza de date i
returnnd paginile care conin aceste
combinaii de termeni.
44
Tehnici de cutare a informaiei pe
Internet
Servicii de directoare web
Serviciile de directoare web au paginile
organizate n baza de date pe subiecte.
Paginile cu informaia dorit pot fi
selectate navignd prin acest arbore de
directoare.
45
Tehnici de cutare a informaiei pe
Internet
Navigarea prin structura directoarelor web
poate fi un foarte bun nceput pentru cutarea
informaiei dorite, cu condiia ca topicul ales sa
fie considerat ca subiect pentru o
arborescen de directoare.
46
Tehnici de cutare a informaiei pe
Internet
v
Site-ul Yahoo include att un motor de
cutare ct i un arbore de directoare web.
Diferena fa de un motor de cutare
obinuit este dat de faptul c motorul de
cutare al Yahoo caut cuvintele cheie doar
n interiorul directoarelor web din baza de
date a Yahoo.
47
Tehnici de cutare a informaiei pe
Internet
Din acest motiv motorul de cutare al site-
ului poate fi folosit cel mult pentru a identifica
zona din arborele de directoare ce conine
informaia dorit.
48
Tehnici de cutare a informaiei pe
Internet
Prezentarea rezultatelor
Odat ce au fost introdui termenii de cutare,
serverul i caut n baza de date web indexat i
returneaz lista cu rezultate.
Din cauza multitudinii de legturi cu informaie
nerelevant pentru utilizatorul ce a efectuat
cutarea, trebuie subliniate dou concepte deosebit
de importante n evaluarea listei cu rezultate ale
cutrii: rata de relevan (relevancy ranking),
respectiv rezumatul (abstract) ce nsoete legtura
ctre pagin.
49
Tehnici de cutare a informaiei pe
Internet
Paginile gsite n urma cutrii sunt
aproape ntotdeauna prezentate n
ordinea relevanei lor, n conformitate cu
termenii dup care s-a efectuat cutarea.
50
Tehnici de cutare a informaiei pe
Internet
n cazul celor mai multe servicii de cutare
web se poate observa c aproape fiecare
legtur spre o pagin considerat relevant
este nsoit de un scurt rezumat al
coninutului, multe servicii recurgnd chiar la
sublinierea (ngoarea) termenilor folosii n
respectivul rezumat.
51
iii. Biblioteci virtuale
a) Biblioteci virtuale de uz general:
Librarians' Index to the Internet (www.lii.org)
INFOMINE (www.infomine.com)
Internet Public Library (www.ipl.org)
The WWW Virtual Library (vlib.org)
Academic Info (www.academicinfo.net)
Internet Scout Project (scout.wisc.edu)
BUBL Link (academic resources) (bubl.ac.uk/link/)
Tehnici de cutare a informaiei pe
Internet
52
b) Biblioteci virtuale de specialitate
(orientate spre anumite domenii):
Project Gutenberg (www.gutenberg.org) - beletristic
National Academies Press (www.nap.edu) - tiin
Free books for doctors (www.fb4d.com) - medicin
The free management library
(www.managementhelp.org) - management
Tehnici de cutare a informaiei pe
Internet
53
iv. Invisible (deep) Web
Reprezint colecii de informaii online
stocate n baze de date accesibile pe Web,
dar care, din diferite motive, nu sunt indexate
de motoarele de cutare tradiionale. Aceste
servicii pot fi ntlnite i sub numele de
servicii speciale de cutare (specially search
engines).
Tehnici de cutare a informaiei pe
Internet
54
ProFusion (www.profusion.com)
Invisible-web (www.invisible-web.net)
Complete Planet (www.completeplanet.com)
Resource Discovery Network
(www.rdn.ac.uk)
Direct Search
(http://www.freepint.com/gary/direct.htm)
http://www.resourceshelf.com/
Tehnici de cutare a informaiei pe
Internet
55
v. Motoare de meta-cutare
(metasearch engine)
Un motor de meta-cutare este o unealt de
cutare care trimite cerea dumneavoastr
simultan ctre mai multe motoare de cutare
clasice, servicii de directoare web i uneori
spre colecii de tip invisible web.
Tehnici de cutare a informaiei pe
Internet
56
Dup colectarea rezultatelor cutrii de la toate
serviciile apelate, motoarele de meta-cutare elimin
legturile aflate n duplicat i, conform unui algoritm
propriu combin rezultatele ntr-o singur list,
acordndu-le i o rat de relevan.
Majoritatea motoarelor de meta-cutare iau n
considerare numai primele 10-20 de legturi din lista
furnizat de fiecare motor de cutare apelat,
rezultatele cutrii vor fi foarte bune, din punctul de
vedere al relevanei.
Tehnici de cutare a informaiei pe
Internet
57
Motoarele de meta-cutare NU au propriile
baze de date web, ci le folosesc pe cele ale
serviciilor apelate.
Motoarele de meta-cutare nu permit
nscrierea manual a unei pagini (site) n baza
de date.
Tehnici de cutare a informaiei pe
Internet
58
Unele dintre cele mai cunoscute motoare de
meta-cutare sunt:
Metasearch (www.metasearch.com)
ez2Find (www.ez2find.com)
Vivisimo (www.vivisimo.com)
MetaCrawler (www.metacrawler.com)
InfoGrid (www.infogrid.com)
Infonetware (www.infonetware.com)
iBoogie (www.iboogie.tv)
Tehnici de cutare a informaiei pe
Internet
59
vi. Utilitare de cutare de tip desktop
Un tip special de motoare de meta-cutare sunt
utilitarele de cutare de tip desktop (client side
search software). Aceste utilitare sunt programe ce
pot fi descrcate de pe Internet i instalate pe
propriul calculator (local). Principiul lor de
funcionare este oarecum similar cu al motoarelor de
meta-cutare.
Tehnici de cutare a informaiei pe
Internet
60
Cteva dintre cele mai utilizate utilitare de acest fel sunt:
Google Desktop (desktop.google.com)
Copernic (www.copernic.com)
Arrow Search (www.rt-software.co.uk/arrow_search/)
WebFerret (www.ferretsoft.com/download.htm)
ProtoSearch
(www.npccenterprises.com/products/protosearch2.shtml)
Tehnici de cutare a informaiei pe
Internet
61
Motoarele de meta-cutare sunt unelte
complementare excelente, ns datorit unor
considerente (numr relativ mic de legturi
luate n considerare de la fiecare serviciu
apelat, imposibilitatea de a folosi eficient
tehnici avansate de cutare etc. ) NU pot
elimina necesitatea folosirii unor motoare de
cutare clasice.
Tehnici de cutare a informaiei pe
Internet
62
CE TEHNICI DE CUTARE SE FOLOSESC ?
1. Dac cunoatei exact ce tip de informaie dorii
s aflai, este recomandat folosirea motoarelor
de cutare.
De exemplu pentru a gsi informaii despre pal sau
wood putei folosi motoarele de cutare, deoarece
informaia nu este suficient de specific pentru a fi
subiectul unui arbore de directoare, dar domeniul
este suficient de bine conturat pentru a nu fi
necesar recurgerea la un motor de meta-cutare.
Tehnici de cutare a informaiei pe
Internet
63
2. Dac vei cuta informaii despre un
anumit termen sau o combinaie de
termeni i dorii o analiz exhaustiv a
temei analizate, este de preferat recurgerea
la motoare de meta-cutare, ce pot apela
simultan mai multe servicii web (10 -12
motoare de cutare sau directoare web).
De exemplu, cutarea dup termenul
composite (vezi composite plates)
Tehnici de cutare a informaiei pe
Internet
64
3. Dac dorii s cutai informaii generale despre
subiecte cu grad ridicat de popularitate, este
indicat folosirea serviciilor de directoare web.
Astfel dac dorii informaii despre industrial plants,
este mult mai indicat s folositi serviciul de
directoare Yahoo, n care putei naviga cu uurin,
informaia este bine organizat i exist i faciliti
de cutare prin arborele de directoare.
Tehnici de cutare a informaiei pe
Internet
65
4. Dac dorii, informaii pertinente legate
de anumite domenii ale literaturii, tiinei
etc. este preferabil folosirea serviciilor tip
bibliotec virtual.
Tehnici de cutare a informaiei pe
Internet
66
5. Dimpotriv, dac dorii informaii n timp
real sau informaii al cror coninut se
schimb dinamic (tiri, prognoze meteo,
mersul trenurilor) folosii baze de date web
specializate (invisible or deep web).
Tehnici de cutare a informaiei pe
Internet
67
Muli dintre deintorii de servicii WEB au
ales s i diversifice activitatea furniznd
mai multe servicii sub aceeai interfa
utilizator.
Astfel s-a cristalizat un nou concept, acela de
PORTAL WEB.
Tehnici de cutare a informaiei pe
Internet
68
Portalul Web
- un site WEB ce ofer o gam larg de
servicii i resurse online, cum ar fi: e-mail,
forumuri de discuii, motoare de cutare,
directoare web, comer electronic etc. (a se
vedea www.yahoo.com, unul dintre cele mai
cunoscute servicii de cutare, transformat
ntr-un portal).
Tehnici de cutare a informaiei pe
Internet
69
Concluzii Motoare de cutare
Motoarele de cutare sunt probabil cea mai utilizat cale
de accesare a informaiei stocate n bazele de date Web.
Principalii pai necesari pentru a utiliza eficient un motor
de cutare sunt urmtorii:
1. Formulai-v atent nevoia de informare. ncercai s
facei aceasta ct mai simplu i specific cu putin;
2. Spargei cererea de mai sus ntr-o serie de termeni
de cutare;
3. Gsii sinonime pentru fiecare termen identificat;
70
4. Atunci cnd este posibil, recurgei la fraze (termeni
specificai n ghilimele);
5. Combinai sinonimele termenilor de cutare prin
intermediul operatorului OR i legai aceste combinaii
prin intermediul operatorului AND;
6. Analizai circa 30 de rezultate nainte de a cuta din
nou;
7. Dac este posibil, nainte de a rencepe cutarea,
folosii pagini cu informaie similar celei cutate
pentru a identifica noi termeni de cutare i sinonime
ale acestora.
Concluzii Motoare de cutare

You might also like