Localitzar informació 1. Conèixer recursos: Llenguatges documentals i eines de cerca.
L'objectiu d'aquest tema és ampliar la visió general de les fonts d'informació que estem desenvolupant en aquest mòdul. Ara que ja ens hem fet una idea general sobre les fonts d'informació ens cal conèixer les eines específiques per accedir-hi però això ho veurem a la pràctica següent. Abans ens resultarà útil introduir unes nocions bàsiques sobre els llenguatges documentals i les eines de cerca.
En general, a l’usuari (nosaltres o els nostres alumnes) que fa una cerca no li cal tenir cap coneixement dels llenguatges d'indexació i recuperació que esmentarem a continuació. A Primaria i el primer cicle de l'ESO en podem prescindir perfectament.
Ara bé, com a referents d'una biblioteca escolar i de cara a l'alumnat de segon cicle d'ESO i Batxillerat sí que resulta convenient posseir algunes nocions del tema ja que està implicat en la tria de les eines de cerca que ens permetran accedir a fonts ocultes necessàries en cerques més complexes.
Conèixer els recursos disponibles: Els llenguatges de cerca
Les eines que utilitzarem habitualment per cercar informació empren diferents llenguatges per indexar els documents a les seves bases de dades.
Per exemple, els motors de cerca i els directoris que localitzen documents al Web visible fan servir el que es coneix com “llenguatge natural” mentre que els motors catàlegs o directoris que emprem per consultar fonts secundàries o el Web invisible acostumen a utilitzar el que es coneix com “llenguatge documental”.
En síntesi, segons els termes que representen els documents, distingim dues menes de llenguatges:
- Llenguatge natural (lliure)
- Llenguatge documental (controlat)
El llenguatge natural
Les eines que utilitzen llenguatge natural o lliure per a la cerca, accedeixen a fonts d’informació, generalment primàries, que estan allotjades en la primera capa del Web, l’internet visible. En l’àmbit escolar, i especialment a l’educació primària, probablement en tindrem prou en accedir en aquesta primera capa però si volem aprofundir i localitzar documents allotjats en capes més profundes de la xarxa, ens caldrà recórrer a fonts secundàries per arribar als documents que ens interessin. En aquest segon cas, les eines de cerca necessàries utilitzen, generalment, llenguatges documentals més o menys controlats.
Per exemple, si ens cal saber en quina biblioteca puc obtenir un determinat document en préstec o necessitem informació força especialitzada, no tindré prou amb aquests cercadors generals del Web. Per a això, em caldrà una consulta específica a un catàleg bibliotecari o a una base de dades. Si desconec l’adreça puc emprar un motor de cerca com Google per accedir a la pàgina concreta del catàleg o base de dades però, en definitiva l’eina final de cerca serà la que el catàleg o la base proporcioni.
El llenguatge natural no presenta cap manipulació. No té cap mena de control sobre el vocabulari indexat i això facilita molt la recuperació de fonts d’informació però com a contrapartida retorna molt soroll documental (massa documents).
El llenguatge documental
Bàsicament, un llenguatge documental pot ser de dues menes:
- Un vocabulari controlat de termes del llenguatge natural (llista d'encapçalaments, descriptors, tesaurus…)
- Un sistema artificial de signes normalitzats (com per exemple la CDU).
Segons el grau de control dels descriptors, en trobem de dues menes:
- Descriptors lliures
Vocabulari no predefinit que es va creant durant la indexació. Es diferencia amb el llenguatge natural en que és una persona qui tria selectivament els descriptors a incorporar. Dins d'aquesta categoria estarien els llistats de descriptors lliures i de paraules clau.
- Descriptors controlats
Vocabulari predefinit que admet un nombre limitat de modificacions. Dins d'aquesta categoria estarien els sistemes de classificació (CDU), els llistats d'encapçalament de matèries i els tesaurus.
Avantatges dels llenguatges documentals
Entre els avantatges dels llenguatges documentals podem esmentar que redueixen enormement el soroll documental propi dels llenguatges naturals, ja que normalitzen el vocabulari mitjançant el control tant d'accidents lingüístics (polisèmia i sinonímia) com de gènere i de nombre de les expressions.
També assenyalen totes les alternatives possibles per a un terme determinat, de manera que es facilita la consulta d'expressions relacionades en les quals hom no havia pensat prèviament. En quant als inconvenients podem dir que, de vegades, el seu ús precisa cert entrenament previ que només es justifica quan hem de consultar documents molt especialitzats.
Conèixer els recursos disponibles: Eines de cerca
A continuació, seguirem ampliant els conceptes relacionats amb els recursos informatius. En concret analitzarem les eines específiques que ens faciliten accedir a les fonts, especialment les virtuals.
Ara, ja coneixem diferents fonts on adreçar-nos per resoldre una necessitat d'informació però… com accedim a cada font?
Així doncs, tot seguit veurem:
- Fonts d'informació a Internet
- Les eines per consultar les fonts d'informació
- Els llenguatges de cerca
- Les eines específiques dels entorns virtuals, els cercadors:
- Motors de cerca, directoris i metacercadors amb llenguatge natural
- Motors de cerca, directoris amb llenguatge controlat
Fonts d'informació a la xarxa Internet
Hem vist a la pràctica anterior que el lloc on localitzem els documents materials i tangibles és un entorn físic com, per exemple, una biblioteca mentre que el lloc on podem obtenir-los de forma immaterial és un entorn virtual, una mena d’espai intangible anomenat Internet.
En realitat, el Web no és immaterial, simplement no és tangible per als sentits humans. La informació a la què accedim està continguda en milers o milions de discs durs allotjats en ordinadors servidors d’arreu del món. Aquests servidors estan interconnectats mitjançant un protocol de comunicació anomenat TCP-IP dins d’un entorn virtual anomenat Internet.
El WWW (acrònim anglès de World Wide Web, teranyina d'abast mundial) o Web és una xarxa de pàgines escrites en hipertext mitjançant el llenguatge HTML o altres i connectades entre sí per vincles, de manera que formen un sol cos de coneixement pel qual s'hi pot navegar.
En català, el mot web, quan s'utilitza com a substantiu i com a nom propi (Web) és equivalent a l'anglès World Wide Web. El seu gènere és masculí, segons ha quedat fixat pel TermCat (Institut d'Estudis Catalans). Tanmateix, s’empra el masculí si es refereix a un lloc web o a tota la xarxa, en conjunt, i femení (la web) si es referix a una pàgina web concreta.
Una pàgina web és un document del Web (WWW), en format hipertextual que conté vincles per facilitar la navegació d'una pàgina o secció a una altra. Cada pàgina té una adreça única anomenada adreça URL o URI que la identifica inequívocament entre totes les pàgines.
Un lloc web és una col·lecció de pàgines web emmagatzemades en un directori o entre directoris relacionats d'un servidor web. Cada lloc web inclou una pàgina índex.
Un portal d'Internet és un lloc web, o pàgina web, molt desenvolupada i extensa que ofereix informacions i serveis diversos, generals o especialitzats.
L'accés a les fonts en línia
Per poder localitzar una font amb suport material com un llibre o un DVD en una biblioteca física disposem de dues eines per ajudar-nos: la CDU i el catàleg.
La CDU és un sistema d’ordenació temàtica dels llibres als prestatges mentre que el catàleg és una mena llistat endreçat de tots els documents que conté la biblioteca. Actualment, les biblioteques han abocat els seus catàlegs al Web, de manera que podem localitzar un document sense necessitat d'accedir físicament a la biblioteca.
Per a la localització de fons en línia –a banda de la connexió a Internet- necessitem dues eines bàsiques:
- un navegador
- un cercador
Un navegador web és una aplicació que permet a un usuari recuperar i reproduir documents d'hipertext, des de servidors web –ordinadors- situats a qualsevol lloc del món. Perquè això es produeixi, cal introduir l'adreça web (URL o URI) a la barra del navegador per accedir al lloc.
La funció bàsica d'un navegador és mostrar documents web. Aquests documents, tenen hipervincles que enllacen parts de text o imatges amb un altre document. El seguiment d'enllaços d'una pàgina a una altra, ubicada en qualsevol ordinador connectat a Internet s'anomena navegació.
Els sistemes operatius, com per exemple Windows, incorporen navegadors per defecte com és el cas de l’Internet Explorer a Windows. Això no treu que nosaltres puguem afegir d'altres navegadors als nostres ordinadors. En els darrers anys hi ha hagut un gran augment de l'oferta que ofereix cada vegada major integració amb l'entorn en el qual s'executen, com per exemple Google Chrome. Per la seva banda, Netscape Communications Corporation va alliberar el codi font del seu navegador, naixent així el projecte Mozilla. A la fi del 2004 va aparèixer al mercat Firefox, una branca de desenvolupament de Mozilla. Altres navegadors menys coneguts són: Safari, Opera, Konqueror o Epiphany.
D'altra banda, l’expansió d’Internet i l’enorme quantitat d’informació disponible al Web va fer necessari des del primer moment l’aparició de cercadors per recopilar i ordenar el contingut de la xarxa.
Un cercador és una aplicació allotjada en un pàgina web en la qual s'ofereix la possibilitat de localitzar documents concrets a partir d’una base de dades interna. El seu ús facilita enormement l'obtenció d'unes webs determinades que continguin informació sobre el tema que ens interessa.
- Podríem definir la Internet visible com aquella part del Web amb contingut que pot ser indexat i, per tant, recuperat pels motors de cerca tradicionals tipus Google
- La Internet invisible o profunda seria aquella part d'informació existent al Web que no pot ser indexada ni recuperada pels motors de cerca convencionals.
Eines específiques per a la cerca en línia: Els cercadors
Els cercadors són les eines que ens faciliten l’accés a les fonts d'informació disponibles al Web. Si aquestes fonts se situen al Web visible o no, ens caldrà triar cercadors diferents. Depenent de la construcció de la seva base de dades interna, per accedir al Web visible utilitzarem cercadors amb llenguatge natural o controlat. A mida que ens allunyem del Web visible només podrem accedir a partir de cercadors amb llenguatge controlat.
Segons la forma d'obtenir les adreces que emmagatzemen, els cercadors que empren llenguatge natural es poden classificar en tres tipus principals:
- Motors de cerca
- Directoris
- Metacercadors
De la mateixa manera, els cercadors que empren llenguatge controlat es poden classificar en dos tipus principals:
- Motors de cerca de catàlegs i bases de dades
- Directoris indexats per persones
Per contra, es coneix com “cerca per navegació” a la forma de consultar la base de dades que utilitzen els directoris. En aquest cas, accedim als registres desplaçant-nos (“navegant”) entre les llistes de categories i el seu desplegament jeràrquic. Una altra expressió que també podem trobar en relació als directoris és la de “cerca per índex temàtic”.
En qualsevol cas, els motors de cerca, tant si utilitzen llenguatge natural com controlat, presenten habitualment una opció de cerca simple i una altra de cerca avançada.
Cercadors basats en el llenguatge natural
Els cercador basats en el llenguatge natural s’allotgen en una pàgina web en la qual s'ofereix consultar una base de dades que agrupa adreces de pàgines web junt amb el seu contingut. El seu ús facilita enormement l'obtenció d'un llistat de pàgines que contenen informació sobre el tema que ens interessa.
En funció de la manera de construcció i accés a la base de dades, existeixen diversos tipus de cercadors d’aquesta mena, però tots ells tenen en comú que permeten una consulta en la qual el cercador ens retorna una llista d'adreces de pàgines web o documents relacionats amb el tema consultat.
Ja siguin motors de cerca o directoris, cada tipus de cercador té les seves pròpies característiques i conèixer-les pot ajudar-nos a decidir quin utilitzar en funció de les necessitats de la nostra cerca. No obstant això, avui dia tots els cercadors tendeixen a oferir el major nombre de serveis possible, amb el que les seves ofertes de recerca s'assemblen cada vegada més, sent difícil endevinar de quin tipus de cercador estem parlant.
D'altra banda, segons el tipus d'informació que rastregen, els cercadors poden ser genèrics, troben informació de qualsevol tema, o temàtics, especialitzats en un tema concret.
Motors de cerca amb llenguatge natural
Per a localitzar i accedir als recursos informatius disponibles al Web visible, sens dubte, les eines més utilitzades són els motors de cerca. El seu ús s’ha popularitzat tant que sovint fem servir el terme “cercador” –més genèric- com a sinònim de motor de cerca.
Els motors de cerca que utilitzen llenguatge natural són uns programes informàtics que rastregen la capa visible de la xarxa recopilant dades i informació sobre les pàgines web per incorporar-la a la seva base de dades. El fet que indexen les paraules que contenen els documents per llenguatge natural permet sol•licitar continguts de manera força flexible. El motor ens retorna una llista de referències que compleixen els criteris demanats.
Són útils quan tenim clar el què busquem, quan necessitem informació molt concreta, quan volem arribar ràpidament a la informació que busquem. La contrapartida és que podem obtenir un excés de documents, el que coneixem com “soroll documental”.
Com exemples de motors de cerca més coneguts podem esmentar Google, Altavista o Yahoo i en català, Vilaweb.
Una variant interessant és la possibilitat que aquests motors de cerca s’implementin dins d’un llocs web o portal temàtic, de manera que la cerca queda limitada als recursos del lloc en qüestió. Això evita el soroll i augmenta la pertinença però es corre el risc que si el lloc no conté indexats gaires recursos, el que recuperem és poc rellevant o fins i tot nul (silenci documental).
Dins d’aquesta mena de motors de cerca, val la pena tenir en consideració el motor de cerca de Google implementat dins el portal de l’XTEC. És una bona alternativa començar per aquest cercador quan iniciem una investigació.
És habitual que aquests cercadors basats en el llenguatge natural incloguin també cerca per directoris i també l'opció de cerca avançada. Certament, aquesta no ofereix tantes possibilitats com la dels motors basats en llenguatge controlat però sí que ajuda a acotar algunes característiques.
Per exemple, la cerca avançada de Google facilita filtrar per idioma, per data, per format o zona geogràfica. Aquest motor de cerca també proporciona l'opció eines d’idioma amb les que podem fer una cerca traduïda. És a dir, Google cerca resultats en altres idiomes i els tradueix a l’idioma que hi designem.
Metacercadors
Els metacercadors són motors de cerca que fan les seves cerques de manera simultània en diversos cercadors, faciliten que es puguin utilitzar diferents motors de cerca al mateix temps. Actuen com intermediaris que remeten les qüestions a diferents motors seleccionats i reenvien les respostes a l'usuari. Per exemple, Metacrawler.
Directoris amb llenguatge natural
Són bases de dades de documents organitzats de forma temàtica a partir d’un llistat de matèries generals que pot ser subdividit en matèries més específiques. Els directoris agrupen les pàgines per temes o matèries en una estructura jeràrquica que va de les categories més àmplies a les més específiques. Els més coneguts són Yahoo, Google director o Dmoz de l'Open Directory Project, un gran directori públic administrat per Netscape.
La cerca al Web visible mitjançant un motor és probablement la manera més ràpida de trobar informació sobre un tema en concret però, en contrapartida, podem obtenir un excés d’informació poc rellevant. Els recursos que contenen els directoris han estat seleccionats per editors voluntaris tenint en compte la seva pertinença i per això són apropiats per cercar informació sobre un tema amb menys soroll documental.
Els directoris són útils quan tenim una idea poc clara d'allò que busquem, volem tenir un llistat de pàgines sobre allò que ens interessa o necessitem informació genèrica sobre un tema concret. També poden ajudar-nos a entendre la relació entre els temes d'una àrea específica i obtenir suggeriments de termes que resultin útils per a realitzar una determinada cerca.
La majoria ofereixen també un motor de cerca per interrogar el contingut del directori, el qual ens permet accedir-hi mitjançant llenguatge natural.
Cercadors basats en el llenguatge controlat
Si necessito saber en quina biblioteca puc obtenir un determinat document en préstec o em cal una consulta més especialitzada, no en tindré prou amb aquests cercadors generals del Web. Per a això em caldrà una consulta específica a un catàleg bibliotecari o a una base de dades. Si desconec l’adreça puc emprar un motor com Google per accedir a la pàgina concreta del catàleg o base de dades però, en definitiva l’eina final de cerca serà la que el catàleg em proporcioni.
Els cercador basats en el llenguatge controlat s’allotgen normalment en pàgines institucionals o corporatives (biblioteques, universitats, empreses, etc) i a partir del seu ús podem accedir a fonts primàries del Web visible però filtrades i amb major qualitat o a fonts secundàries a que són invisibles als cercadors comuns. Aquest seria el cas dels catàlegs de biblioteques o les bases de dades especialitzades.
Motors de cerca amb llenguatge controlat
Els catàlegs de les biblioteques, les bases de dades, les seleccions bibliogràfiques o les guies temàtiques inclouen motors de cerca que normalment utilitzen llenguatges controlats per a la seva consulta. Això evita el soroll documental i proporcionen més precisió i qualitat en la localització de documents. Acostumen a incorporar interfícies senzilles per ajudar els usuaris que no tenen experiència en aquests llenguatges. També acostumen a incorporar ajudes per facilitar-ne l’ús.
Exemple de cercador emprat pel CCUC http://ccuc.cbuc.cat/
Normalment aquests motors de cerca estan basats en llistes d'encapçalament de matèries o bé de descriptors lliures
Directoris amb llenguatge controlat
Junt amb els motors de cerca, les guies, les seleccions de fonts i les bases de dades també poden emprar alternativament directoris com a eines d'accés.
Aquest és el cas, per exemple, de MeRLí, un repositori de recursos digitals educatius que el Departament d'Ensenyament de la Generalitat de Catalunya manté a disposició de tota la comunitat educativa. Els recursos referenciats han estat creats, catalogats i valorats per la pròpia comunitat. La catalogació combina llistes de descriptors lliures i de paraules clau. Cada recurs té associada una fitxa amb descriptors com el nivell, l'àrea, la descripció…
A MeRLí s'hi poden trobar, entre altres, materials de:
- Edu3.cat (http://www.edu3.cat/)
- Edu365.cat (http://www.edu365.cat/)
- Escola Oberta de la XTEC (http://www.xtec.cat/escola/index.htm)
- JClic (http://clic.xtec.cat/)
Una altra eina d'aquesta mena són els tesaurus Veieu, per exemple, el tesaurus d’educació de la UNESCO http://databases.unesco.org/thessp/
D’altra banda, les biblioteques virtuals acostumen a utilitzar una combinació de directoris i sistemes de classificació, com la CDU, per a la localització dels documents.
Veieu l’exemple de la biblioteca virtual de les Biblioteques de Salt i observeu el seu funcionament.
En resum, el que en definitiva compta és saber relacionar de manera eficaç les fonts d’informació que cal consultar amb les seves eines d'accés tenint en compte els llenguatges que aquestes utilitzen.
Visiteu diferents cercadors i compareu les seves utilitats:
- Cercadors (recull de les Biblioteques públiques de Salt).
- Mou-te pel Google. Materials del Projecte Pulls. Servei de biblioteques de la Diputació de Barcelona.
- Metacercador terminològic de la UPC. Biblioteca de la UPC.
- Microtesaurus temàtic. Educació i pedagogia de la UB.
- Buscador de guies temàtiques. Biblioteques Públiques de la Diputació de Barcelona
- ARDID, M.; CASALS, P.; LIÑAN, N.; TEJEDA, J. L; VIVANCOS, J. (2000). La competència bàsica en tecnologies de la informació i la comunicació.
- ARELLANO, V. (2002). Biblioteca y aprendizaje autónomo: guía práctica para descubrir, comprender y aprovechar los recursos documentales. Pamplona: Gobierno de Navarra, Departamento de Educación y Cultura, 2002. També disponible en línia.
- DURBAN, G. (2006) La cerca i recuperació de la informació.
- MONEREO, C.; FUENTES, M.; SÀNCHEZ, S. (2000). Estratègies de Cerca i Navegació a Internet per part d'experts i principiants. Interactive Educational Multimedia, núm. 1, p. 24-34.
Per pensar
"Jo relaciono l'ALFIN en última instància amb els enfocs constructivistes de l'aprenentatge, el foment de l'autonomia de l'individu i el desenvolupament de la seva capacitat crítica en una societat complexa, necessitada d'implicació i participació democràtica" Gómez, J.A. (2005)