| 
  • If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.

  • You already know Dokkio is an AI-powered assistant to organize & manage your digital files & messages. Very soon, Dokkio will support Outlook as well as One Drive. Check it out today!

View
 

zoektechnieken

Page history last edited by Eric Sieverts 13 years, 9 months ago

3.2      Zoektechnieken

 

Voordat we op de verschillende praktische aanpakken van zoekvragen ingaan, zullen we eerst eens kijken naar de technieken die in allerlei zoeksystemen kunnen worden toegepast om informatie te zoeken. Daarbij beperken we ons in deze paragraaf tot de al eerder genoemde "systemen met zoekhokjes".


3.2.1     Best-match zoeken

De meest bekende zoeksystemen zijn op dit moment de zoekmachines op internet, en dan vooral Google. De techniek die door die systemen wordt toegepast, wordt wel aangeduid met de term "best match" zoeken. Hierin worden technieken toegepast waarmee het systeem probeert te bepalen welke resultaten "het meest overeenkomen" met de gestelde zoekvraag. Dat houdt in dat zoekresultaten ook in een bepaalde volgorde gepresenteerd worden. Omdat die mate van overeenkomst met de zoekvraag als een maat voor de relevantie van de gevonden informatie wordt beschouwd, wordt dit wel de relevantie-volgorde of "relevance ranking" genoemd.

 

Wanneer je bij zoekmachines als Google maar een enkel woord als zoekvraag intikt, is het voor dergelijke systemen natuurlijk heel moeilijk om zonder verdere context te bepalen wat voor die vraag het meest relevant is. Daarom wordt in zulke gevallen eigenlijk alleen gekeken of je zoekwoord in de titel van een webpagina voorkomt, of wellicht in koppen in de tekst. Zo ja dan hebben die pagina's een grotere kans voor jou relevant te zijn, dan een pagina waar je zoekwoord onopvallend ergens onderaan de pagina staat. Daarnaast wordt ook het vermoedelijk belang van de op je zoekwoord gevonden pagina's afgewogen op grond van het aantal andere webpagina's dat daarnaar verwijst, dat een hyperlink daarheen bevat. Hoe die afwegingen precies geprogrammeerd zijn is het geheim van elke zoekmachine. Elke zoekmachine doet dat dan ook een beetje anders.


Zoals we al zagen zul je zoekvragen vaak veel preciezer moeten afbakenen, waarvoor meer zoekwoorden nodig zijn. Als je inderdaad meer woorden intikt, wordt het voor een zoekmachine al makkelijker om de relevantie van gevonden pagina's ook nog op wat meer inhoudelijke gronden in te schatten. Er wordt dan van uitgegaan dat de woorden die een gebruiker als zoekvraag intikt, een soort zinnetjes vormen. Hoe preciezer een webpagina dat zinnetje bevat, hoe beter die waarschijnlijk met de zoekvraag overeenkomt en hoe relevanter die dus waarschijnlijk zal zijn. Onderlinge afstand en volgorde van de zoekwoorden in de gevonden webpagina's speelt daar dus een belangrijke rol.

 

Factoren die de meeste webzoekmachines in rekening brengen bij de bepaling van de relevantievolgorde van zoekresultaten:

  1. als zoekterm(en) in titel van document, des te beter
  2. als zoekterm(en) in koppen <H1> <H2>, des te beter
  3. als zoekterm(en) in URL van document, des te beter
  4. naarmate zoektermen meer in begin van document, des te beter
  5. hoe vaker zoekterm in document wordt herhaald, hoe beter
  6. hoe dichter zoektermen bij elkaar (en in zelfde volgorde [vb]), hoe beter
  7. zeldzame zoekterm is belangrijker dan heel algemene
  8. hoe meer hyperlinks naar een pagina verwijzen, hoe beter
  9. hoe vaker term voorkomt in tekst van hyperlink naar pagina, hoe beter


Als je meer woorden als zoekvraag intikt, vertoont een pagina die niet al die woorden bevat, maar bijvoorbeeld maar drie van de vier, ook nog wel enige "overeenkomst" met de zoekvraag. Toch leveren de meeste grote zoekmachines standaard alleen resultaten op waar de door de gebruiker gevraagde woorden allemaal in voorkomen. De omvang van het web is namelijk zo groot dat zelfs een zoekvraag op vijf woorden meestal nog zoveel resultaten met alle vijf die woorden oplevert, dat er weinig aanleiding is ook nog te laten zien wat op één na al die woorden bevat. Dat betekent dat de meeste webzoekmachines standaard zo staan ingesteld dat ze zoeken op "all of the words". Bij zoekmachines voor lokale informatiesystemen, intranetten en kleine collecties, zullen resultaten met op-één-na alle zoekwoorden, vaak ook - met lagere relevantie - in het zoekresultaat getoond worden.

 

Bij webzoekmachines kun je voor heel specialistische onderwerpen en bij zoekvragen die met heel veel zoekwoorden gespecificeerd zijn, in hun "advanced" zoekschermen meestal ook specificeren dat het systeem (voor een deel van de woorden) moet zoeken op "any of the words" of "at least one of the words". In feite is dat al een vorm van Booleaans zoeken.

 

3.2.2     Booleaans zoeken

De hiervoor besproken "best match" zoekmethode houdt er weinig rekening mee dat je voor sommige zoekwoorden wel eens synoniemen of alternatieven in je zoekactie zou willen verwerken. In zo'n geval kan het je niet schelen welk van beide woorden in het zoekresultaat voorkomt. Als je in een standaard zoekscherm van een zoekmachine twee synoniemen in je zoekvraag verwerkt, zul je namelijk alleen resultaten krijgen waarin die twee synoniemen samen voorkomen. En ook als je met "any of the words" zoekt, kun je niet aangeven welke woorden uit je zoekvraag nu precies de synoniemen zijn, waar er eigenlijk maar eentje van hoeft voor te komen. Dat soort specificaties en nog veel meer zijn wel mogelijk met de zogenaamde Booleaanse zoekmethode. In vrijwel alle zoeksystemen voor databases en bibliotheekcatalogi kan die worden toegepast. Maar veel zoekmachines op internet, zoals onder meer Google, Yahoo, Bing, AltaVista, en Exalead, blijken gebruik van die methode ook wel degelijk te ondersteunen. Bij de Booleaanse zoekmethode zijn standaard drie operatoren beschikbaar om zoekwoorden met elkaar te combineren, AND, OR en NOT.


Met de AND-operator geef je aan dat beide zoekwoorden in de te vinden documenten moeten voorkomen. Met bijvoorbeeld

 

     krant AND internet 

vind je dus alleen documenten waarin die twee woorden samen voorkomen. Een AND-operator zorgt dus voor een sterke inperking van je zoekresultaat. En hoe meer woorden je met AND combineert hoe strengere eisen je aan de te vinden documenten stelt, dus hoe minder je overhoudt.

 

     krant AND internet AND markt

NB: Bij de meeste webzoekmachines (Google, Yahoo, Bing etc.) mag de AND-operator worden weggelaten. Het intikken van meer zoekwoorden in een zoekscherm voor " eenvoudig zoeken" impliceert al automatisch een AND-relatie

 

Met de OR-operator geef je aan dat maar één van beide woorden in een document hoeft voor te komen (maar beide mag natuurlijk ook). Met bijvoorbeeld

 

     krant OR dagblad 

vind je dus alle documenten waarin het woord "krant" voorkomt, plus alle documenten waarin het woord "dagblad" voorkomt (en dus ook die waarin ze allebei voorkomen). Een OR-operator zorgt dus voor uitbreiding van je zoekresultaat. En hoe meer woorden je met OR combineert hoe meer je je zoekresultaat uitbreidt.

 

     krant OR dagblad OR ochtendblad 

Met de NOT-operator geef je aan dat een bepaald woord beslist niet in je zoekresultaten mag voorkomen. Met bijvoorbeeld

 

     krant NOT reclame 

zal geen enkel document meer in je zoekresultaat zitten waarin het woord "reclame" voorkomt, ook al staat het woord "krant" er wel degelijk in. Dat is dus weer een manier om je zoekresultaat in te perken.


NB1: bij sommige zoeksystemen moet je in plaats van NOT de operator ANDNOT gebruiken ("krant ANDNOT reclame").
NB2: bij Google en Yahoo moet je in plaats van NOT een minteken direct voor het ongewenste woord zetten ("krant -reclame")

 

In een zoekopdracht kun je ook verschillende operatoren combineren. Gebruik daarbij wel haakjes om aan te geven welke zoekwoorden het eerst gecombineerd moeten worden. Zonder die haakjes is het niet altijd duidelijk hoe een zoeksysteem je zoekvraag interpreteert. Dus bijvoorbeeld

 

     (krant OR dagblad) AND internet 

om documenten te krijgen waarin het woord "internet" voorkomt samen met het woord "krant" of het woord "dagblad". Met een andere volgorde

 

     internet AND (dagblad OR krant)

 

krijg je uiteraard hetzelfde resultaat.
Met

 

     (krant AND internet) OR webkrant 

breid je het resultaat van "krant AND internet" uit met alle documenten waarin alleen maar het woord "webkrant" hoeft voor te komen.
Met

 

     (krant AND internet) NOT reclame 

verwijder je juist alle documenten waarin het woord "reclame" voorkomt.


Met die Booleaanse methode kun je dus heel precies zoekvragen formuleren. Ook als je voor meer van je oorspronkelijke zoekwoorden synoniemen wilt toevoegen, is dat mogelijk. Zo zou je uiteindelijk bijvoorbeeld de volgende zoekvraag kunnen krijgen:


(krant OR dagblad OR ochtendblad) AND (internet OR web) AND markt NOT reclame


De methoden uit bovenstaande voorbeelden kunnen ook gebruikt worden bij webzoekmachines waarmee je Booleaans kunt zoeken. Je hoeft daarvoor niets extra's te doen, behalve dan dat het verplicht is de operatoren in hoofdletters in te tikken.


Nadeel van de klassieke Booleaanse zoekmethode is dat het nogal een "zwart-wit" methode is. Een document voldoet wel of niet aan je combinatie van zoektermen. Nuancering wordt daar in principe niet in aangebracht. De presentatievolgorde van zoekresultaten uit databases en bibliotheekcatalogi wordt daarom meestal alleen bepaald door het tijdstip dat de gevonden gegevens aan het systeem zijn toegevoegd, de meest recente gegevens het eerst. Dat laatste geldt niet voor webzoekmachines. Ook op de resultaten van Booleaanse combinaties Passen die een deel van hun reguliere methoden van relevance ranking.

 

Hoe nuttig en noodzakelijk de AND-operator voor het doen van zoekacties ook is, er kleeft ook een nadeel aan. Dat twee woorden samen in een document voorkomen, betekent nog niet dat ze inhoudelijk ook echt iets met elkaar te maken hebben. Toch verwacht je dat meestal wel als je op zo'n combinatie zoekt. Zeker in gevonden documenten met veel tekst kunnen twee met AND gekoppelde woorden ver bij elkaar vandaan staan en niets met elkaar te maken hebben. Om dan toch wat preciezer te zoeken, kun je in sommige zoeksystemen aangeven dat de gezochte woorden bij elkaar in de buurt moeten staan. Bij sommige systemen (ook bijvoorbeeld de webzoekmachines Yahoo, AltaVista, AllTheWeb en Exalead) kun je daarvoor de NEAR-operator gebruiken. 

krant NEAR internet

betekent dan dat de beide woorden niet alleen samen moeten voorkomen, maar dat ze ook op niet meer dan 10 woorden afstand van elkaar mogen staan. Er is dan een veel grotere kans dat er een inhoudelijke relatie tussen die woorden bestaat. In andere systemen, zoals bijvoorbeeld LexisNexis Newsportal, kun je zelfs nog preciezer de maximale afstand aangeven. 

krant W/3 internet

betekent daar dat de twee zoekwoorden niet meer dan drie woorden bij elkaar vandaan mogen staan. Deze operatoren zijn dus "strenger" dan AND en perken je zoekresultaat sterker in.


In de tot nu toe gegeven voorbeelden werden alle te combineren termen direct in één keer in een soms lange uitdrukking ingetikt. Niet in alle zoeksystemen is dat nodig. Er zijn ook systemen waar je je zoekactie in stapjes kunt opbouwen. Daarin krijgt dan elk tussenresultaat - meestal een resultaat-set genoemd - een volgnummer, waarna je die tussenresultaten alsnog met Booleaanse operatoren kunt combineren. Het eerdere complexe voorbeeld zou er dan ongeveer als volgt kunnen uitzien:


#1: krant OR dagblad OR ochtendblad
#2: internet OR web
#3: markt
#4: reclame
#5: (#1 AND #2 AND #3) NOT #4

 


3.2.3     Truncatie en woordstammen

In de voorgaande voorbeelden is steeds alleen het enkelvoud van de zoekwoorden gebruikt. Je mag er echter beslist niet van uitgaan dat elk zoeksysteem dan ook meteen documenten vindt waarin de betreffende woorden toevallig alleen in het meervoud voorkomen. De voorbeeld-zoekvragen in de vorige paragraaf zullen in het algemeen dus nog zeer onvolledige resultaten opleveren. Het is natuurlijk onhandig om voor vollediger zoekresultaten zelf alle verschillende woordvormen met OR te moeten combineren. Daarvoor bestaan dan ook verschillende oplossingen. Veel zoeksystemen bieden de mogelijkheid om aan te geven dat je wilt zoeken op alle woorden die met een bepaald woordgedeelte beginnen, zogenaamde truncatie of in computerjargon ook wel "zoeken met wildcards". Daarmee kun je niet alleen problemen met enkel- en meervoud voorkomen, maar zoek je ook op andere woorduitgangen van je zoekwoord, zoals eventueel daarvan afgeleide werkwoordsvormen, bijvoeglijke naamwoorden of bijwoorden en hun vervoegingen of verbuigingen, alsook op samenstellingen met andere woorden. Een veel gebruikt symbool voor truncatie (de wildcard) is de asterix *. Met 

krant*

zoek je dan dus ook op "kranten", "krantjes", "krantenknipsel", "krantenkop", "krantenpapier", "krantenwijk", enz.
In sommige zoeksystemen kunnen ook binnenin een woord één of meer letters "gemaskeerd" worden, om op spellingsvariaties te kunnen zoeken. Met bijvoorbeeld

publi?aties

vind je dan beide schrijfwijzen van het woord, met een "c" of met een "k" (en in principe natuurlijk ook met andere letters op de plaats van het vraagteken, maar die zullen in dit geval niet voorkomen). Helaas bieden de bekende webzoekmachines niet dit soort mogelijkheden tot truncatie. Daar zul je dus zelf alle woordvarianten, met OR gecombineerd, in je zoekvraag moeten meenemen Het nog wat onbekende Exalead vormt op dit moment de enige uitzondering daarop.

 

Met truncatie kun je als zoeker zelf bepalen wat de "woordstam" is waarop je wilt zoeken, dus welk deel van het woord je wilt afkappen en door een truncatie-teken vervangen. Er zijn ook systemen die dit automatisch proberen te doen. De eenvoudigste variant hiervan is, dat bij een in enkelvoud ingetikt zoekwoord ook automatisch op het meervoud wordt gezocht en omgekeerd. Een stapje verder gaan systemen die elk zoekwoord tot hun taalkundige woordstam reduceren, door standaard achtervoegsels van die woorden te verwijderen. Daardoor kan in één keer gezocht worden op de zelfstandig naamwoorden, de werkwoordsvormen, de bijvoeglijk naamwoorden en/of de bijwoorden die op dezelfde woordstam gebaseerd zijn. Voor allebei die methoden heeft het zoeksysteem dus enige kennis nodig van de taal waarin gezocht wordt; het moet weten wat in een bepaalde taal de regels zijn voor meervoudsvormen of welke standaard uitgangen in die taal achter een woordstam kunnen voorkomen. Systemen die automatisch op woordstammen zoeken passen in de praktijk vaak alleen Engelse taalregels toe. Bij de grote aanbieder LexisNexis (van Newsportal) wordt zo automatisch op Engels enkel- en meervoud gezocht en zelfs op verschil tussen Engelse en Amerikaanse spelling: bicycle vindt ook bicycles, behaviour vindt ook behavior en omgekeerd. Van de webzoekmachines zoekt Google vaak automatisch op woordstammen. Zo vind je met de zoekterm "vaccination" ook webpagina's waarin de woorden vaccinations, vaccine of vaccinated voorkomen. Voor steeds meer Nederlandse woorden gebeurt dat intussen ook.


3.2.4     Zoekingangen; zoeken in velden

Bij veel zoeksystemen zul je standaard in alle digitaal beschikbare tekst zoeken. Bij webzoekmachines is dat de volledige tekst van de webpagina's en de PDF's en ook van de Word-documenten en Powerpoints die daarmee eventueel doorzoekbaar zijn. In dit soort documenten valt ook weinig verder te specificeren omdat er geen standaard inhoudelijke structuur in zit. Hooguit zijn er de formele titel en het URL als apart te doorzoeken onderdelen.

 

Bij gegevens in bibliotheekcatalogi en andere databases ligt dat heel anders. Daarin zijn gegevens veel gestructureerder opgeslagen en van die structuur in zogenaamde velden kun je bij het zoeken gebruik maken. Gegevens in bibliotheekcatalogi en in bibliografische databases hebben een min of meer vergelijkbare structuur waarin de oorspronkelijke publicaties worden beschreven. Dat zijn de in paragraaf 1.2.2 genoemde metadata. Hoewel het om veel meer gegevens gaat dan alleen de titels van die publicaties, worden dit ook vaak "titelbeschrijvingen" genoemd. In die titelbeschrijvingen vind je in elk geval altijd velden voor (uiteraard) de titel, voor de namen van de auteurs en voor het jaar van publicatie. Afhankelijk of het om een boek, een tijdschriftartikel of nog een ander soort document gaat, kunnen er ook velden zijn voor de uitgever van het boek, voor het aantal pagina's daarvan, voor de naam van het tijdschrift waarin het artikel is verschenen en voor de datum waarop, het afleveringsnummer waarin en de paginanummers waar het artikel stond. Daarnaast is er vaak ook nog een veld voor trefwoorden die aangeven waarover de publicatie gaat, voor rubrieken of categorieën op basis waarvan de collectie systematisch is ingedeeld en voor een samenvatting van de inhoud van de publicatie. Veel van deze velden kunnen als "zoekingang" worden gebruikt. Dat betekent dat je bij het zoeken kunt aangeven dat je specifiek alleen in de inhoud van een bepaald veld wilt zoeken.

 

Zoeken in auteursveld

Bij auteursnamen is de achternaam de primaire zoekterm om op te zoeken. De voornaam of voorletter komt daar pas achter. Bij achternamen met voorvoegsels is niet altijd duidelijk wat daarmee gebeurt. In Nederland worden die meestal niet als onderdeel van de achternaam beschouwd (zoals Piet de Vries in het telefoonboek ook onder de V gezocht moet worden). In Engels- of Franstalige systemen en ook in België worden voorvoegsels meestal wel bij de achternaam gerekend en daar vaak ook aan vast geschreven. Het is in zulke gevallen dus altijd zaak verschillende mogelijkheden uit te proberen (Vries, P. de / De Vries, P. / Devries, P.).

Of je voor de voornaam alleen voorletters of hele voornamen moet gebruiken, kan per systeem heel verschillend zijn. Bij bibliotheekcatalogi wordt er vaak naar gestreefd om controle uit te oefenen op de namen van (bekende) auteurs, zodat verschillende naamvormen en pseudoniemen van een zelfde auteur als zodanig herkend worden (bijvoorbeeld G.K. van het Reve = Gerard Reve = Simon van het Reve) en het dus ook niet uitmaakt op welke vorm je zoekt. Anderzijds kan daar onderscheid gemaakt worden tussen verschillende auteurs die toevallig exact dezelfde naam hebben. Bij bibliografische databases vindt dat soort controle vrijwel nooit plaats, zodat je als zoeker zelf moet gokken hoe je alle publicaties van Eric Sieverts bij elkaar moet krijgen (E. / E.G. / Eric / Eric G. / …?).


Zoeken op titelwoorden

Bij bibliotheekcatalogi kun je meestal kiezen of je wilt zoeken op "de titel" of op "titelwoorden". In het eerste geval moet je de precieze titel van een publicatie weten, of op zijn minst het begin daarvan. Een eventueel lidwoord aan het begin van een titel moet hierbij worden weggelaten. Deze methode heeft uiteraard alleen zin voor een zogenaamde "known item search". Veel handiger is het vaak om te zoeken op "titelwoorden". Daarvoor hoef je alleen één of meer losse woorden in te tikken. Voor een "known item search" moeten dat natuurlijk een paar zeer karakteristieke woorden uit de (bekende) titel zijn. Voor een onderwerpsvraag gebruik je gewoon de zoekwoorden die je onderwerp omschrijven. Een reden om hierbij specifiek op titelwoorden te zoeken, is dat zo gevonden publicaties een veel grotere kans hebben werkelijk over het gezochte onderwerp te gaan.

Hoewel webdocumenten niet echt in velden gestructureerd zijn, is het met webzoekmachines toch mogelijk om - als enige specifieke zoekingang - op titelwoorden te zoeken. De zoeksyntax om bij Google naar het woord kranten in paginatitels te zoeken, luidt:

        intitle:krant

Bedenk daarbij wel dat het begrip "titel" voor webpagina's een veel minder formeel gegeven is als bij boeken of tijdschriftartikelen. Het is het stukje tekst dat toevallig een HTMLcode <title> heeft meegekregen.

 

Zoeken op trefwoorden

De meeste catalogi en databases hebben een speciaal veld voor trefwoorden. Voordeel van het gebruik van trefwoorden bij het zoeken, is dat je redelijk zeker weet dat daarmee gevonden documenten ook echt over het onderwerp gaan, waarnaar je op zoek bent. Een niet onbelangrijk nadeel is dat de manier waarop trefwoorden worden toegekend, en dus ook de manier waarmee je daarmee moet zoeken, per systeem nogal kan verschillen. In sommige systemen worden enkelvoudige woorden of begrippen gebruikt, die je zelf bij het zoeken met een AND-operator met elkaar zult moeten combineren

literatuur AND frankrijk AND twintigste eeuw

In andere systemen wordt gebruik gemaakt van zogenaamde gelede trefwoorden waarin begrippen tevoren al in één term gecombineerd zijn;

“literatuur; frankrijk; 20ste eeuw”

voor een publicatie die over 20ste eeuwse Franse literatuur gaat.
In sommige systemen zijn de trefwoorden ontleend aan een standaard lijst met toegestane trefwoorden, zodat je als zoeker moet weten op welke woorden je wel en niet moet zoeken. In andere systemen worden trefwoorden veel meer willekeurig toegekend. Wel wordt dan meestal besloten om daarbij alleen meervoudsvormen van woorden te gebruiken (of juist alleen enkelvoud).
Als je bij het zoeken gebruik wilt maken van trefwoorden, zul je dus moeten weten hoe daarmee in de door jou gebruikte catalogus of database precies wordt omgegaan. Gezien de vaak voorkomende verschillen, is het niet erg zinvol om daar in deze paragraaf nog gedetailleerder op in te gaan.


Zoeken op systematiek

Bij veel bibliotheekcatalogi en ook bij sommige databases wordt gebruik gemaakt van een zogenaamde systematische indeling van het materiaal. Dat wil zeggen dat er sprake is van een aantal hoofdrubrieken of categorieën, in de praktijk meestal niet meer dan maximaal tien tot vijftien, die weer zijn onderverdeeld in vergelijkbare aantallen subrubrieken, enzovoort. In eerste instantie zijn die vooral bedoeld om materiaal te ordenen en - zowel fysiek als virtueel - overzichtelijk neer te kunnen zetten, zodat je al browsend - langs boekenplanken of op het scherm - bij de juiste onderwerpen terecht komt. Maar ook in zoeksystemen kan daarvan vaak gebruik worden gemaakt om zoekacties – vooraf of achteraf – tot een bepaalde onderwerpsrubriek te beperken.
Ook hier geldt dat bij verschillende collecties verschillende soorten systematieken worden gebruikt. Zo maken openbare bibliotheken gebruik van SISO-codes (Schema voor Indeling van de Systematische catalogus in Openbare bibliotheken), gebruiken veel Nederlandse wetenschappelijke bibliotheken NBC-rubrieken (Nederlandse Basis Classificatie), zijn veel Amerikaanse collecties ingedeeld volgens de Library of Congress Classification (LCC) en wordt in veel andere landen gebruik gemaakt van de Dewey Decimale Classificatie (DDC). Daarnaast bestaan er echter nog honderden andere indelingsschema’s. Om hier bij het zoeken gebruik van te kunnen maken moet je dus op een of andere manier weten welk systeem bij de betreffende catalogus of database wordt gebruikt.

 

Zoeken op andere specifieke velden

Op welke velden je verder nog kunt zoeken is voor een deel afhankelijk van de specifieke catalogus of database. Ook zijn niet alle verdere velden altijd even nuttig voor een gemiddelde zoekactie. Het belangrijkst daarvoor zijn verder nog:

  • Zoeken op publicatiejaar. Zowel voor een “known-item search” als voor onderwerpsvragen biedt dit de mogelijkheid om je resultaat - in combinatie met onderwerpstermen - in te perken op de meest waarschijnlijke of meest gewenste tijdperiode. Bij veel zoeksystemen kunnen dit soort inperkingen in een apart zoekhokje aan de zoekvraag worden toegevoegd. Ook sommige webzoekmachines bieden zulke inperkingen in een advanced zoekscherm, of bieden achteraf de mogelijkheid je zoekresultaat zo in te perken (bij Google).
  • Zoeken op taal. Biedt de mogelijkheid om zoekresultaten in te perken op de gewenste taal of talen. Bij veel zoeksystemen kunnen dit soort inperkingen in een apart zoekhokje, via uitklapmenu’s of met aanvinkhokjes aan de zoekvraag worden toegevoegd. Veel webzoekmachines bieden zulke inperkingen in een advanced zoekscherm.
  • Zoeken op documentsoort. Biedt de mogelijkheid om zoekresultaten in te perken op alleen boeken, video’s, rapporten, scripties en dergelijke. Welke inperkingen mogelijk zijn hangt af van de aard van de betreffende collectie. Bij veel zoeksystemen kunnen dit soort inperkingen in een apart zoekhokje, via uitklapmenu’s of met aanvinkhokjes aan de zoekvraag worden toegevoegd. Met webzoekmachines kun je je zoekvraag hoogstens inperken op het file-format van het betreffende document (webpagina, PDF, Word, Powerpoint, Excel-sheet e.d.).
  • Zoeken op woorden uit de abstract. In veel databases kun je ook specifiek zoeken op woorden die in de samenvattingen van de oorspronkelijke publicaties voorkomen. Bij bibliografische databases is deze zoekmogelijkheid niet zo zinvol. Meer inhoudelijke tekst dan die samenvattingen zit daar namelijk nauwelijks in, zodat net zo goed (standaard) in alle velden gezocht kan worden. Bij een full-text bestand is het wel zinvol alleen in samenvattingen te zoeken, in plaats van in de volledige tekst. Je hebt dan namelijk een veel grotere kans dat de gevonden publicaties echt over het gewenste onderwerp gaan, omdat in de samenvatting alleen de kern wordt weergegeven van waar het document over gaat. Bij krantendatabases kun je vaak afzonderlijk zoeken in de zogenaamde "lead" van een artikel, de inleidende alinea. Ook die beperkt zich vaak tot de essentie van de inhoud van het verdere artikel.

 

 

Comments (0)

You don't have permission to comment on this page.