| 
  • If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.

  • You already know Dokkio is an AI-powered assistant to organize & manage your digital files & messages. Very soon, Dokkio will support Outlook as well as One Drive. Check it out today!

View
 

kwaliteit

Page history last edited by Eric Sieverts 10 years, 9 months ago

open SideBar voor TOC >>

 

4.1     Kwaliteit van het zoekresultaat

 

Van oudsher berust een beoordeling van het resultaat van zoekacties - of meer algemeen van een literatuuronderzoek - op twee parameters: vangst (in het Engels "recall") en precisie. OfficiĆ«le definities van vangst en precisie luiden: 

  • Vangst is dat deel van de aanwezige relevante documenten dat daadwerkelijk is gevonden. 
  • Precisie is dat deel van de gevonden documenten dat ook daadwerkelijk relevant is. 

Zowel vangst als precisie worden veelal in percentages uitgedrukt. Hoewel dit suggereert dat het oordeel over zoekresultaten kwantificeerbaar is, zitten daar in de praktijk allerlei haken en ogen aan. 

 

Vooral vangst is zeer slecht te kwantificeren, omdat die wordt bepaald door datgene wat relevant is, maar niet is gevonden. In de praktijk is echter vrijwel nooit bekend hoeveel relevante informatie bij een zoekactie is gemist of hoeveel relevante informatie er bestaat over het gezochte onderwerp. Bovendien is het in de huidige tijd van informatieovervloed in veel situaties helemaal niet zo belangrijk of werkelijk alles wordt gevonden. Wat voor een zoeker echter wel nuttig is om te weten, zijn de oorzaken waarom relevante informatie gemist wordt en welke technieken er zijn om daar (bij voorbaat of achteraf) iets aan te doen. Dat maakt het 

mogelijk een zoekactie aan te passen als het resultaat niet bevredigend lijkt te zijn. Daarnaast kan het nuttig zijn om de vangst van twee verschillende zoekacties of zoekmethoden te vergelijken, zonder die in absolute zin vast te stellen. Er is dan dus sprake van de relatieve vangst van die twee zoekacties, op basis waarvan kan worden vastgesteld wat een betere aanpak voor de betreffende zoekvraag is geweest. 

 

De precisie van een zoekactie is in theorie beter vast te stellen. Daarvoor hoef je namelijk alleen te kijken naar het materiaal dat daadwerkelijk is gevonden. Toch biedt ook dat begrip vooral schijnzekerheid: 

  • de situatie is niet altijd zo zwart-wit dat een gevonden document alleen maar OF relevant OF niet-relevant kan zijn, 
  • bij relevantie (en dus precisie) wordt geen rekening gehouden met de kwaliteit en/of de betrouwbaarheid van de gevonden informatie, 
  • in de definitie van precisie wordt geen rekening gehouden met de uniciteit van de gevonden informatie: een zoekresultaat van tien relevante documenten die vrijwel identieke informatie bevatten, is in de praktijk niet waardevoller dan een resultaat met drie unieke, heel verschillende, elkaar aanvullende - of misschien zelfs tegensprekende - documenten
  • in de definitie van precisie wordt geen rekening gehouden met de kennis of de documenten die de aanvrager van de informatie al bezit; dus met de vraag hoeveel  gevonden informatie voor die aanvrager werkelijk nieuw en/of nuttig is, 
  • huidige methoden van relevantieordening maken het moeilijker eenduidig te bepalen wat je eigenlijk met precisie bedoelt: gaat het erom hoeveel van "de eerste 10" relevant zijn, of hoeveel van het totale zoekresultaat? 
  • in deze tijd van informatieovervloed is het in de praktijk vaak onmogelijk om alle - of zelfs maar een representatief deel van - gevonden documenten op hun relevantie te beoordelen (zoals de 100.000'en die Google beweert op een zoekactie te hebben gevonden). 

Ook hier geldt echter dat het voor een zoeker heel nuttig kan zijn inzicht te hebben in de oorzaken waarom een zoekresultaat ook niet-relevante informatie bevat, en in de technieken die je kunt toepassen om dat (bij voorbaat of achteraf) zo veel mogelijk te voorkomen. 

 

 

Comments (0)

You don't have permission to comment on this page.