Una vez definido el concepto de relevancia y relacionando éste con si  un documento es recuperado o no, podemos establecer una serie de  medidas que nos servirán para evaluar los sistemas de recuperación. A  continuación expondremos las principales medidas comunes a todos lo  modelos de recuperación.
Los documentos pueden ser recuperados o rechazados al establecer la  comparación entre la pregunta y la base de datos. El conjunto de  documentos recuperados se divide, salvo en los sistemas perfectos, en  dos grupos: documentos relevantes recuperados, es decir aquellos que se  han recuperados correctamente y los no relevantes, recuperados  erróneamente que provocan ruido en la salida. Los documentos no  recuperados, que a su vez se dividen en los relevantes, rechazados por  el sistema de manera errónea y los no relevantes, rechazados de manera  correcta por el sistema. Esto mismo lo podemos ver en el siguiente  dibujo.
Ilustración 1 Esquema recuperación documentos. Fuente:[Baeza-Yates 1999]


No hay comentarios:
Publicar un comentario