Laburo España: 250.000 ofertas de empleo
Logotipo del weblog

 


Reflexiones desde el sillón

Relevancia, Exhaustividad y Precisión

12, 07 de 2005-12-07 de 2005
Al hilo de un comentario que he hecho al post http://irsweb.blogspot.com/2005/11/utilidad-lineal.html
en el blog Recuperación de Información en la Web, me parece bueno seguir explicándome.

Las medidas clásicas de evaluación de la recuperación de información de un SRI son:

Exhaustividad = r/R
Precisión = r/T,

donde

r son los documentos relevantes recuperados,
R son los documentos relevantes que existen en el sistema y
T el total de documentos recuperados.

La base del cálculo de ambas medidas es el total de documentos relevantes. Un documento relevante es aquel que satisface la necesidad de información planteada en la búsqueda. De cara la evaluación de la recuperación la relevancia se trata de forma binaria, es decir, un documento es relevante o no relevante. Es obvio que en la vida real esto no es así, y los documentos pueden tener distintos grados de relevancia. De hecho, los modelos de recuperación de información vectoriales, ampliamente utilizados en la actualidad, superaron hace ya bastante tiempo este concepto de relevancia.

De todo esto me surge la duda de si estas medidas tal y como se utilizan en la actualidad son suficientemente buenas para evaluar la recuperación en sistemas no binarios.

Vamos a ver un ejemplo de dos evaluaciones que, a pesar de que no son iguales, nos proporcionan el mismo resultado:

Nº Doc(1)Orden relev.ExhaustividadPrecisión
1000
2320%50%
3030%33%
4140%50%
5260%60%
6580%66%
74100%71%
80100%62,5%
90100%55,5%
100100%50%


Nº Doc(1)Orden relev.ExhaustividadPrecisión
1120%100%
2240%100%
3040%66%
4360%75%
5480%80%
6080%66%
75100%71%
80100%62,5%
90100%55,5%
100100%50%


En el segundo caso los documentos más relevantes nos aparecen en los primeros lugares, pero los resultados de la evaluación con Exhaustividad y Precisión son iguales.

Comentarios

Agregar un comentario


Recordar datos
¡Un solo click vale!
LaInformacion.com lainformacion.com - Medio Oficial de los Premios Bitacoras 2009