Sistemas para la recuperación de información

Actualmente los buscadores de Internet están considerados el principal sistema utilizado para obtener información del tipo que sea y para cualquier uso (particular, académico, de negocios»¦).

Es difí­cil explicar las similitudes que existen entre los distintos hábitos de recuperación de información. Aunque generalmente lo hacemos en base a la extracción de las ideas principales del texto que queremos buscar, esta idea puede dar lugar a distintos métodos.

Debido a esto es muy importante saber cuales son los métodos de recuperación que utilizan los grandes buscadores. En los últimos años, debido a la gran importancia que puede suponer para las distintas páginas Web un buen posicionamiento en los distintos buscadores se ha producido un boom en todos los campos relacionados con este tema. Aunque existen múltiples variantes como las listas sobrepuestas o los basados en los nodos proximales, generalmente los modelos de recuperación de los distintos buscadores se estructuran siguiendo tres modelos básicos:

  • El modelo Booleano, que es el más simple ya que se basa en la teorí­a de conjuntos y el álgebra booleana. Su estrategia de recuperación se basa en un criterio de decisión binario sin nociones de escalas de medida o emparejamientos parciales en las condiciones de la pregunta .Es el modelo mas usado por los sistemas de búsqueda comerciales
  • El modelo de Recuperación Vectorial, que permite el emparejamiento parcial de los términos de búsqueda asignándoles un «œpeso» que permite computar el grado de similitud entre los documentos guardados en el ordenador y la pregunta del usuario.
  • El modelo de Recuperación Probabilí­stica, que se basa en la equiparación probabilí­stica para calcular la probabilidad de que este documento sea relevante para esa pregunta.

Por último es conveniente resaltar sea cual sea el sistema utilizado se plantea siempre el problema de la información falsa. Dicho problema ha llegado a tener dimensiones preocupantes ya que buena parte de la información disponible en Internet está duplicada o en inexacta, lo que genera una grave ausencia de credibilidad en los contenidos de las Webs. Esto es debido a que los sitios de Internet no son sometidos a ningún tipo de revisión antes de formar parte de la World Wide Web. Se han hecho múltiples intentos para asegurar que los usuarios tengan acceso a sitios adecuados y de calidad, pero ninguno de ellos puede lograr que la gente elimine o corrija la información que está en la red.

Es por esto que a la vez que tenemos en cuenta la rapidez y facilidad con que obtenemos información debemos también evaluarla crí­ticamente, ya que no toda es verí­dica.