Desde el punto de vista de la recuperación de información, Altavista y los motores de búsqueda anteriores adaptaron los principios que se habían desarrollado desde la década de 1960 para realizar búsquedas automáticas en grandes cuerpos de información. Se han desarrollado varias teorías de recuperación de información (principalmente booleana, vectorial y probabilística) comenzando especialmente con Gerard Salton en Cornell y Bill Maron en UC Berkeley sobre cómo hacer la indexación / recuperación automática.
Estas técnicas tenían que ver con manipular y procesar el texto en documentos, asignar probabilidades a las palabras y recuperar y clasificar resultados basados en estos algoritmos. Los resultados recuperados se generarán según el rango, en función de los puntajes recibidos en el procesamiento. Estas técnicas se volvieron mucho más refinadas a lo largo de las décadas.
Los primeros motores de búsqueda adaptaron las técnicas clásicas de recuperación de información a la búsqueda en Internet.
- ¿Qué es el software Cmms?
- ¿Qué haces cuando las especificaciones están incompletas durante las pruebas de software?
- ¿Qué software debo elegir para ingresar a Arquitectura / Diseño de interiores? ¿Qué pasa con la representación de software?
- ¿Cuáles son las mejores aplicaciones de supervivencia para móviles con Andriod?
- ¿EasyPos ofrece software de gestión de inventario?
Lo que los fundadores de Google reconocieron acerca de la búsqueda en la Web fue que se podía agregar información sobre los ENLACES a los algoritmos. (Obviamente, los enlaces no existían en las bases de datos tradicionales que contienen, por ejemplo, listas de publicaciones de ingeniería o biología). Los enlaces son, en efecto, otro tipo de indexación por completo. Los autores de las páginas web enlazan con material relacionado y, a menudo, con material relacionado cuidadosamente y conscientemente seleccionado. Esta información de enlace podría incluirse en los algoritmos de búsqueda para mejorar la precisión de la recuperación. Su enfoque permitió que los algoritmos IR clásicos se complementaran, enriquecieran y hicieran más precisos mediante el uso de las conexiones de red adicionales disponibles por los desarrolladores de páginas web.
Las técnicas de Google fueron un ENORME impulso para los métodos clásicos de IR. Independientemente de los otros problemas comerciales y de gestión de la empresa que enfrentaba Altavista, era el último de los motores de recuperación de información de estilo antiguo.