¿Por qué el motor de búsqueda de Altavista perdió terreno tan rápido ante Google?

Desde el punto de vista de la recuperación de información, Altavista y los motores de búsqueda anteriores adaptaron los principios que se habían desarrollado desde la década de 1960 para realizar búsquedas automáticas en grandes cuerpos de información. Se han desarrollado varias teorías de recuperación de información (principalmente booleana, vectorial y probabilística) comenzando especialmente con Gerard Salton en Cornell y Bill Maron en UC Berkeley sobre cómo hacer la indexación / recuperación automática.

Estas técnicas tenían que ver con manipular y procesar el texto en documentos, asignar probabilidades a las palabras y recuperar y clasificar resultados basados ​​en estos algoritmos. Los resultados recuperados se generarán según el rango, en función de los puntajes recibidos en el procesamiento. Estas técnicas se volvieron mucho más refinadas a lo largo de las décadas.

Los primeros motores de búsqueda adaptaron las técnicas clásicas de recuperación de información a la búsqueda en Internet.

Lo que los fundadores de Google reconocieron acerca de la búsqueda en la Web fue que se podía agregar información sobre los ENLACES a los algoritmos. (Obviamente, los enlaces no existían en las bases de datos tradicionales que contienen, por ejemplo, listas de publicaciones de ingeniería o biología). Los enlaces son, en efecto, otro tipo de indexación por completo. Los autores de las páginas web enlazan con material relacionado y, a menudo, con material relacionado cuidadosamente y conscientemente seleccionado. Esta información de enlace podría incluirse en los algoritmos de búsqueda para mejorar la precisión de la recuperación. Su enfoque permitió que los algoritmos IR clásicos se complementaran, enriquecieran y hicieran más precisos mediante el uso de las conexiones de red adicionales disponibles por los desarrolladores de páginas web.

Las técnicas de Google fueron un ENORME impulso para los métodos clásicos de IR. Independientemente de los otros problemas comerciales y de gestión de la empresa que enfrentaba Altavista, era el último de los motores de recuperación de información de estilo antiguo.

Estaba teñido en el usuario de lana AltaVista. Aprendí la sintaxis de las consultas avanzadas y me sorprendió totalmente el poder del motor de búsqueda. Definitivamente fue mi favorito. Debía pensar y elaborar cuidadosamente sus consultas, porque cada consulta llevaría unos segundos, a veces más.

Entonces alguien me habló de este advenedizo, Google, y se entusiasmó con eso. Escéptico, me acerqué al sitio coloreado de dibujos animados para intentar algunas consultas.

Cuando hice mi primera consulta, los resultados se ajustaron instantáneamente. Resoplé. “Ni siquiera hicieron una búsqueda real, simplemente arrojaron algunos resultados para hacerme pensar que fue rápido”.

Pero luego miré los resultados, y fueron sorprendentemente relevantes.

Hice otra consulta, y otra. La misma respuesta instantánea, los mismos resultados sorprendentemente relevantes. No se necesita una sintaxis loca, era como si el motor de búsqueda estuviera leyendo mi mente. No hay anuncios gráficos de banner que ralenticen el tiempo de carga de la página, sin cruft extra. La presentación espartana y los resultados precisos me engancharon de inmediato.

Puede notar esto en sus búsquedas de Google:

“Aproximadamente 387,000 resultados (0,38 segundos)”

Esa información ha estado allí desde el primer día, para que los usuarios puedan diferenciar los retrasos debido a su conexión frente a los retrasos debidos al motor de búsqueda. La marca de tiempo es irrelevante en esta era moderna, ya que la búsqueda subsecuente es la norma. Pero cuando apareció Google por primera vez, la búsqueda del segundo segundo era simplemente inaudita.

Google produjo resultados relevantes rápidamente en una interfaz agradable y libre de desorden. ¡No se necesita una sintaxis loca! Dado que los resultados fueron tan rápidos, pude disparar rápidamente las variaciones de consultas en Google para refinar mis resultados, no se requiere ninguna reflexión especial de antemano.

En aquellos días, Google también tenía arrogancia. Tenían tanta confianza en sus resultados, pusieron enlaces en la parte inferior de cada página de resultados de búsqueda para lanzar exactamente la misma consulta en el motor de búsqueda de cualquier competidor, ya sea Lycos, Yahoo o Altavista. Como sabía que podía hacer un solo clic a otro motor si mi resultado no era satisfactorio, Google se convirtió en mi primera parada para todas las búsquedas.

En unos pocos meses, fue el único motor de búsqueda que utilicé. Y todavía lo es.

Lo siguiente está tomado de extractos de un artículo que encontré en google, Cómo AltaVista perdió su mojo y Google encontró su ritmo

“Pero con la búsqueda aún no vista como un generador de ingresos y el hecho de que salió de los laboratorios de Digital Equipment Corp. , significaba que AltaVista se entristeció temprano. De hecho, no fue sino hasta 1998 que obtuvo su propia URL”. Hasta entonces tuvo que ser accedido a través de http://www.altavista.digital.com , debido a la lealtad a la compañía que lo había desarrollado pero no sabía qué hacer con él. En 1998, Digital se vendió a Compaq y en 1999, Compaq rediseñó AltaVista como un portal web, con la esperanza de competir con Yahoo y con eso AltaVista perdió su ánimo “.

“Tenías que aprender su sintaxis avanzada para buscar en títulos de páginas, URL y textos de enlaces”

“Aun así, AltaVista podría haber competido con Google si hubiera sido una empresa más pequeña. Digital era este vasto gigante de mini-computación, totalmente inadecuado para detectar las posibilidades que presentaba la búsqueda”.

“Y después de la adquisición, las demandas en Compaq pensaron que un motor de búsqueda era una característica poco y que un portal era lo que debía ser. Quizás porque el cuadro de búsqueda ocupaba solo un pequeño espacio en la página, pensaron que no podía ser un todo el negocio por sí solo y necesitaba el resto de las campanas y silbatos a su alrededor “.

En resumen, tuvieron una gran idea y la pusieron a disposición del mundo. En ese momento no había ganancias en la búsqueda y los hombres corporativos no podían entender por qué a nadie le importaba. AOL gobernaba el mundo y Yahoo estaba creciendo en popularidad gracias a su página de inicio que tenía correo, noticias, deportes, etc. con una pequeña ventana de búsqueda. Fueron controlados por grandes corporaciones que vieron la búsqueda como algo tonto que un ingeniero agregará más tarde sin pensar mucho en lo poderoso que realmente podría ser.

En ese momento, las personas se conectaban a las personas de AIM, enviaban correos electrónicos estúpidos a sus amigos y prácticamente al lado del contenido para adultos. Nadie sabía que había tanto conocimiento porque el motor de búsqueda era muy crudo. Piénselo, ¿cuántas veces incluso HOY ha visto a personas no expertas en tecnología buscar en Google escribiendo “dónde puedo encontrar el horario de cine local?” cuando podían simplemente escribir su código postal y el cine.

En los días anteriores a que Google obtuviera una versión beta extendida, así es como fue una búsqueda académica típica:

  • Cree un término de búsqueda booleano y varios términos de búsqueda alternativos con palabras clave relacionadas.
  • Ingrese todo lo mencionado en Alta Vista y tome nota de los resultados de la URL.
  • Ingrese todo lo mencionado anteriormente en Yahoo Search y tome nota de los resultados de la URL.
  • Vuelva a ingresar todo lo mencionado anteriormente en Dogpile y tome nota de los resultados de búsqueda.
  • Vuelva a ingresar todo lo mencionado anteriormente en Lycose y tome nota de los resultados de búsqueda.
  • Vuelva a ingresar todo lo mencionado anteriormente en HotBot y tome nota de los resultados de búsqueda.
  • Vuelva a ingresar todo lo mencionado anteriormente en Excite y tome nota de los resultados de búsqueda.
  • Busque temas relacionados en los directorios Yahoo Directory, Geocities y Tripod.

Eso sí, todo esto ocurrió en los días previos a la existencia de navegadores con pestañas, por lo que después de recopilar todos los resultados de búsqueda, querrá copiarlos y pegarlos en un archivo de texto para que no pierda todas tus búsquedas recopiladas En el pasado, parecía que había una superposición de 20-30 por ciento en varios motores de búsqueda y un nivel de relevancia muy bajo en cuanto al contenido de la página para los términos de búsqueda. Por lo tanto, de todas esas búsquedas y clics en el directorio que hizo, puede encontrar 2-3 resultados que fueron realmente relevantes y deseables. Tomó aproximadamente 1/2 hora, de principio a fin, y tenía que hacer esto cada vez que quería buscar algo.

Recuerdo que los profesores revisaron una lista de verificación para asegurarse de que había examinado al menos 10 motores de búsqueda mientras preparaba recursos para los trabajos que estaba escribiendo.

Luego Google llegó con resultados de búsqueda instantáneos y altamente relevantes que perdonaban mucho más el lenguaje natural. ¿Qué método preferirías?

Diría que el único factor por el que otros motores de búsqueda como Altavista perdieron terreno ante Google es la experiencia del usuario tanto en el front-end como en el back-end.

Era un usuario muy entusiasmado de Altavista en 1999 más o menos. En el pasado, era una forma tan poderosa de buscar en la web. En comparación con otros motores de búsqueda en ese momento, Altavista proporcionó formas poderosas de escribir sus consultas de búsqueda y la que más me gustó fue usar patrones en sus palabras clave de búsqueda.

Esta es una página antigua escrita en 1996 que dice cómo puedes escribir consultas poderosas en Altavista

Cómo usar AltaVista

Ahora, llega un nuevo motor de búsqueda Google que hizo la búsqueda relativamente simple. Cambió la forma en que las personas buscaban en la web. Antes de que la búsqueda de Google fuera un arte creado, Google lo hizo tan simple como buscarlo en Google. Sus algoritmos de clasificación colocaron los sitios web más contextuales y buscados en la parte superior. Recuerdo haber buscado en los viejos tiempos con Alta-vista, puede encontrar una página muy importante en la página 3 o 4 de sus resultados de búsqueda. Google cambió esta tendencia hasta el punto de que este meme lo expresa más acertadamente.

No recuerdo la última vez que busqué algo y no terminó en la página 1 de mis resultados de búsqueda. Podría haber ido a la página 2 o la página 3 solo por curiosidad, pero nunca más allá de eso en mis resultados de búsqueda. Han puesto tanta confianza en las personas que las personas están seguras de que encontrarán la información más relevante en la página 1. Esta es una de las principales razones por las cuales las personas se mudaron rápidamente de otros motores de búsqueda a Google.

En segundo lugar, en aquellos días, casi todos los motores de búsqueda solían colocar anuncios feos en la página de búsqueda. Su página de búsqueda solía estar llena de información sin sentido. Esta es una captura de pantalla de cómo se veía la página de Altavista en aquel entonces.


Esta fue una gran molestia en comparación con Google, que tenía una política estricta de que nunca mostrarán anuncios en su página de inicio. En su lugar, adoptaron otras formas inteligentes de usar anuncios para aumentar los resultados de búsqueda. Esta estrategia ayudó a Google a obtener muchos clientes y generar ingresos al mismo tiempo.

Muy discutible si Alta Vista fue la primera. Dependiendo de lo que defina como motor de búsqueda, Lycos, Infoseek, webcrawler e incluso Yahoo existían antes de Alta Vista.

Pero esa no es la pregunta, sin duda, Alta Vista fue el mejor de los nuevos motores de búsqueda a principios de 1996. Pronto, Yahoo contrató con ellos para proporcionar la función de búsqueda de su sitio web. Pero Digital se vendió a Compaq, que sabía que tenían un buen producto, pero en lugar de centrarse en la búsqueda, hicieron que Alta Vista comenzara a competir con Yahoo al tratar de convertirse en un portal. Yahoo, por supuesto, no quería realmente la competencia y firmó con Google para hacer las búsquedas.

Compaq vendió esta unidad a CMGI, un grupo de inversión, que planeaba hacer pública la compañía, pero una vez que todas las compañías de Internet comenzaron a perder valor, tuvieron que cancelar la salida a bolsa. Esto condujo a un reenfoque en Alta Vista, volviendo a lo básico, eliminando las funciones del portal y adelgazando. Tanto en términos de software como de personal. Las pérdidas habían reducido el valor de la unidad en su conjunto, pero el nuevo aspecto y la velocidad hicieron que pareciera que había potencial. Fueron vendidos a Overture, que era la empresa responsable de monetizar el tráfico de Yahoo. Yahoo sintió una amenaza y casi de inmediato compró Overture.

Yahoo mezcló la marca con la suya y finalmente dejó que Alta Vista se extinguiera sin comprometer muchos recursos en su software. Para cuando estuvo en manos de Yahoo, la batalla por la búsqueda había terminado y Google había ganado.

Alta Vista experimentó un momento realmente horrible con respecto a su salida a bolsa. ¿La entrada de efectivo de una IPO les ayudó a competir mejor con Google? No lo sé, pero seguro que habría sido interesante verlo. Compaq tomó algunas malas decisiones en la dirección de Alta Vista, nunca deberían haber intentado emparejarse con Yahoo, hicieron cosas diferentes de todos modos y no había razón para intentar ser el mismo.

A veces, con un nuevo mercado, el primero en salir al mercado no siempre es el mejor lugar para estar. Mira el Palm Pilot, cómo fue destruido por el teléfono inteligente, o BetaMax, Atari, Netscape … pero Alta Vista tuvo una buena carrera y nos dieron a Babel Fish. Ojalá hubiera sobrevivido al menos. 🙂

La verdadera razón era la escalabilidad .

Hay dos conceptos; la ampliación o la ampliación vertical aumentan la potencia del hardware y la ampliación horizontal que distribuye su potencia de procesamiento en múltiples componentes de hardware separados.

AltaVista dependía de un hardware más rápido, que aumenta o aumenta verticalmente. Pero alrededor de 2007, la ampliación del hardware se desaceleró significativamente y, a fines de 1999, Internet está en auge exponencial.

En Google, todo está diseñado para escalar horizontalmente. Han desarrollado uno de los primeros algoritmos de reducción de mapas listos para producción. Google pudo usar computadoras baratas disponibles para alimentar su motor de búsqueda. Y Google pudo escalar su motor de búsqueda, básicamente, agregando más computadoras. Llamamos a esto “escalar simplemente arrojándole dinero”.

tl; dr: porque, como los otros 2.000 motores de búsqueda, no era adecuado para su propósito. La búsqueda fue un ejercicio académico que confiaba en el editor. Eso está bien en una biblioteca con 10,000 libros ordenados por tema. En un mundo comercial con productos, servicios y múltiples editoriales no verificadas, las personas no buscan investigación. El número real de sitios de investigación que son de interés para los usuarios promedio de Internet es mínimo.

Tomemos, por ejemplo, el intento de solucionar un problema de controlador de dispositivo en una PC con Windows en 1995. Todos los motores de búsqueda devolverían cientos de páginas de resultados de Microsoft o quizás del OEM (por ejemplo, Dell). Eso está bien si tienen la solución. Pero los OEM tienden a ser cortos en detalles y lentos para reconocer errores (versus error del usuario).

Lo que el usuario necesitaba eran respuestas de preguntas y respuestas en foros (foros). En un punto de vista académico, Microsoft es autoritario en sus productos, pero también lo son las personas con información real en vivo. Eso también fue lo que hizo que Internet ganara y cambió enormemente la forma en que corporaciones como Microsoft o Ford o Apple tratan con los clientes: información útil y transparente diseñada para ser fácilmente encontrada. Google descubrió esto muy por delante de Alexa, Yahoo, MSN / Bing, Dogpile, Alta Vista, Excite, Ask Jeeves, Lycos, etc.

Dos palabras, experiencia de usuario. En mi introducción a la experiencia del usuario, uso AltaVista y Google como ejemplo de cómo la experiencia del usuario puede significar la diferencia entre un producto aceptado y rechazado.

Google puede ser visto como una empresa de tecnología, pero tiene la experiencia del usuario en su corazón. Lo que Google hizo y sigue haciendo es mantener las cosas simples. Altavista era una herramienta compleja con opciones de búsqueda avanzadas y eventualmente se convirtió en un ‘portal’ de todo lo que puedas comer. Los portales parecían tener un gran sentido comercial, pero los usuarios realmente no querían ser “propiedad” de ningún sitio.

En resumen, fue la aparente simplicidad de su experiencia combinada con buenos resultados (que es donde entra en juego la buena ingeniería) lo que hizo que Google triunfara sobre Altavista. Y Yahoo. Y Lycos. Y Webcrawler.

O, en otras palabras, agregar características al producto no significa que vaya a ser un mejor producto. El software y el hardware a menudo pueden pasar de ser útiles y utilizables a complicados y complicados sin una línea dura entre esos dos estados si se manejan por características y no por experiencia.

Google pudo correr círculos alrededor de Altavista y otros motores de búsqueda de la época porque era muy rápido, fácil de usar, indexaba grandes cantidades de contenido y producía resultados de búsqueda sorprendentes.

La calidad de búsqueda es un gran problema, y ​​el algoritmo de PageRank de Google fue un cambio de juego. Condujo a resultados de mayor calidad y dificultó a las personas enviar spam a las SERP (páginas de resultados del motor de búsqueda).

El simple hecho del asunto es que Google fue, había sido y probablemente continuará siendo el mejor motor de búsqueda que la humanidad ha creado. El algoritmo que usan es más rápido, más preciso y más conveniente para preguntas no tan específicas. Además, el hecho de que Google esté aprendiendo cómo y qué busca significa que simplemente continuará mejorando.

Altavista nunca tuvo una oportunidad cuando se trataba de las guerras de los motores de búsqueda. Se requiere demasiados detalles y la interfaz de usuario era más fea y más gruesa que la de Google. Además, si observa cuán exitoso es actualmente Google, es fácil imaginar que incluso si estos otros motores de búsqueda lograron sobrevivir al ataque inicial, probablemente todavía no existirían hoy.

Seamos realistas, no puede confiar en cada sitio web para darle la mejor información sobre lo que se trata de la mejor manera posible. Algunos sitios web le darán información falsa porque no tienen idea de lo que están haciendo (en el aspecto técnico) y algunos lo harán a propósito: manipular el algoritmo. Sí, el SEO es más antiguo que el propio Google.

Google se basa en la estructura web para los datos principales (algoritmo PageRank). Este fue un gran avance.

En realidad, esto es mucho más simple de lo que cualquiera piensa que es. Todos dicen que los innovadores algoritmos de búsqueda de Google fueron la razón, no lo fueron. Utilicé Altavista y me gustó, pero soy ingeniero electrónico y sabía cómo especificar exactamente lo que quería que buscara utilizando operadores AND y OR, etc.

El verdadero problema con Altavista y todos los demás motores de búsqueda en ese momento era que si escribía PINK LADY en la barra de búsqueda, obtenía cada página que tenía PINK y cada página que tenía LADY, en orden de popularidad.

Google, por otro lado , solo me dio páginas que tenían PINK y LADY y las priorizó si las palabras PINK LADY aparecían juntas.

World Wide Web Worm fue probablemente el primer motor de búsqueda. Creo que se lanzó en 1992 o 1993, muy por delante de Altavista o Lycos.

Todos los motores de búsqueda anteriores a Google tenían una calidad de búsqueda inferior. Dado que millones de páginas web pueden coincidir con cualquier conjunto de palabras clave, la salsa secreta se reduce a tener un buen algoritmo de calidad de búsqueda que encuentra la aguja en un pajar, que en realidad son los sitios web más relevantes.

Lo mismo sigue siendo cierto. Si Bing o algún otro motor descubren un algoritmo de mejor calidad de búsqueda, podrían competir con Google.

Altavista fue un cambio emocionante cuando llegó. La búsqueda en la web tenía mucho margen de mejora. Los dos atributos sobresalientes de Altavista que aplastaron a la competencia (por ejemplo, WebCrawler) fueron su tamaño y su velocidad.

Recuerdo que Digital dijo que en parte estaba destinado a ser una demostración del poderoso hardware que le habían dedicado. Pero, en cualquier caso, fue un gran salto en la usabilidad.

Luego apareció Google y agregó una mayor relevancia, a la vez que era enorme y rápido. Al principio no encontré que Google fuera un asesino obvio de Altavista, pero con el tiempo siguió mejorando, mientras que Altavista no lo hizo.

El algoritmo de Google fue mucho más avanzado, introdujo el concepto de clasificación a través de la relevancia de enlaces, que resultó ser mucho más efectivo para producir resultados relevantes. Y fue patentado.

Patente US6285999 – Método para la clasificación de nodos en una base de datos vinculada

Recuerde que en ese entonces la búsqueda no era un negocio, no había publicidad en SERP. Tanto Altavista como Google estaban perdiendo dinero. Y la búsqueda no fue vista como un negocio interesante.

Así que la competencia con google no fue feroz.

Pocos pensaron que había una oportunidad de negocio.

Y aunque Altavista era solo una pieza de una gran corporación, Google todavía era una startup joven y hambrienta.

En el rápido espacio de internet, pudieron almorzar Altavista de manera rápida y fácil.

Debido a que Google era mejor en todos los sentidos: era mucho, mucho más rápido, se sentía mucho más “simple” de usar, y los resultados fueron mucho mejores, mucho más claros y mucho más relevantes.

Un gran problema con Altavista fue la relevancia de los resultados de búsqueda. Varios sitios web basura, incluidos los sitios pornográficos, colocaron la mayoría de las consultas de búsqueda de Altavista más comunes en la parte superior de sus páginas y, por lo tanto, cuando buscaba algo con Altavista, a menudo encontraba algo totalmente diferente de lo que estaba buscando. Google no tuvo este problema, sus resultados fueron increíblemente relevantes para la época. Creo que esto, junto con la velocidad, fue uno de los factores más importantes que llevaron a la caída de Altavista. Debido a que Altavista falló tan tremendamente, nadie lo usó y luego se cerró y no ha existido en años.

Es el logotipo, el nombre y la apariencia fresca + publicidad que hizo que eso sucediera. Solía ​​usar Altavista todo el tiempo, a pesar de que Google existió por un tiempo, me resistí un poco a la exageración. Pero fue tan ampliamente utilizado porque tenía ese factor “genial”, que no podía ignorarlo después de un tiempo. Me gusta Facebook. Todos estaban hablando de eso. Al principio, el algoritmo de búsqueda de Google empeoró, pero mejoró y me acostumbré.

¿No se incluyó también como motor de búsqueda predeterminado en Safari Mac OS X?

Dios, eso fue hace mucho tiempo. Según recuerdo, estaba usando un motor de búsqueda para obtener resultados rápidos (perro algo o algo perro o tal vez algo que no puedo recordar en absoluto) y luego usaría Altavista si necesitaba mejores resultados.

Y luego alguien me habló de Google. Resultados más rápidos que los motores de búsqueda rápidos, mejores resultados que Altavista. Fue bastante sorprendente, en realidad nos llamábamos y decíamos cosas como “¡Mira eso, 500,000 resultados en 0.6 segundos!”.

Altavista perdió terreno tan rápido porque Google era un motor de búsqueda superior. Todos los que conocí se cambiaron a Google exclusivamente casi tan pronto como lo intentaron.

Otros lo han dicho con más detalle en esta página, pero en pocas palabras:

Otros motores buscaron calidad en el interior de la página. Escanearían el texto cada vez más, buscando múltiples ocurrencias de la cadena de búsqueda, imágenes y múltiples párrafos y otras medidas de calidad.

Los estafadores aprendieron a jugar eso rápidamente y convirtieron la búsqueda en basura. Para interceptar búsquedas en la web con el fin de ganar dinero rápido, todo lo que tenía que hacer era poner palabras en su página que coincidieran con las búsquedas populares. Estaría vendiendo alargadores de pene suecos, pero ponga “presidente doofus naranja” en la parte superior de su página para captar todo el tráfico de Trump.

Los estafadores se volvieron buenos, rápidos y los motores de búsqueda quedaron básicamente inutilizables. Fue un evento de extinción masiva para motores de búsqueda, excepto uno:

Google miró fuera de la página, a la web. Una buena página tenía muchas otras páginas vinculadas a ella. Mientras la página mencionara a Trump, figuraba en la lista corta. Pero solo hizo el corte con muchos enlaces de regreso.

Los vínculos de retroceso son realmente difíciles de falsificar (tienes que hacer un montón de sitios). Los estafadores no pudieron manejarlo.

Entonces estaba Google, completamente solo. Esa página blanca vacía. (¿Mencioné que el método de Google también fue mucho más rápido?) Resultados relevantes. No hay alargadores de pene suecos.

Porque ese no es mi tipo de cosas, bebé.