Este artículo se publicó hace 15 años.

En busca de la respuesta perfecta

Microsoft, Yahoo y un nuevo buscador llamado Wolfram Alpha trabajan en el desarrollo de nuevos algoritmos que les permitan destronar a Google, rey absoluto del mercado, con el 80%

Blanca Salvatierra

23/03/2009 08:00

Las compañías de Internet sueñan con desarrollar un algoritmo inteligente que sea capaz de interpretar las preguntas que los usuarios realizan en su buscador y ofrecerles, así, la respuesta más precisa posible. El internauta ha tenido que acostumbrase a plantear sus cuestiones de una determinada manera, y aprender los símbolos que el algoritmo de búsqueda es capaz de procesar. La idea de que todo el contenido está en Internet y que encontrarlo sólo depende de saber plantear la pregunta de forma adecuada deja en manos del usuario un papel que debería jugar el servicio que ofrece las respuestas. Google, Yahoo, Microsoft y decenas de proyectos más pequeños pero no menos ambiciosos trabajan en nuevos algoritmos y tecnologías para que, sea cual sea la forma de preguntar del usuario, ofrezcan la respuesta perfecta.

Google es el rey indiscutible de las búsquedas mundiales, con más de un 80% de cuota de mercado según el informe de febrero de la consultora Net Applications. Le siguen Yahoo con un 10% y Microsoft con un 4,71%. Se calcula que el negocio publicitario de Google, basado en gran medida en los enlaces patrocinados de sus búsquedas, le reportan casi 17.000 millones de euros al año, una cifra demasiado jugosa como para no intentar hacerse con una parte de ella.

Las búsquedas semánticas establecen relaciones entre conceptos, más allá de la forma

Click to enlarge

A fallback.

Kumo, el cambio semántico

Microsoft está realizando una campaña de servicios combinados bajo la denominación de Windows Live que, con herramientas estrella como Sky Drive, que ofrece 25 GB de espacio on-line gratis, trata de conseguir que los usuarios se queden en su círculo de servicios (Search, Messenger, Hotmail o Maps). Pero perfeccionar las búsquedas para ganar usuarios es una guerra de largo recorrido que sólo acaba de empezar. Microsoft ya está realizando pruebas de forma interna con Kumo, un nuevo servicio de búsqueda que parece llamado a sustituir al actual Live Search. Kumo, cuya existencia se conoció tras una filtración, supone un cambio en la tecnología que se emplea actualmente en la búsqueda de Microsoft, añadiéndole un componente semántico. Las búsquedas semánticas establecen relaciones entre conceptos, más allá de la forma sintáctica de las palabras. Es la única manera de que si el internauta escribe, por ejemplo, la frase "amigos de Picasso en París", el buscador interprete exactamente eso y no muestre un batiburrillo de páginas que incluyen los tres conceptos.

"La mayoría de las funciones que se están probando no llegarán al mercado español hasta 2010", matiza el jefe de producto de la División de consumo de Microsoft Ibérica, Juan Antonio Roncero. Pero Microsoft no es la única que está investigando las búsquedas más allá de la sintáctica. El físico Stephen Wolfram, creador del sistema de computación simbólica Mathematica, considera que los actuales sistemas tienen mucho que mejorar. Wolfram ha anunciado que en mayo lanzará Wolfram Alpha, un buscador inteligente que por el momento sólo han visto unos pocos y que promete respuestas exactas a partir de preguntas planteadas en lenguaje natural, algo en lo que todos trabajan pero que, de momento, nadie ha conseguido de forma completa.

El físico Stephen Wolfram promete respuestas a partir de lenguaje natural

La compañía española Isoco trabaja con un buscador semántico llamado Naveganza que ya se aplica en entornos cerrados. Su director de innovación, Jesús Contreras, sostiene que, aunque existe la visión de que en Internet se pueden crear pequeñas islas interconectadas que se entiendan entre sí, a día de hoy esta visión sólo puede aplicarse plenamente en un ambiente controlado. "Naveganza funciona ya en la administración pública o dentro de las compañías, pero dar el salto a la Web es muy difícil", afirma, y sigue: "Con un poco de semántica ya se consigue ir muy lejos", parafraseando al investigador de inteligencia artificial y web semántica James Hendler.

Fórmulas alternativas

El vicepresidente europeo de investigación de Yahoo, Ricardo Baeza, argumenta que, aunque todas las compañías trabajan para aplicar la semántica en sus buscadores, por el momento es imposible conseguir uno en el que se aplique plenamente. "Estaríamos hablando de la construcción de una inteligencia artificial perfecta, y es algo que no se ha logrado. En investigación hay que ser muy cuidadosos antes de afirmar algo así", añade.

Los expertos se muestran escépticos ante un buscador global plenamente semántico

Baeza destaca que una de las fórmulas en las que está trabajando Yahoo para recuperar cuota de mercado es el empleo de tecnologías diferenciadas. En este sentido, Correlator (sólo en inglés) es un prototipo experimental de buscador centrado en la Wikipedia que muestra los resultados creando una página con los distintos extractos encontrados en la enciclopedia on-line. También realiza búsquedas de fechas y lugares, con una web que incluye líneas de tiempo y mapas.

Correlator no es la única tecnología avanzada sobre la que trabaja el departamento de investigación de Yahoo. Con servicios de búsqueda abiertos a terceros como Boss, la compañía logró alcanzar más de 10 millones de peticiones diarias a finales del año pasado según sus propias cifras.

¿Y qué hace Google mientras tanto? Fuentes de la compañía aseguran que su algoritmo de búsqueda está en constante evolución, aunque sin cambios drásticos. En cuanto a las búsquedas semánticas, Google indica que no están preparando nada específico, aunque los medios especializados sostienen que se trata de un plato demasiado suculento para que la compañía lo deje pasar.

La Web de los datos

Martín Álvarez Espinar, responsable de la Oficina Española de la W3C

Se cumplen 20 años desde que el actual director del World Wide Web Consortium (W3C), Tim Berners-Lee, presentase el primer borrador sobre Internet. Durante estos años se ha publicado una incalculable cantidad de información, hecho que ha llevado a los buscadores a ocupar un puesto de gran relevancia para la indexación de datos en la Web. No obstante, estos siempre han presentado un problema de eficacia debido a la ambigüedad del lenguaje natural, presente en los sitios web y utilizado por los usuarios en la búsqueda de información.

Los motores de búsqueda tradicionales se basan en coincidencias sintácticas de palabras incluidas en los documentos y, aunque ofrezcan algoritmos optimizados y mejoras de uso, es complicado obtener resultados concisos y adecuados que eviten la
frustración del usuario.

Esta limitación se solventa con la evolución que está experimentando la Web, que no sólo está compuesta por documentos destinados a las personas sino que además incluye datos que pueden interpretar las máquinas, teniendo en cuenta los conceptos de la información representada (persona, organización, localización, etc.) y las
relaciones establecidas entre estos conceptos.

A través de nuevos estándares, Internet está creciendo hacia la denominada Web semántica, una gran base de datos global. Si a esto le unimos los nuevos mecanismos de acceso mediante dispositivos móviles, los cuales ofrecen funcionalidades para determinar el contexto en el que se encuentra el usuario (su posición, características del terminal, etc.), las consultas se enriquecen más allá de las palabras que las componen.
Las aplicaciones web, y los buscadores en concreto, pueden y deben hacer uso de las posibilidades de la composición de recursos adecuados a la naturaleza de la búsqueda y a las preferencias de los usuarios para mostrar un resultado más completo, preciso y adecuado que el que se obtiene a través de la
búsqueda simple.

Vídeos de 'Público'

Te puede interesar

Comentarios de nuestros suscriptores/as