

Nos hemos acostumbrado, desde el principio de los tiempos web, al funcionamiento de los buscadores adaptándonos nosotros a su forma peculiar de entender y clasificar la información. Estoy seguro que cuando entras en una agencia de viajes y te sientas delante del agente no se te ocurre decir: “vuelo+hotel barato tarragona” (eso espero !).
Y es que resulta que los contenidos que generamos y que publicamos en la web únicamente son comprendidos, entendidos e interpretados por nosotros, las personas y no por las herramientas que nos ayudan a clasificar y devolver resultados en las búsquedas. Es decir, subimos a la red contenido con significado, con relaciones entre datos, con opiniones, con revisiones que el buscador generalmente no va a saber interpretar a la hora de ofrecer sus resultados para búsquedas con significado o búsquedas semánticas.
Imaginemos un buscador que realmente busca en TODA la red contenido con significado, contenido relacional, contenido no exclusivo de páginas web y blogs, sinó contenido que se ha generado en redes sociales, contenido generado en cualquier tipo de formato (audio, video, texto, imágenes…), contenido almacenado en hosting sociales…produce un poco de vértigo, ¿no?. Por un lado la mejora en el resultado de las búsquedas es evidente: la posibilidad del buscador de poder entender el “lenguaje natural” con el que normalmente nos expresamos y poderlo aplicar a los contenidos posibilitará que en su proceso de búsqueda, va a analizar los contenidos viendo la relación y el significado de cada uno de ellos y entre ellos y, por tanto, ofreciendo resultados que se van a acercar mucho a nuestra petición: “busco un vuelo ida y vuelta desde madrid a tarragona con alojamiento en hotel por una noche de precio total inferior a 300 €“. Tanto la cantidad como la calidad de la información indexada y devuelta en forma de resultados para búsquedas mejorarían notabilísimamente, de eso no creo que tengamos duda.
Pero por el otro lado nos encontramos con algunos problemas de peso, problemas que hacen ralentizar ese salto hacia el “significado”. Básicamente dos tipos, el primero es de carácter puramente técnico o tecnológico y hace referencia al acuerdo para el uso de un sistema estándar, esto es, conseguir un acuerdo para la utilización de un estándar para la información de la red: hasta ahora existen dos corrientes de actuación, los defensores de la web semántica tradicional (RDFa) y los más prácticos que buscan más el corto plazo con los microformatos (formatos que ya se usan por ejemplo en Technoratti).
El segundo problema, el que da título a este post. Claro, cuando decidimos explorar también los datos incluidos en redes sociales empezamos a entrar en un tema donde el suelo ya no es tan firme. Es más que posible que los usuarios no quieran revelar sus datos privados para que sean tenidos en cuenta en las búsquedas. Y no digo datos privados al uso (nombre, email, direccion…etc), me refiero a opiniones vertidas en grupos de discusiones, foros … etc y que por tanto deseen ser excluidos de ese ojo que todo lo ve.
La paradoja es interesante: por un lado nos interesan los resultados de calidad, resultados relacionales y con significado relevante, pero por otro lado, es muy posible que no deseemos que sean incluidas o tenidas en cuenta nuestras revisiones y opiniones personales vertidas en redes sociales, que en muchos casos y para muchos productos son la fuente más importante de información de primera mano sobre los mismos… uhmm complejo ¿no?
Salu2
Escrito por , el 14/05/2008 a las 10:56, archivado en web_semántica etiquetado como semantica, web30. Comentar el post.