Mis datos no, gracias


Mis datos no, gracias

Nos hemos acostumbrado, desde el principio de los tiempos web, al funcionamiento de los buscadores adaptándonos nosotros a su forma peculiar de entender y clasificar la información. Estoy seguro que cuando entras en una agencia de viajes y te sientas delante del agente no se te ocurre decir: “vuelo+hotel barato tarragona” (eso espero !).

Y es que resulta que los contenidos que generamos y que publicamos en la web únicamente son comprendidos, entendidos e interpretados por nosotros, las personas y no por las herramientas que nos ayudan a clasificar y devolver resultados en las búsquedas. Es decir, subimos a la red contenido con significado, con relaciones entre datos, con opiniones, con revisiones que el buscador generalmente no va a saber interpretar a la hora de ofrecer sus resultados para búsquedas con significado o búsquedas semánticas.

Imaginemos un buscador que realmente busca en TODA la red contenido con significado, contenido relacional, contenido no exclusivo de páginas web y blogs, sinó contenido que se ha generado en redes sociales, contenido generado en cualquier tipo de formato (audio, video, texto, imágenes…), contenido almacenado en hosting sociales…produce un poco de vértigo, ¿no?. Por un lado la mejora en el resultado de las búsquedas es evidente: la posibilidad del buscador de poder entender el “lenguaje natural” con el que normalmente nos expresamos y poderlo aplicar a los contenidos posibilitará que en su proceso de búsqueda, va a analizar los contenidos viendo la relación y el significado de cada uno de ellos y entre ellos y, por tanto, ofreciendo resultados que se van a acercar mucho a nuestra petición: “busco un vuelo ida y vuelta desde madrid a tarragona con alojamiento en hotel por una noche de precio total inferior a 300 €“. Tanto la cantidad como la calidad de la información indexada y devuelta en forma de resultados para búsquedas mejorarían notabilísimamente, de eso no creo que tengamos duda.

Pero por el otro lado nos encontramos con algunos problemas de peso, problemas que hacen ralentizar ese salto hacia el “significado”. Básicamente dos tipos, el primero es de carácter puramente técnico o tecnológico y hace referencia al acuerdo para el uso de un sistema estándar, esto es, conseguir un acuerdo para la utilización de un estándar para la información de la red: hasta ahora existen dos corrientes de actuación, los defensores de la web semántica tradicional (RDFa) y los más prácticos que buscan más el corto plazo con los microformatos (formatos que ya se usan por ejemplo en Technoratti).

El segundo problema, el que da título a este post. Claro, cuando decidimos explorar también los datos incluidos en redes sociales empezamos a entrar en un tema donde el suelo ya no es tan firme. Es más que posible que los usuarios no quieran revelar sus datos privados para que sean tenidos en cuenta en las búsquedas. Y no digo datos privados al uso (nombre, email, direccion…etc), me refiero a opiniones vertidas en grupos de discusiones, foros … etc y que por tanto deseen ser excluidos de ese ojo que todo lo ve.

La paradoja es interesante: por un lado nos interesan los resultados de calidad, resultados relacionales y con significado relevante, pero por otro lado, es muy posible que no deseemos que sean incluidas o tenidas en cuenta nuestras revisiones y opiniones personales vertidas en redes sociales, que en muchos casos y para muchos productos son la fuente más importante de información de primera mano sobre los mismos… uhmm complejo ¿no?

Salu2

Información y Enlaces

Integrese haciendo comentarios, revisando lo que otros tienen que decir o agregando enlaces desde su propio blog a nuestros Artículos


Otros Artículos
Mallorca workshop 2.0
10 años del Cluetrain Manifiesto

Agrege un Comentario

Tome un momento para hacer un comentario diciendonos que piensa. Se permite utilizar algunos comandos de HTML básico para dar formato al texto.

Comentarios de los Lectores

Interesante reflexión, Jordi.
Respecto al segundo problema que planteas, el que no quiera que sus opiniones aparezcan en los resultados de búsqueda sólo tiene una opción, no publicarlas.
La web va en la dirección opuesta, cada dia es más facil trackear los contenidos generados por una identidad online (lease persona). OpenID, claimID, FriendsFeed, ZoomInfo son algunas de las muchisimas iniciativas que perseguen organizar los contenidos en torno a su autor.
En todo caso, creo que esto esta más relacionado con la gestión de la reputación online que con los problemas que pueda plantear la web semantica.

Ok Carlo a tu planteamiento, yo intenté relacionar la necesidad que se nos plantea cuando requerimos unos resultados de búsqueda en buscadores de calidad vs la posible privacidad de datos (opiniones, debates, reviews) de usuarios en redes sociales, foros…etc que son capaces de dar gran relevancia a esas búsquedas y que por ahora, son de caracter privado. Son datos muy relevantes que hablan de productos, de servicios …etc , están en la red y la pregunta es si por el mero hecho de estar en la red deben ser o no públicos de manera universal, de manera que puedan ser leidos y trakeados por los motores de búsqueda. Esto permitiría un gran avance en cuanto a resultados de calidad, pero por otro lado los usuarios tienen también la posibilidad de decidir sobre quién va a ser consumidor de su info, sus experiencias, datos…etc.
Creo que vale la pena escribir un nuevo artículo sobre el tema…
Gracias Carlo por tu aportación.
Salu2

Si, estoy de acuerdo, este tema da para un post y varios libros.

Respecto a la visibilidad de lo que ‘decimos’ a la red, una reflexión:
En España tenemos la ’suerte’ de que la mayor parte de iniciativas y mashups nos llegan de EEUU (salvo honrosas excepciones), cuando ya estan probadas y requeteprobadas. Como resulta que al otro lado del charco tambien se preocupan por la privacidad y diria incluso que nos llevan cierta delantera, cuando aqui los empezamos a usar (exceptuando a los early adopters que los probamos a la mañana siguiente de su estreno en San Francisco:) ya han previsto el tema de la privacidad. Por poner un ejemplo, me encuentro a menudo gente que no entiende porque comparto mis favoritos en del.icio.us o mis lecturas en Google Reader y Netvibes. Gente que aun no ha entendido que 2.0 no significa compartirlo todo (yo no publico las fotos de mi hijo). Si hay algo que no quieran compartir, sólo tienen que decidir no hacerlo, ya esta. En Del.icio.us, cada vez que marcas un favorito te pregunta si quieres compartirlo, lo mismo sucede con los feeds de Netvibes, Google Reader y cualquier otro mashup.
En fin, lo dicho. salvo errores y hackers, lo que aparece en las busquedas es porque hemos permitido que aparezca.