Con pico y pala, muchos son hoy los que escudriñan cada rincón de la Red para extraer información y analizarla. Aunque nos queda la sensación semiparanoica-semireal de que hacen perfectas radiografías de nuestro yo digital (siempre suelo jugar en mis cursos al Gran Hermano con webs como 123people o PeekYou), esta minería también sirve para detectar otras cosas.
Ese es el caso de estudio llevado a cabo por la University College London sobre la obra de la prestigiosa escritora y filósofa Iris Murdoch, que padeció de Alzheimer. Analizando su producción literaria desde sus inicios allá por 1954 con la novela Bajo la red hasta la última publicada en 1995, El dilema de Jackson, se detecta el déficit cognitivo propio de la enfermedad que le fuera diagnosticada tras terminar de escribirla. La gramática y estructura apenas habían cambiado, sin embargo, su lenguaje se había ido simplificando mucho. Los investigadores de la UCL cogieron tres de sus trabajos: el primero, el último y uno publicado más o menos en el ecuador de su carrera (El mar, el mar, 1978). Digitalizaron todos los textos para analizar la frecuencia con la que aparecían determinadas palabras y la variedad de las mismas. Los resultados fueron claros: la novela con menos palabras distintas fue la última, frente El mar, el mar, que tenía el número más alto. Además de ser un vocabulario menos usual. Y es que el Alzheimer, además de robarnos lo más preciado de nuestras vidas (los recuerdos), dificulta que se encuentren las palabras que se quieren usar, sobre todo las menos comunes aunque todavía se pueda producir frases gramaticalmente correctas.
¿Llegará el día en que las arañas de Internet sean capaces de detectar este tipo de trastornos analizando blogs, redes sociales o lo que sea que suceda a esta amalgama de herramientas? ¿Tendrán nuestros sistemas sanitarios que ponerse a la cabeza de este tipo de investigaciones para detectar con premura enfermedades? No siempre el Gran Hermano tiene que usarse para el mal 😉
Esta historia está extraída del libro Numerati. Lo saben todo de ti de Stephen Baker, muy sugerente en su título y sinopsis pero decepcionante luego por su simpleza y por no profundizar las teorías de minería de datos en todos los ámbitos en los que se plantea (política, empleo, marketing, medicina, relaciones personales, …).
Imagen de Anna Pallares (CC by-nc-nd)
Interesante que la araña de Google (de las más potentes del mundo) pueda ser algún día experta en detección de enfermedades y trastornos… ¡macho como avanzamos!
@Nacho: en ese aspecto no hay que mirar mucho al futuro. Actualmente Google ya trabaja en una rama de salud que analiza las búsquedas que hace la gente de palabras como «gripe» para comprobar desde qué ubicación se hacen y, si se está produciendo un contagio masivo, por dónde avanza.
Por no hablar de lo inquietante que parece Google Health