Imagen © 1999-2004 Ben Fry

El Quijote Valence, 2004-2005

  • Benjamin Fry

Instalación digital
Texto digital de El Quijote cedido por el Centro Virtual Cervantes, Copyright Instituto Cervantes
Cortesía de Benjamín Fry

¿Cómo se puede representar visualmente el uso que se hace de las palabras en un libro determinado? El Quijote tiene 233.433 palabras en total, de las cuales 18.000 son únicas de esta obra literaria. Un gráfico de barras que incluyera tantos elementos resultaría prácticamente inútil. Sería demasiado grande para poder interpretarlo a simple vista, y si lo redujéramos al tamaño apropiado al campo de visión, demasiado pequeño para entenderlo. Podrían utilizarse otras técnicas, pero dadas las enormes disparidades existentes en el uso de las palabras (de las 18.000 palabras únicas, más de la mitad se utilizan una sola vez), ni siquiera un 15% de los datos serían de utilidad, y las características interesantes no quedarían reflejadas hasta no haber superado el 5% superior, de tal manera que habría un gran espacio ocupado por datos sin importancia, y la mayor parte del tiempo el objetivo se centraría en la misma zona. No es fácil encontrar una solución eficaz, ya que cada técnica plantea nuevos problemas. Aun cuando pudieran superarse estas dificultades mediante operaciones estadísticas y sirviéndose de un gráfico de barras modificado, no está claro que la descripción resultante de los datos fuera de alguna utilidad. No obtendríamos ningún reflejo de las relaciones existentes entre las palabras. Por ejemplo, ¿cómo saber qué palabras aparecen próximas unas a otras en el texto? ¿Cómo expresar los cambios que van produciéndose en el uso de las palabras a lo largo del libro?

Los métodos clásicos de representación, como las tablas y los gráficos, fallan al aplicarlos a conjuntos de datos tan grandes; se requieren, por tanto, nuevos modelos. En la obra que presentamos, hemos recurrido a propiedades de los sistemas orgánicos (aspectos como el crecimiento, la atrofia, la adaptación y el metabolismo), para elaborar representaciones que se basan en la interacción de muchas reglas simples, con la pretensión de obtener un modelo metodológico más ilustrativo. Así, la visualización resultante ofrecerá una información expresiva, en la que los organismos consumen y metabolizan datos para dar una valoración cualitativa de la información que se representa.

Benjamin Fry

más información