Imagen © Benjamin Fry

Genome Valence, 2002

  • Benjamin Fry

Instalación digital
Cortesía de Benjamin Fry

En varios proyectos sobre el “genoma” que están a punto de concluirse, una utilización básica de los datos que hacen los biólogos es buscar una secuencia determinada de letras y ver si se encuentra en el genoma de otro organismo. Si está en el segundo organismo -teniendo en cuenta lo que se sabe de dicha secuencia en el primer organismo-, se puede entonces deducir la función que cumple esa secuencia determinada de letras.

La obra que presentamos es una representación visual del algoritmo que más se utiliza en las búsquedas sobre el genoma (el algoritmo denominado BLAST). El genoma de cualquier organismo se compone de miles de genes (34.000 en los seres humanos; 20.000 en los ratones, y 14.000 en la mosca de la fruta). Cada gen es una secuencia de As, Cs, Gs, Ts, etcétera. De media, cada secuencia tiene entre 1.000 y 2.000 letras. Para manejar tal cantidad de información, el algoritmo BLAST fragmenta cada secuencia en partes de nueve letras. Cada conjunto de nueve letras se representa en la pantalla mediante un punto. Los puntos se disponen a partir del centro, de manera que los conjuntos más comunes se sitúan en la periferia y los menos comunes hacia el medio.

En la parte superior de la pantalla, se procesa la búsqueda de cada secuencia en cada uno de los tres organismos. Por cada conjunto de nueve letras, se traza un arco entre su punto en el espacio y el punto que representa el siguiente conjunto de nueve letras.

Entre tanto, se puede ver la misma secuencia de la que se ha realizado la búsqueda, moviéndose por el espacio como una franja de texto que se contiene a sí misma entre los puntos que conecta.

En la mayoría de los conjuntos de nueve letras, hay tres puntos, que se corresponden con los tres organismos representados y con la frecuencia de aparición de cada conjunto. Los tres puntos están conectados mediante tres líneas curvas situadas sobre cada arco, una por cada organismo representado. La línea exterior suele ser la del ser humano y la interior, la de la mosca de la fruta.

Haciendo clic con el ratón del ordenador y arrastrando por la parte inferior de la pantalla se puede introducir la secuencia de la que se pretende realizar una búsqueda. Con esta acción, se crea otra franja que recorre el espacio hasta resaltar la secuencia de las letras seleccionadas.

La obra que presentamos es una adaptación del proyecto Valence y forma parte de una investigación más amplia sobre cómo elaborar construcciones visuales de cantidades muy grandes de datos, concretamente de información sobre el genoma. Se trata tanto de herramientas como de planteamientos conceptuales relativos a métodos alternativos para la visualización de datos.

Benjamin Fry