El mapa y el territorio. Una aproximación histórico-bibliográfica a la emergencia de las Humanidades Digitales en España

The map and the territory. A historical and bibliographical approach to the emergence of Digital Humanities in Spain

Antonio Rojas Castro (Universitat Pompeu Fabra)

Artículo recibido: 08-10-2013 | Artículo aceptado: 19-11-2013

ABSTRACT: This article is divided into three sections: the first focuses on some analogies and historical parallels that shape digital technology, the hypertext and interactivity, such as the book and the printing press. My aim in the second section is to map the development of the creation of digital environments for archives, corpus, libraries and scholarly editions of medieval and Golden Age literary works by the Spanish-speaking academic community from 1986 to 2005. Of course my account cannot be comprehensive, but it aims to be representative, nevertheless. The last section traces the evolution of the relationship between the literary studies and information technology from 2006 until 2013 when the first official Digital Humanities conference took place in Spain.
RESUMEN: Este artículo consta de tres partes: en la primera me ocupo de algunas analogías y paralelismos históricos, tales como el libro y la imprenta, que han moldeado la reflexión en torno a la tecnología digital, al hipertexto y a la interactividad. En la segunda parte mi objetivo es trazar una panorámica ordenada cronológicamente sobre los principales proyectos de digitalización (bibliotecas, archivos, corpus y ediciones de obras literarias medievales y áureas) aparecidos en el ámbito académico hispánico desde 1986 hasta 2005; por supuesto, el recuento es incompleto pero aspira a ser representativo. Por último, la tercera parte se centra en cómo ha evolucionado la relación entre estudios literarios y la tecnología digital desde 2006 hasta la celebración del primer congreso oficial sobre Humanidades Digitales en 2013.

KEYWORDS: printing press, hypertext, digital library, digital scholarly edition, Digital Humanities
PALABRAS CLAVE: imprenta, hipertexto, biblioteca digital, edición académica digital, Humanidades Digitales

____________________________

Finding new precedents in past things and experiences is how we make sense of what is new, perhaps even how we perceive the new at all.
Willard McCarty

1. Introducción

El trabajo continuo de investigadores como Charles B. Faulhaber, Francisco Marcos Marín, Antonio R. de las Heras, José Manuel Lucía Megías o Alejandro Bia en torno a ciertos temas recurrentes y lecturas compartidas puede percibirse como la existencia en estado latente de una red de interesados en la relación entre la literatura y la informática o la tecnología digital[1]. Esta red, con sus nodos y enlaces, sería anterior a la difusión del membrete “Humanidades Digitales” en España[2], entre 2005 y 2006, y a su aún más reciente institucionalización por medio de asociaciones, congresos, másteres y revistas.

Las Humanidades y la informática han confluido en proyectos de investigación desde finales de los ochenta en el seno de las disciplinas humanísticas tradicionales, especialmente en los departamentos de Filología. Pensar lo contrario supondría caer en una de las trampas del realismo platónico; o dicho utilizando una metáfora geopolítica, confundir el mapa con el territorio. No solo han existido numerosos proyectos, como el ADMYTE, la Biblioteca Virtual Miguel de Cervantes, el CORDE y el CREA, sino que la bibliografía sobre la tecnología como herramienta u objeto de estudio en las humanidades es abundante y, desde un punto de vista metodológico, muy variada[3]. Hacia 2003, sin embargo, se perciben los primeros intentos de dotar de autonomía a los estudios humanísticos interesados en el uso de la informática; José Manuel Lucía Megías (2003) publica en la revista Incipit un artículo que lleva por título “La ‘Informática Humanística’: notas volanderas desde el ámbito hispánico” pero el membrete carece de difusión y es muy poco utilizado. Dos años más tarde la expresión “Humanidades Digitales” empieza a utilizarse en España en artículos académicos pero no se consolida hasta el nacimiento de la asociación Humanidades Digitales Hispánicas en 2011.

Este artículo se vertebra en tres grandes bloques en torno al libro y al hipertexto, a la edición académica digital y a la emergencia de las Humanidades Digitales como disciplina autónoma. Sin embargo, las secciones comparten más afinidades que diferencias, pues un mismo espíritu de interconexión anima tanto a las tentativas de interrelación -mediante enlaces o etiquetas- que ofrece el medio digital a los editores, por un lado, como a las prácticas colaborativas de los humanistas digitales, por el otro. En este sentido creo que el hipertexto ha dado vuelo a la imaginación de los editores mientras que las limitaciones técnicas de la digitalización, que a menudo imponen jerarquías y una rígida estructuración de los datos, han disuelto algunas de las quimeras de la teoría.

2. Analogías y paralelismos históricos

El objetivo de este apartado es dar cuenta de las principales contribuciones críticas sobre el modo en que se ha revisado la historia del libro y se han pensado las implicaciones del hipertexto en el territorio peninsular durante los años noventa del siglo pasado y la primera década del XXI. Por lo general, la tendencia es interpretar la tecnología digital en términos históricos, es decir, buscando antecedentes tanto para legitimar los cambios como para neutralizar su aparente novedad.

2.1. El libro, la imprenta y el humanismo

Desde mediados de los años noventa Internet y el libro electrónico se comparan a menudo con otros soportes o tecnologías pasadas; por lo general no se percibe una fractura total con la tradición sino más bien la culminación de un proceso democratizador iniciado con el invento de Gutenberg. Si la imprenta redujo el coste de la producción de libros y facilitó la multiplicación de copias, Internet se considera un nuevo cauce de transmisión de la información, más barato, más inmediato y de alcance global; por su parte, el libro electrónico suele ponerse en relación con otras mutaciones precedentes como el paso del volumen al códice y por eso se debate sobre la posible desaparición del libro impreso.

Uno de los primeros trabajos, al menos hasta donde tengo noticia, que articulan la analogía entre la invención de la imprenta y la tecnología digital pertenece a Charles B. Faulhaber (1986), recoge las actas del noveno congreso de la Asociación Internacional de Hispanistas (AIH) y en él resuenan las siguientes palabras del gran hispanista:

La comparación con el siglo XV es instructiva. Hace 500 años la imprenta balbuceaba. Los impresores aún imitaban a ojos cerrados el formato del libro manuscrito, dejando sitio para las iniciales y orlas iluminadas, preparando textos escolares con glosas interlineares y marginales, dando comienzo a la obra con la primera hoja del texto, sin portada. Tardaron mucho en darse cuenta de que las técnicas para la producción de manuscritos se amoldaban mal a las posibilidades de la imprenta; ésta necesitaba un formato propio. [...] Estamos en el período “incunabular” del ordenador. De hecho, los paralelismos cronológicos son asombrosos. La imprenta se desarrolló en los cuarenta del siglo XV; el ordenador en los cuarenta de éste. La imprenta se internacionalizó en la década de 1460; el ordenador en la de 1960. En 1987 el ordenador está donde la imprenta en 1487. Estamos dándonos cuenta, por fin, de que el producto del ordenador no tiene que ser un libro impreso. De hecho, para aprovecharnos de sus capacidades inherentes, no debe ser un libro al estilo antiguo. (Faulhaber, 1986: 170)[4]

Algunos años más tarde Jenaro Talens (1994) distingue tres fases históricas y sus modos de comunicación propios (oralidad, escritura y medio electrónico) en “El lugar de la teoría literaria en la era del lenguaje electrónico”. Seguidamente el autor establece el paralelismo entre imprenta y formato electrónico en los siguientes términos: de la misma manera que los tipos móviles propiciaron el paso del “auditor” al lector y de la teatralidad a la escritura, y de alguna manera forjó lo que hoy conocemos como “literatura”, Talens tiene el convencimiento de que Internet y las nuevas tecnologías producirán un cambio de paradigma que desplazará al libro impreso (Talens, 1994: 132).

Tres años más tarde, en Literatura y multimedia, José Romera Castillo afirma que las nuevas tecnologías influyen en todo el proceso de la “semiosis literaria”, es decir, en la autoría porque la obra no está totalmente acabada por el autor, en la factura del texto porque éste puede ser actualizado constantemente, en la difusión porque plantea una alternativa al canal impreso, en la recepción porque el lector lee, mira y oye, y en la enseñanza porque hace posible la educación a distancia (Romera Castillo, 1997: 35). En cuanto al parangón entre la imprenta y los medios electrónicos, que durante los noventa -hay que recordarlo- abarcan tanto Internet como el CD-ROM, el profesor Romera no habla de “sustitución” sino de relación complementaria o coexistencia pacífica entre los distintos soportes: el libro impreso no va a desaparecer, aunque algunas obras que requieren una lectura no lineal, como los diccionarios y enciclopedias, son más proclives a difundirse en formato electrónico (Romera Castillo, 1997: 40-41).

Para José Manuel Lucía Megías, en cambio, el parangón histórico que ayuda a entender el presente no se encuentra en el siglo XV sino novecientos años antes, en el siglo VI, cuando algunos grupos de cristianos empiezan a utilizar el formato códice porque facilita la localización de pasajes, resulta más cómodo de transportar, permite ahorrar superficie de escritura y aumenta el número de copias. La idea de que la traducción de signos materiales a signos electrónicos implica un cambio de tecnología más afín al paso del volumen al códice ha sido defendida por este investigador en varios lugares, por ejemplo, en “Internet y edición: algunas notas preliminares” (2000) y más recientemente ha vuelto a aparecer en Elogio del texto digital (2012) pero su primera formulación, hasta donde sé, se encuentra en la primera nota a pie de página de “Editar en Internet” (1998); el autor utiliza este argumento para relativizar el impacto de la imprenta así como los pronósticos pesimistas sobre el futuro del libro impreso:

No nos parece comparable [...] la situación que se produce a finales del siglo XV y durante el siglo XVI del paso del manuscrito al impreso a la imprenta, ya que el libro impreso no deja de nacer en su forma externa siguiendo el modelo del códice manuscrito; sólo un proceso mecánico de reproducción, unos medios que se convierten en industriales les diferencian… pero el formato y las (im)posibilidades en gran medida las comparten. Esta imagen, tan apreciada por algunos como forma de condenar al olvido al libro, no refleja en absoluto los cambios culturales que el mundo de la informática y el de la Red están imponiendo en nuestros días. (Lucía Megías, 1998: 1)

El punto de partida de los autores de la “Norma-recomendación de la Asociación Internacional Siglo de Oro sobre edición de textos electrónicos áureos” es precisamente las mutaciones del libro; además de la analogía con la imprenta, José Luis Canet y Ricardo Serrano incorporan la lección de José Manuel Lucía Megías:

En la época actual, la de la información e Internet, se ha dado un gran salto divulgativo de la ciencia y de la documentación, siendo un caso parecido al que ocurrió en el siglo VI con la aparición del codex mediante el soporte de pergamino, o al de la imprenta de Gutenberg con los tipos móviles y la amplia difusión de los textos mediante el soporte papel. Todas estas revoluciones presentan, a pesar de su separación en el tiempo, ciertos patrones comunes, como son 1) la implantación de modos de producción o tecnologías que permiten la multiplicación de ejemplares idénticos (o casi idénticos) y 2) el abaratamiento del texto producido y de su distribución. (Canet, 2002: 1897)

De esta manera, Internet y la tecnología digital dejan de verse como amenazas y se integran en la historia del libro y de los medios de comunicación. Al mismo tiempo, se suele apelar a los orígenes del Humanismo ligados a la imprenta, con la finalidad de justificar la conversión de textos impresos al medio digital por parte de los filólogos y, en consecuencia, de demostrar la vigencia y utilidad de las humanidades:

Nos encontramos, pues, ante un proceso algo similar al que tuvo lugar hace unos quinientos años, que implicó cambios estructurales en la propia enseñanza escolar y universitaria. Como es bien sabido, se modificó el modelo de aprendizaje completamente memorístico de la etapa anterior hacia cauces más en consonancia con el mundo actual, pues la información que proporcionaba el libro era ya accesible a una mayoría de profesionales que podían poseerlo, con lo que no se tenía la perentoria necesidad de extraer frases y citas con la finalidad de memorizarlas o de copiar aquellos fragmentos que más les interesaba; y apareció, cómo no, la filología crítica en todo su esplendor, posibilitando la selección y comparación de diferentes versiones de un mismo texto. (Canet, 2002: 1898)

Dos años más tarde, en La vieja diosa. De la filología la postmodernidad de Joaquín Rubio Tovar (2004) se vuelve a asociar la imprenta con las nuevas tecnologías pero para desmentir que Internet y el libro electrónico supongan el fin del libro impreso:

[...] es indiscutible que la imprenta no acabó con la cultura oral y manuscrita y con la práctica de la copia y de la lectura en comunidad. Permítaseme en este punto una comparación con los tiempos actuales. Está muy extendida la opinión de que los medios informáticos van a sustituir al libro impreso de la misma manera que la imprenta sustituyó al manuscrito y a la cultura oral. La primera parte de la frase entra en el terreno de la futurología, mientras que la segunda es falsa. Poco queda en la historiografía especializada de las tópicas ideas sobre lo que supuso la imprenta, pero al ser un lugar común muy extendido conserva parte de su predicamento. (Rubio Tovar, 2004: 258-259)

Aunque no se pronuncia ni a favor ni en contra de la sustitución del libro impreso por el libro electrónico, Domingo Sánchez-Mesa (2004: 16) afirma en Literatura y cibercultura que la tecnología digital está cambiando el sistema literario del mismo modo que la vulgarización de los manuscritos, de los tipos móviles y del cine o la televisión lo hicieron en el pasado. Por otro lado, en “Nuevas tecnologías y saber humanístico”, contenido en el mismo volumen, Antonio R. de las Heras (2004: 154) caracteriza el libro impreso como una “máquina de confinamiento de información muy evolucionada” pero reconoce que el libro electrónico lo supera en su capacidad de almacenaje, precio, ligereza y posibilidades interactivas.

El argumento que vincula la imprenta con Internet vuelve a hallarse en el artículo “¿Humanidades digitales en español?” de Juan Luis Suárez (2010). En él se justifica la necesidad de una nueva alfabetización basada en las herramientas digitales:

De la misma forma que el humanismo del siglo XV nació abrazado a las tecnologías de la imprenta, del libro y de los studia humanitatis, las humanidades del siglo XXI tienen que desarrollar las tecnologías digitales y los procesos sociales que permitan la actualización de su programa de cultura para poder seguir ofreciendo un modelo de intercambio con el mundo según una escala humana. (Suárez, 2010: 34)

En resumen, durante los años noventa y aún a inicios del siglo XXI, la tecnología digital se suele interpretar tomando como puntos de referencia dos acontecimientos históricos: por un lado, las más de las veces, la invención de la imprenta en el siglo XV porque se asocia con el Renacimiento y los orígenes del humanismo[5]; por el otro, con menor frecuencia, el paso del volumen al códice en el siglo VI. El debate en torno a la desaparición del libro impreso, la desnaturalización del códice que ahora se considera una máquina, o la necesidad de legitimar la labor del humanista en términos utilitarios ante el avance de las políticas neoliberales son en sí mismos índices del modo en que la informática y la tecnología digital están cambiando la cultura literaria y la relación entre el humanista y la sociedad.

2.2. El hipertexto y la interactividad

La reflexión en torno al hipertexto es sin duda una de las cuestiones que mayor atención ha recibido por parte de los humanistas. Desde la generalización de Internet el hipertexto ha sido objeto de reflexión desde distintos puntos de vista: se han buscado sus antecedentes históricos y se ha teorizado sobre las implicaciones de la lectura no secuencial y del papel del lector, y, quizá de manera insuficiente, se han analizado las propiedades de hipertextos literarios reales. Los investigadores españoles, además, demuestran haber leído a autores tan relevantes en la materia como Ted Nelson y George P. Landow, por lo que no creo errado afirmar que el tráfico y el préstamo de ideas, aunque unilaterales, entre el ámbito anglosajón y el ámbito hispánico son otra de las características de los estudios sobre el hipertexto. Una búsqueda en Dialnet del término arroja un resultado de 415 documentos relacionados por lo que resulta imposible llevar a cabo un análisis exhaustivo de todas las contribuciones; en consecuencia, me limitaré a un puñado de publicaciones que considero representativas del conjunto.

Pero antes conviene dejar claro qué se entiende por hipertexto. La definición más sencilla corresponde a cualquier texto presentado en una pantalla de ordenador, u otro dispositivo electrónico, que contenga referencias, es decir, enlaces (links), a otros textos a los que el lector puede acceder de manera inmediata[6]. En sus orígenes, y en esto la influencia de Vannevar Bush (1945) resulta ineludible, se caracteriza como una manera de asociar información que reproduce el funcionamiento de nuestro cerebro y sus conexiones neuronales[7]. Sin embargo, durante los años ochenta y noventa, la teoría literaria casi elevó el hipertexto a una categoría metafísica por su carácter no secuencial y porque otorga mayor responsabilidad al lector durante el proceso de construcción del sentido. El hipertexto, para decirlo en pocas palabras, fue percibido como una manifestación de las teorías de la escritura que los principales autores postestructuralistas concibieron décadas atrás, y en esto España no iba a ser menos. Así, por ejemplo, en Literatura e Hipertexto. De la cultura manuscrita a la cultura electrónica (1998), Carlos Moreno Hernández destaca la aportación de Roland Barthes (1987) en “De la obra al texto”, de 1971, y afirma lo siguiente:

[...] todas y cada una de las “proposiciones” en las que Barthes explica su noción de Texto son aplicables a la variedad de texto no lineal que es el hipertexto: el Texto no es un objeto computable; no se reduce a la (buena) literatura y a sus jerarquías genéricas o clasificatorias; es dilatorio respecto al significado; es plural en relación con los significantes que lo tejen y el lector percibe en él algo múltiple e irreductible, procedente de sustancias y planos heterogéneos; puede leerse sin la garantía de su padre, el autor propietario; ya no es objeto de consumo, sino de un juego, trabajo, producción, práctica; está ligado al goce, al placer sin separación, pues es el espacio en el que ningún lenguaje corta el camino a otro, en el que circulan los lenguajes. Y concluye que estas proposiciones no constituyen una Teoría del texto, pues el discurso sobre el Texto no debería ser, a su vez, más que texto, búsqueda, trabajo de texto. (Moreno Hernández, 1998: 22)

A menudo los humanistas olvidaron que el hipertexto, además de una forma de escribir, es la primera palabra de las siglos HTML (Hypertext Markup Language), un lenguaje de marcado que pone el acento en la apariencia de los documentos, no en su contenido estructural; esto, en mi opinión, ha tenido consecuencias muy negativas a la hora de pensar el funcionamiento de Internet porque no se ha contemplado la existencia de otros lenguajes de marcado mucho más eficaces, como SGML (Standard Generalized Markup Language) y XML (eXtensible Markup Language). Además, en los últimos años han surgido distintos modelos, usos y dinámicas -la Web 2.0-, y se han planteado alternativas más ambiciosas como la Web 3.0 y Web semántica[8]. En otras palabras, los teóricos del hipertexto tomaron Internet y el hipertexto como una tecnología acabada y perfecta ajena al devenir histórico y al progreso.

Con todo, lo que me interesa aquí no es tanto la exactitud y la pericia técnica de los investigadores como las analogías y los lugares comunes, es decir, las formas en que la mayoría de humanistas ha interpretado la tecnología digital. Antonio R. de las Heras es posiblemente uno de los humanistas que más ha reflexionado al respecto; en “Hipertexto y libro electrónico” (1997) este investigador distingue acertadamente entre “hiperdocumento”, cuando el enlace se da entre textos distintos, e “hipertexto”, cuando el enlace revela fragmentos que pertenecen a un solo documento. Entre las imágenes y metáforas que este humanista ha utilizado se cuentan las del “pliegue” para referirse al enlace, la del “bucle” para referirse a los bloques de información -“lexías” de George P. Landow (1992)-, y por último la comparación del hipertexto con un ejercicio de papiroflexia que tiene como resultado una pajarita:

Es importante apreciar la oportunidad del término plegar para denominar esta tarea hipertextual. Porque, de la misma manera que la papiroflexia trabaja con una hoja de papel sin cortarla, solo la pliega, el hipertexto nos ofrece un texto plegado, no un conjunto de textos hilvanados por medios informáticos. De ahí que la lectura de un libro electrónico despliega un discurso más o menos extenso, no una sarta de fragmentos textuales. Y éste es el principal esfuerzo -creativo, constructivo, imaginativo- para el autor de un libro electrónico. (R. de las Heras, 1997: 90)

Como muchos otros investigadores, Antonio R. de las Heras destaca el carácter inacabado del hipertexto en tanto que el autor siempre puede actualizar, quitar, añadir o modificar los “bucles”. El libro electrónico se erige, así, como un “libro poliédrico” (R. de las Heras, 1997: 90).

Para José Antonio Millán (1999: 152), al menos en “Estaciones filológicas”, el hipertexto es el aspecto más innovador de la lectura en pantalla aunque reconoce que es deudor de las técnicas de referencia del códice. Aunque este apartado no es lugar para hablar de las ediciones críticas, creo importante citar cómo este investigador describe la lectura hipertextual y sus aspectos positivos para el estudio de los clásicos:

Supongamos una obra: La vida de Lazarillo de Tormes. Nos aparece en la pantalla la imagen de la primera página de un ejemplar. Al lado, el texto de la leyenda “Prólogo” y el comienzo: “Yo por bien tengo que cosas tan señaladas, y por ventura nunca oídas ni vistas, vengan a noticia de muchos y no se entierren en la sepultura del olvido”. La palabra “Prólogo” está de color rojo, lo que nos indica que tiene una nota del editor. Hacemos clic sobre ella, y aparece una nueva ventana: “Sobre el Prólogo puede consultarse S. Gilman (1966), F. Lázaro (1969),…”. Los dos nombres están también en color. Hacemos clic sobre “Gilman” y nos aparece en otra ventana la ficha bibliográfica completa: “Gilman, S., The Death of Lazarillo de Tormes, Publications of the Modern Language Association of America,…”. Un icono que representa una página indica que el texto está disponible. Hacemos clic en él, y surge otra ventana con el artículo. Lo leemos y volvemos al texto principal. Nos llama la atención “cosas”, y queremos consultar la palabra en el Tesoro de la Lengua Castellana de Covarrubias. Pulsamos con el botón derecho del ratón y aparece una nueva ventana (por supuesto, el programa sabe que “cosas” es un plural): “COSA. Quasi quodsa: del nombre quis vel quid, etc. Todo lo que tiene entidad llamamos cosa”. Esto nos da una idea para un comentario, y creamos sobre la palabra del texto del Lazarillo un tipo especial de anotación privada: “cosas” aparecerá de color verde. En total, hemos dado seis saltos hipertextuales, que nos han relacionado fácilmente elementos heterogéneos. Varios de ellos estaban predeterminados (los enlaces imagen-texto, texto-nota, nota-bibliografía y bibliografía-texto); otro activa un programa de consulta a una base de datos (el Tesoro de Covarrubias) y el último crea un enlace nuevo (a una anotación privada). (Millán, 1999: 152)

Dos años más tarde, en “Internet y la edición crítica de textos”, Guillermo Serés (2002: 17) se lamenta del “poco uso que se hace de las posibilidades que el llamado hipertexto ofrece a la edición y estudio”; y Joan Torruella (2002: 23) afirma en “Los diccionarios en la red” que el soporte natural de las obras de lexicografía es el informático porque requieren lecturas fragmentadas, accesos por múltiples puntos y una hipertextualidad muy completa.

De 2003 es “Literatura hipertextual y teoría literaria”, un importante trabajo de María José Vega por varios motivos: en primer lugar, porque compara el hipertexto con la biblioteca o el archivo en lugar de con el libro. La preferencia de la autora radica en que el hipertexto es un sistema complejo y potencialmente infinito capaz de custodiar, disponer y obtener información a gran escala; en segundo lugar, por su revisión de la definición tradicional del hipertexto basada en la escritura no secuencial y en la interrelación textual; para María José Vega tales propiedades no son específicas del hipertexto, pues existen ejemplos en formato impreso como las ediciones anotadas con aparatos críticos o las simples notas a pie de página que distribuyen los bloques de información de manera cruzada siguiendo una secuencia múltiple. Por último, porque apela a la historia del libro para entender la verdadera naturaleza de la tecnología digital:

Estas reflexiones no quieren conducir a la conclusión fácil, y falaz, de que todo está ya previsto o es posible con la tecnología de la imprenta, sino a la observación de que las definiciones más comunes del hipertexto son insuficientes porque, al juzgarlo y describirlo comparativamente con las formas anteriores de disposición de la escritura, simplifican extraordinariamente las posibilidades de los formatos que se derivan de la imprenta. No son pues definiciones que ignoren la naturaleza del hipertexto, sino que trivializan la historia del libro, y, por tanto, subrayan y celebran aspectos presuntamente diferenciales o novedosos que no son realmente tales. (Vega, 2003)

En cuanto a la literatura hipertextual, pueden encontrarse precedentes en formato impreso en la obra de Sterne, Borges, Cortázar, Calvino, Robbe-Grillet, Nabokov, Queneau… La investigadora de la Universitat Autònoma de Barcelona reivindica la validez de la linealidad de las obras impresas al mismo tiempo que reconoce la importancia de las estructuras abiertas y las combinatorias experimentales, pero en su justa medida, sin olvidar que “de las muchas tramas posibles, el lector hipertextual lee linealmente solo una”. La supuesta novedad de la poesía visual también debe ponerse en cuarentena, pues los anagramas, los laberintos y los poemas caligráficos tienen una historia antiquísima. Acaso, para esta investigadora, lo que realmente resulte novedoso sea la gran capacidad de almacenaje del ordenador y la posibilidad de integrar una tercera dimensión a los artefactos literarios: el movimiento y el tiempo.

Un año más tarde, en un capítulo de La vieja diosa, Joaquín Rubio Tovar (2004) niega la novedad de la lectura hipertextual utilizando el argumento contrario al esgrimido por María José Vega; la continuidad entre libro impreso y libro electrónico se fundamenta no en la lectura lineal sino en la lectura no secuencial en ambos formatos:

Permítaseme recordar que, desde siempre, leer un libro no es sólo leer ese libro. Una de las más hondas potencias del hombre es la capacidad que le hace trascender el ejemplar físico que está leyendo. Ni ante la pantalla de ordenador ni ante un volumen encuadernado leemos solo lo que tenemos delante. Releemos libros que leímos antes y quizá estemos intuyendo libros que leeremos en el futuro. Esta capacidad va mucho más allá de las navegaciones cibernéticas. (Rubio Tovar, 2004: 261)

Posteriormente se han publicado más trabajos sobre el tema. Laura Borràs (2004) conectó el hipertexto y el e-learning con las teorías de las lecturas de Gadamer, Jauss e Iser en “De la estética de la recepción a la estética de la interactividad”; el mismo año Domingo Sánchez-Mesa (2004) recogió un ramillete de trabajos de procedencia anglosajona en Literatura y cibercultura y Susana Pajares Tosca (2004) se ocupó de las nuevas formas de narrar en Literatura digital: el paradigma hipertextual. De 2005 es el volumen Textualidades electrónicas: nuevos escenarios para la literatura con contribuciones de investigadores internacionales al cuidado de Laura Borràs (2005). Un año más tarde vio la luz Teoría del hipertexto editado por Vilariño y Abuin (2006), quienes recogieron traducciones de George P. Landow, Stuart Moulthrop, Espen Aarseth, Michael Joyce y Jay David Bolter. De 2006 también es Escrituras nómadas: del libro al hipertexto de Belén Gache (2006). Romero López y Sanz Cabrerizo (2008) editaron Literaturas del texto al hipermedia, que contó con la presencia de investigadores internacionales como George P. Landow y Steven Tötösy de Zepetnek y nacionales como José Manuel Lucía Megías, Laura Borràs, Susana Pajares Tosca o Domingo Sánchez-Mesa. Por último, conviene mencionar el reciente Narrativas transmedia de Carlos A. Scolari (2013).

Pese a la abundancia de referencias bibliográficas, desde la consolidación de las redes sociales, el interés por el hipertexto ha sido desplazado por otros fenómenos como la participación en comunidades online y la escritura en blogs y wikis, tal y como pone en evidencia la publicación en 2006 de dos títulos como La blogosfera hispana: pioneros de la cultura digital, a cargo José M. Cerezo, o Pangea. Internet, blogs y comunicación en un nuevo mundo de Vicente Luis Mora. La Web 2.0, en la que el usuario interviene como productor de contenidos y no únicamente como receptor, ha modificado qué entendemos por interactividad; además, ha servido para relativizar las virtudes liberadoras[9] atribuidas al hipertexto y para poner en evidencia que los saltos hipertextuales a menudo dificultan la lectura. La interactividad y la conexión hoy no se establecen entre textos y documentos alojados en distintos servidores sino entre personas que participan y colaboran en distintas comunidades. Es deseable por tanto que el humanista salga de la cárcel textual, dirija su mirada hacia la interacción entre los actores sociales y analice sus prácticas culturales.

3. Ediciones, archivos, bibliotecas y corpus digitales

Una vez más la abundancia de proyectos y de referencias bibliográficas sobre éstos o sobre cuestiones afines a la digitalización del patrimonio bibliográfico impone la selección. Para una mayor comodidad he estructurado la información en dos bloques: 1986-1996 y 1997-2005; pero no creo que se pueda atribuir a cada uno una etiqueta definitoria y unificadora.

Aunque he intentado incluir cuantas más referencias posibles con el objetivo de proporcionar una visión plural de la materia, un primer criterio de selección ha sido el tipo de objeto digital: me he ceñido a los textos literarios -con especial atención a los medievales y áureos- y he dejado de lado los proyectos sobre imágenes como, por ejemplo, el Banco de imágenes del Quijote[10]. Tampoco he reseñado en esta sección las tempranas contribuciones en forma de catálogos y repertorios de Sagrario López Poza sobre literatura emblemática, relaciones y polianteas <http://www.bidiso.es/index.htm>; ni he tenido en cuenta la creación de valiosas bases de datos bibliográficas como PhiloBiblon <http://bancroft.berkeley.edu/philobiblon/> o la Bibliografía de la Literatura Española desde 1980 <http://ble.chadwyck.co.uk/>. Sirvan, pues, estas menciones a modo de reconocimiento y justificación.

Otro criterio de organización ha sido dar igual preferencia a proyectos y a referencias bibliográficas, es decir, considerar tanto lo que se ha hecho, lo que se ha publicado en CD-ROM y en Internet, como los asuntos sobre los que se ha hablado, que son muchos. En cuanto a las publicaciones he puesto más atención a los artículos de revista y a las contribuciones como capítulos de libro que a libros enteros, por dos razones: porque debido a su brevedad el artículo es más fácil de reseñar y porque a menudo los artículos nacen primero y luego se revisan y se vuelven a publicar en forma de libro. Así, por ejemplo, he comentado las aportaciones de Francisco Marcos Marín en revistas como Incipit o Hispania pero apenas me he detenido en sus libros más tardíos; lo mismo ocurre con la producción de José Manuel Lucía Megías y otros autores.

En cuanto a la lengua y nacionalidad, me he centrado en la bibliografía en lengua española -lo que no quiere decir que no se mencionen algunos trabajos en inglés-; por último he intentado dar cabida a proyectos radicados en otros países sobre patrimonio español como El Proyecto Cervantes 2001.

3.1. 1986-1996

El primer testimonio de la confluencia entre las humanidades españolas y la informática se produce con toda probabilidad fuera de España, en el noveno congreso de la AIH celebrado en Berlín del 18 al 21 de agosto de 1986. Charles B. Faulhaber (University California-Berkeley) y Francisco Marcos Marín (Universidad Autónoma de Madrid) coordinaron una reunión de interesados sobre el tema, a la que acudieron una veintena de personas.

Como ya se ha dicho más arriba las actas de la reunión fueron publicadas por el primer convocante el mismo año en la revista Incipit con el título “Hispanismo e informática”; allí se recogen los principales puntos de la discusión. Algunas de las preocupaciones discutidas hoy pueden parecer superadas. Por ejemplo, qué tipo de ordenadores era posible encontrar en la época -sistema centralizado o microordenador-, si es necesario recibir formación para su uso o bien contratar personal técnico, qué software puede facilitar la automatización de las tareas de los humanistas -procesador de textos, hojas de cálculo y bases de datos-, cómo funcionan las impresoras y escáneres láser, o cuáles son los principales dispositivos de almacenaje —cintas magnéticas, disquetes, CD-ROM—.

Otras cuestiones, en cambio, se siguen planteando en la actualidad: la necesidad de trabajar con estándares -de hecho el investigador de Berkeley menciona la reciente creación del SGML-, la existencia de programas para analizar textos y recuperar información -se alude, por ejemplo, al Oxford Concordance Package-, y el modo en que la investigación se organiza internacionalmente mediante asociaciones, congresos y revistas -Faulhaber menciona la Association for Computers and the Humanities, la Association for Literary and Linguistic Computing y la revista Literary and Linguistic Computing-. La conclusión a la que llega el hispanista también sigue siendo vigente en muchos sentidos, aunque por supuesto se han producido muchos avances al respecto:

En el campo de lo estrictamente hispánico lo que más hace falta, el sine qua non, son textos originales en forma electrónica. Y al principio estos textos deben ser transcripciones rigurosas de las fuentes primarias, manuscritos y ediciones antiguas, al estilo del Seminario de Madison. ¿Por qué? Por dos razones: (1) es urgentísima la necesidad de conservar estos textos en la forma más permanente posible, de pasarlos de papel o la emulsión fotográfica a medios electrónicos, previendo la posible destrucción del objeto material irreemplazable; (2) transcripciones fidedignas de los manuscritos y ediciones originales forman la base de cualquier estudio posterior, ya de tipo textual ya de tipo analítico. Luego que tengamos estos textos podemos dedicarnos a elaboraciones posteriores de todo tipo. (Faulhaber, 1986: 169)[11]

El artículo finaliza con la predicción de que en el año 2000 no se imprimirán más catálogos ni bibliografías. Aunque no declara la muerte del libro impreso para inicios del nuevo milenio Faulhaber se muestra optimista sobre la existencia en forma electrónica de facsímiles y transcripciones de manuscritos con el objetivo de poner al “alcance del mundo erudito entero recursos accesibles ahora sólo a los pocos afortunados que viven al lado de las grandes bibliotecas nacionales” (Faulhaber, 1986: 170).

Francisco A. Marcos Marín, el segundo convocante, publica en 1986 “Metodología informática para la edición de textos” en la revista Incipit y un año más tarde “Metodología informática para la edición y crítica de textos” en Hispania, así como la edición unificada de El libro de Alexandre en Alianza, que contiene un apartado explicativo titulado “Filología e informática”. Todos estos trabajos se centran en el uso del software UNITE para automatizar el proceso de comparación de distintos testimonios -la collatio de Carl Lachmann- y la obtención de una versión unificada. El proceso de comparación de los testimonios ha sido explicado por el autor en varias ocasiones y puede resumirse en las siguientes fases: por un lado, el editor debe enumerar y separar las estrofas; por el otro, UNITE se encarga de comparar el texto verso por verso y de elegir la lectura adecuada -o unir varias- siguiendo parámetros estadísticos. Tras esto se obtiene un archivo con la versión unificada y otros ficheros con resúmenes de las acciones tomadas y con las variantes.

El uso del ordenador que propone Francisco A. Marcos Marín merece algunas aclaraciones. En primer lugar, conviene señalar que está determinado por el tipo de texto con el que el investigador trabajaba, esto es, textos medievales que se han transmitidos en varias copias manuscritas, así como por la metodología propia de la estemática. El editor que sigue los principios de Carl Lachmann necesita comparar palabra por palabra con el objetivo de reconstruir el arquetipo; es por eso que el ordenador puede utilizarse como un siervo para realizar con gran precisión tareas mecánicas y repetitivas. En segundo lugar, UNITE solo puede procesar textos poéticos porque la unidad de comparación es la estrofa: el editor no estructura el texto según su contenido mediante lenguaje de marcado sino de manera tipográfica respetando escrupulosamente los blancos entre estrofa y estrofa. Esto quiere decir que no es posible automatizar el cotejo de prosa u otros tipos de textos. Si bien la decisión de no se separar el contenido de su presentación puede justificarse porque el desarrollo del SGML era muy prematuro y la Text Encoding Initiative (TEI)[12] aún no había publicado sus recomendaciones, el método de codificación electrónica propuesto por Francisco A. Marcos Marín implica un error de cálculo a largo plazo porque no asegura la interoperabilidad ni la preservación de la información. Por último, no hay que olvidar que el resultado de la comparación con UNITE no es una edición en formato electrónico sino un libro impreso.

En 1992 Charles B. Faulhaber y Francisco Marcos Marín publican en la revista Hispania “La conservación y utilización de textos en el futuro inmediato: ADMYTE, el archivo digital de manuscritos y textos españoles”. En este artículo los autores afirman que la digitalización es un mecanismo de preservación del patrimonio cultural y un instrumento de trabajo siempre y cuando se lleve a cabo con rigor científico. Pero el objetivo principal es presentar ADMYTE, una colección de tres CD-ROMs en la que colaboraron varias universidades (Universidad Autónoma de Madrid y Complutense de Madrid, Universidad de Berkeley, Wisconsin y Toronto), diversas bibliotecas nacionales (la Biblioteca Nacional de España, entre otras), la Sociedad Estatal para la Ejecución de Programas del Quinto Centenario, la National Endowment for the Humanities y la empresa MICRONET, S. A. (Faulhaber, 1992: 1010). Los autores destacan que ADMYTE es “un proyecto basado en la lengua española, pero realizado por un equipo internacional e interdisciplinario, en la medida de lo necesario” (Faulhaber, 1992: 1011) y afirman que con él “España será precursora en el uso de la tecnología que no tardarán en aplicar los estudiosos de otras lenguas y períodos históricos” (Faulhaber, 1992: 1012).

El contenido del CD 0 de ADMYTE es el siguiente: en primer lugar, un catálogo general de fuentes primarias -impresas y manuscritas- de textos españoles medievales, la Bibliografía Española de Textos Antiguos (BETA/BOOST), que realizó la Universidad de California y la Complutense de Madrid; en segundo lugar, el Diccionario del Español Antiguo (DOSL), originalmente basado en las obras de Alfonso X a cargo del Hispanic Seminary of Medieval Studies de la Universidad de Madison; en tercer lugar, un programa de recuperación textual que permite seleccionar palabras para construir concordancias e índices referenciales, así como realizar búsquedas complejas, el TACT, ideado por John Bradley en el Centre for Computing in the Humanities de la Universidad de Toronto; en cuarto lugar, la Colección de Textos Medievales cedidos por el Hispanic Seminary of Medieval Studies; por último, el programa UNITE desarrollado por Francisco Marcos Marín para automatizar la producción de ediciones unificadas (Faulhaber, 1992: 1011). Los otros dos discos (1 y 2) contienen los textos transcritos en código ASCII, las imágenes digitalizadas de los manuscritos (facsímiles en blanco y negro y reproducción en color de miniaturas) y un programa diseñado por MICRONET, llamado CLARITY-CD, que permite recuperar índices de palabras e imágenes en alta resolución para guardarlas en formato TIFF en el ordenador del usuario o imprimir los documentos mediante una impresora doméstica (Faulhaber, 1992: 1011).

Sobre la relevancia del proyecto hay que admitir que ADMYTE se convirtió en una referencia para todos los interesados en la digitalización de imágenes y textos, no solo por su envergadura y ambición sino también porque en él colaboraron numerosas entidades, públicas y privadas, de distintos países. ADMYTE ha tenido una segunda vida online desde 2002 a cargo de la empresa MICRONET y su contenido es accesible mediante suscripción <http://www.admyte.com/suscrip.htm>.

En 1994 apareció en la editorial Gredos Informática y Humanidades. En este libro Francisco A. Marcos Marín trata asuntos básicos como el funcionamiento del ordenador, el almacenaje en CD-ROM o el uso del correo electrónico y profundiza en cuestiones ya reseñadas aquí, como la creación de ADMYTE, el funcionamiento de UNITE o el potencial analítico de TUSTEP y TACT. El libro también contiene nuevo material, como las páginas dedicadas a PhiloBiblon, y se hace eco de las recomendaciones de la TEI y de la codificación SGML. Dos años más tarde, en El comentario filológico con apoyo informático el mismo autor (Marcos Marín, 1996) actualiza muchos de estos temas en los dos primeros capítulos del libro y luego demuestra en el resto cómo se puede utilizar herramientas digitales para releer tanto las jarchas mozárabes y el Libro de Alexandre como la obra de autores más modernos, en concreto la de Borges y Unamuno.

También de 1996 es La edición electrónica y multimedia / Electronic and Multimedia Publishing de José Antonio Millán. En este conciso libro el desarrollador de la versión electrónica en CD-ROM del Diccionario de la Lengua (1995) trata varios aspectos de la edición digital, desde los tipos de ordenador (MAC y PC) y los medios de almacenamiento —disquete, CD-ROM…— disponibles en la época en que fue escrito el libro, pasando por algunas ideas esenciales —enlace, concordancias, búsquedas booleanas, multimedia—, hasta varias páginas dedicadas a las particularidades de las enciclopedias y los diccionarios. La parte final se centra en algunos cambios del modelo de la industria editorial (por ejemplo, en los derechos de autor y la piratería) y en las posibilidades de negocio que Internet brinda al editor. El libro incluye un pequeño glosario y varias láminas en color seguidas por la traducción inglesa del texto.

3.2. 1997-2005

En 1997 se publica tanto en CD-ROM como en Internet el Teatro del Siglo de Oro (TESO) a cargo de María del Carmen Simón Palmer en colaboración con la empresa Chadwyck Healey <http://teso.chadwyck.com/>. El TESO es probablemente el primer proyecto de digitalización español que utiliza lenguaje de marcado para reproducir las obras completas de dieciséis autores de los siglos XVI y XVII como Miguel de Cervantes, Lope de Vega, Calderón de la Barca o Francisco de Rojas Zorrilla.

Tal y como explica María del Carmen Simón Palmer en su contribución al libro Literatura y multimedia, la conversión a soporte electrónico se realiza a través de un doble proceso de tecleado por diferentes personas y un programa de filtrado posterior que elimina los posibles errores de transcripción (Simón Palmer, 1997: 320). El sistema de codificación elegido es SGML (Standard Generalized Mark-up Language) pero me es imposible afirmar si sigue las recomendaciones de la TEI a partir de la información que aporta la editora en dicho trabajo (Simón Palmer, 1997: 320). En cuanto a los criterios editoriales, los textos contenidos en TESO son una transcripción paleográfica porque reproducen los signos que aparecen en el original sin modernizar a la grafía actual (Simón Palmer, 1997: 320); en su mayoría corresponden a las primeras ediciones y proceden de la Biblioteca Nacional de España.

TESO no solo proporciona acceso completo a los textos y permite imprimirlos; también ofrece la posibilidad de realizar búsquedas complejas por palabras clave (combinadas o no), personajes y géneros (auto sacramental, coloquio, comedia, entremés, paso, sainete, tragedia). Además, las opciones de búsqueda se pueden limitar a algunos elementos particulares de las obras como los preliminares, los títulos, las acotaciones, etc. (Simón Palmer, 1997: 322-323).

En 1998 el Instituto Cervantes publica la edición de Francisco Rico de Don Quijote de La Mancha. Tanto ésta como la edición de 2004 van acompañadas de un CD-ROM con el texto informático, el vocabulario, las concordancias, una base de datos lingüísticos y el programa Data Base Testuale (DBT) al cuidado de Joan Torruella. Tal y como este investigador ha explicado posteriormente (2008), DBT fue diseñado por Eugenio Picci del CNR de Pisa y el Seminario de Filología e informática de la Universitat Autònoma de Barcelona se encargó de su adaptación al español. El programa facilita el análisis de textos literarios mediante la obtención de concordancias. Así, es posible estudiar el léxico y el estilo pero también analiza aspectos sociales e históricos de la época (Torruella, 2008: 12). Por último, DBT resulta útil porque visualiza la distribución de dichas frecuencias a lo largo del texto (partes, capítulos, cuadernos, pliegos, etc.) (Torruella, 2008: 15).

Por las mismas fechas y en paralelo la misma obra cervantina centra los esfuerzos de otro equipo de investigación de la Texas A&M University. La Edición Electrónica Virtual Variorum del Quijote (EEVV-DQ) dios sus primeros pasos en 1998 gracias a Eduardo Urbina, Richard Furuta y Shueh-Cheng Hu <http://quijote.tamu.edu/index.htm>. La edición se enmarca en un proyecto más amplio, que incluye la publicación de una revista y un boletín, conocido como Proyecto Cervantes 2001. A cinco años del cuarto centenario de la publicación de la obra cervantina, los investigadores mencionados se propusieron “ensayar un nuevo arte de editar textos en este tiempo” (Urbina et al.: 1999). El resultado permite al lector cotejar distintos ejemplares de la edición princeps junto con otras ediciones posteriores, visualizar transcripción y facsímil en ventanas paralelas y crear su propia edición del Quijote a partir de los materiales proporcionados. Para ello se escanearon los microfilms de las ediciones, que se procesaron para mejorar su calidad; se transcribieron los textos y se automatizó el cotejo y la visualización sincronizada de las distintas ediciones. Aunque el planteamiento resulta atractivo porque al acceso se añade la manipulación de los textos, como la mayoría de proyectos durante los años noventa, EEVV-DQ utilizó HTML para codificar y publicar sus contenidos; en consecuencia, la información depende del software y, al no utilizar un estándar, la comunicación con otros proyectos se vuelve más difícil.

También en 1998 aparece en la revista Incipit “Editar en Internet (che quanto piace il mondo è breve sogno)” de José Manuel Lucía Megías. En este trabajo el profesor de la Universidad Complutense de Madrid repasa los distintos tipos de edición, desde la edición diplomática, pasando por la edición sinóptica integral (que presenta la transcripción de todos los testimonios) y por la edición interactiva[13], hasta la edición crítica, aquella que permite al lector comprender la génesis y la transmisión de la obra (Lucía Megías, 1998: 9); asimismo, recupera el concepto de “hiperedición”, que ya había utilizado Charles B. Faulhaber en 1991, para describir el tipo de edición que no solo permite acceder al texto sino que aprovecha las posibilidades el hipertexto para tejer una red de relaciones y correspondencias entre texto crítico y variantes, testimonios, imágenes u otros documentos orales. José Manuel Lucía Megías comenta algunos proyectos internacionales (Project Gutenberg <http://www.gutenberg.org>, Alexandria Digital Library <http://www.alexandria.ucsb.edu>), franceses (ABU: La Bibliothèque Universelle <http://abu.cnam.fr> ) e italianos (Progetto Manuzio <http://www.liberliber.it/progetti/manuzio>, Duecento <http://www.silab.it/frox/200> y, más tarde, Digital Variants <http://www.digitalvariants.org>), y luego traslada su atención hacia el panorama en lengua española. Los proyectos destacados son: el Proyecto Cervantes 2001 creado por Eduardo Urbina y Richard Furuta, del que ya se ha dicho suficiente, el Proyecto COMEDIA <http://www.comedias.org/AHCT/AHCT/Welcome.html> ideado por la Association for Hispanic Classical Theater, el CD-ROM The Electronic Texts and Concordances of the Prose Works of Alfonso X, el Sabio <http://www.indiana.edu/~letrs/text-tools/alfonso.html>, editado por The Hispanic Seminary of Medieval Studies de Madison, y finalmente, LEMIR <http://parnaseo.uv.es/lemir.htm> a cargo de José Luis Canet, Marta Haro y Rafael Beltrán de la Universidad de Valencia, que dos años más tarde comenzaría a publicar en formato PDF numerosos textos medievales y renacentistas.

Para José Manuel Lucía Megías Internet puede ser utilizado de dos maneras, bien como almacén y medio de difusión, bien como herramienta de análisis; por eso distingue entre la mera acumulación de objetos digitales y la construcción de una infraestructura que, por un lado, contenga concordancias e índices de frecuencias, y por otro, ofrezca al lector una serie de materiales interrelacionados (Lucía Megías, 1998: 35). Las “bibliotecas telemáticas”, concluye, deberían cumplir ambas misiones[14].

Un año más tarde, en 1999, el investigador de la Universidad Autónoma de Madrid Fernando Sánchez, junto con otros nueve investigadores de la Real Academia Española, presentaron en “La anotación de los corpus CREA y CORDE” sus objetivos y el desarrollo de una iniciativa que empezó en 1995 y vio la luz cinco años más tarde. Como es bien sabido, el Corpus Diacrónico del Español (CORDE <http://corpus.rae.es/cordenet.html>) se estructura en tres grandes épocas (Edad Media, Siglos de Oro y Época contemporánea) mientras que el Corpus de Referencia del Español Actual (CREA <http://corpus.rae.es/creanet.html>) abarca los últimos veinticinco años. Juntos suman más de 200 millones de palabras recogidas tanto en territorio peninsular como latinoamericano. Los textos fueron codificados con SGML siguiendo las recomendaciones de la TEI (Sánchez et al., 1999)[15]. Si a estos dos corpus añadimos el Corpus del Español <http://www.corpusdelespanol.org/x.asp> creado por Mark Davis en 2002 no resulta arriesgado afirmar que los hispanistas disponen de tres útiles herramientas para conocer en profundidad la lengua española.

Siguiendo con la temática de los corpus, también en 1999, Joan Torruella y Joaquim Llisterri publican “Diseño de corpus textuales y orales” en el libro colectivo Filología e informática. Los principios y las utilidades de los corpus pueden sintetizarse de la siguiente manera:

La función principal de un corpus, tanto textual como oral, es establecer la relación entre la teoría y los datos; el corpus tiene que mostrar a pequeña escala cómo funciona una lengua natural; pero para ello es necesario que esté diseñado correctamente sobre unas bases estadísticas apropiadas que aseguren que el resultado sea efectivamente el modelo de la realidad. (Torruella, 1999: 45-46)

Es necesario, por tanto, que el corpus sea neutro, que recoja muestras proporcionales de todos sus aspectos y, para que sea rentable, que pueda reutilizarse y modificarse en el futuro. Tras distinguir las principales áreas de aplicación de la lingüística de corpus, los autores distinguen según un orden ascendiente de estructuración y selección entre archivo, biblioteca y corpus informatizado (Torruella, 1999: 51). A continuación ofrecen una clasificación basada en cuatro criterios: 1) el porcentaje y la distribución de los diferentes tipos de texto (corpus grande, equilibrado, piramidal, monitor, paralelo, comparables, multilingües, oportunista); 2) la especificidad de los textos (corpus general, especializado, genérico, canónico, periódico, diacrónico); 3) la codificación y la anotación (simple o codificado); y 4) la documentación que acompaña (documentado o no) (Torruella, 1999: 53-55). Por último describen algunos aspectos generales como la finalidad, los límites y el tipo de corpus, la proporción de los diferentes grupos temáticos, las nociones de población y muestra, la captura de los textos y su etiquetado, su procesamiento informático y varias cuestiones legales (Torruella, 1999: 59-67).

El que quizá sea el primer trabajo en español dedicado a la codificación de textos con lenguaje de marcado aparece en Filología e informática y pertenece a Gerardo Arrarte (1999). Se trata de “Normas y estándares para la codificación de textos y para la ingeniería lingüística”. El investigador del Instituto Cervantes pone el énfasis en el uso del estándar SGML para preservar la información e intercambiarla o reutilizarla en el futuro, y se aproxima desde un punto de vista histórico a iniciativas como la TEI (Arrarte, 1999: 17-20). Aunque en la actualidad XML ha sustituido a SGML, pocos trabajos en lengua española se han escrito con posterioridad que ofrezcan una visión tan completa sobre la codificación electrónica.

La reflexión sobre las posibilidades de la edición digital sigue su curso en paralelo. En “Estaciones filológicas”, aparecido también en Filología e informática, Juan Antonio Millán (1999: 146) defiende el uso de estándares y de lenguaje de marcado para etiquetar los textos y la necesidad de crear herramientas como TACT que permitan recuperar información textual y crear concordancias (Millán, 1999: 148). Todo ello debería estar integrado en una misma infraestructura digital, la “estación filológica”:

Todos los datos implicados hasta ahora deben poder estar en comunicación, y se deben poder presentar en forma accesible, incluso simultáneamente. Los sistemas de ventanas permiten la presencia simultánea de -por ejemplo- la imagen de una obra, la transcripción de su texto, el texto de un artículo sobre el tema, un diccionario de consulta y el procesador de textos donde se realizan las anotaciones que conducen al resultado. (Millán, 1999: 151)

Por su parte, María Morrás (1999) interviene en el mismo volumen con “Informática y crítica textual: realidades y deseos”. La investigadora de la Universitat Pompeu Fabra se ocupa de algunas cuestiones ya recogidas más arriba, como el uso de programas informáticos para cotejar y afiliar textos, pero también de otros asuntos que aún no han aparecido, como las innovaciones teóricas que la tecnología digital ha alentado en el plano de la edición académica:

Un examen superficial de las publicaciones de los últimos años deja ver una profunda insatisfacción con el concepto tradicional de edición crítica, entendida como la producción de un texto singular a partir de la selección de las lecciones extraídas de los distintos testimonios o del juicio crítico del editor. Desde posturas teóricas diferentes, incluso contrarias, se han puesto de relieve las carencias de la labor editorial que, salvo casos de imposibilidad por existir dos o más versiones muy alejadas entre sí de una misma obra literaria, lleva a construir un texto, que sin haber existido en ningún momento, representa el texto ideal. (Morrás, 1999: 192)

En efecto, si algo caracteriza a la teoría editorial a finales del siglo XX es la diversidad de planteamientos teóricos y metas; así, a la crítica neolachmanniana, hay que sumar los principios de la crítica documental, de la bibliografía material o de la crítica genética; estas corrientes se han aliado con la informática para defender la publicación de cada uno de los documentos o versiones, en distintas presentaciones (texto crítico, transcripción paleográfica y facsímil), que integran la historia de la transmisión textual de una determinada obra. El resultado se parecería más a un archivo o a una biblioteca que al tipo de edición al que estamos acostumbrados en papel (Morrás, 1999: 193-195).

También con el cambio de siglo ve la luz el proyecto más ambicioso que se ha realizado hasta la fecha en España, la Biblioteca Virtual Miguel de Cervantes (BVMC <http://www.cervantesvirtual.com>), fruto de la colaboración entre la Universidad de Alicante y el Banco Santander Central Hispano. Sus orígenes se encuentran en 1999 pero no es hasta dos años más tarde que aparecen algunos trabajos en que se explica su desarrollo y funcionamiento[16]. En “The Miguel de Cervantes Digital Library: the Hispanic Voice on the Web”, aparecido en la revista Literary and Linguistic Computing, Alejandro Bia y Andrés Pedreño (2001a) exponen las líneas maestras del proyecto: el tipo de objetos digitales que ofrece (en su mayoría textos literarios de dominio público[17] en lengua española pero no exclusivamente), la composición del equipo de investigadores (129 investigadores de los cuales un 71% se dedica a la corrección de textos y codificación con lenguaje de marcado) y los servicios que presta (publicación digital de tesis doctorales, grabación de lecturas literarias, catálogo de enlaces, foros y, las joyas de la corona, las llamadas “Bibliotecas de autor”) (Bia, 2001a: 163-165).

El diseño de la BVMC está concebido tanto para dar amplio acceso a un gran número de textos como para que sea posible recuperar parte de la información textual (números, nombres y fechas) y, en algunos casos, incluso analizarla (por ejemplo, mediante concordancias basadas en TACT) (Bia, 2001a: 167). No hace falta decir que los textos que contiene la BVMC fueron codificados con XML y siguen las recomendaciones de la TEI (Bia, 2001a: 170-171). Por otra parte, debido al volumen de textos, sus creadores tuvieron que automatizar gran parte de la codificación XML[18] y de la transformación de los archivos resultantes en otros formatos (HTML para su publicación en la web y PDF para su impresión) (Bia, 2001a: 172-174)[19].

La BVMC fue un proyecto pionero a nivel internacional en cuanto a la implantación de estándares a gran escala y por eso hay que reconocer el mérito de sus creadores. Sin embargo, ha recibido críticas por poner el énfasis en la acumulación de textos en lugar del análisis y la interrelación de los contenidos[20]. El paso del tiempo tampoco ha jugado a su favor: por un lado, tras la generalización de los e-readers ofrecer los textos en formato ePub a menudo resulta una necesidad para el lector; por el otro, la Web 2.0 nos ha acostumbrado a un uso y difusión de los textos que entra en conflicto con la protección de la propiedad intelectual[21].

En 2002 se produce el que quizá sea el único intento de regularización de las prácticas editoriales en formato digital. Me refiero a la publicación de la “Norma-recomendación de la Asociación Internacional Siglo de Oro sobre edición de textos electrónicos áureos” a cargo de José Luis Canet (Universidad de Valencia) y Ricardo Serrano (Université du Québec à Trois-Rivières). Tras considerar los aspectos positivos y negativos de la digitalización, los autores proponen las siguientes recomendaciones, que grosso modo siguen la estela de la TEI: 1) que los textos se alojen en los servidores de las universidades para garantizar su preservación; 2) que los editores indiquen información complementaria sobre los textos (nombre del editor, lugar, año de su realización y versión; ediciones manejadas o procedencia; si se trata de una edición crítica o no, si procede de una tesis doctoral, etc.); y 3) que en la cabecera de cada texto se incluya con lenguaje de marcado el título y otros metadatos (autor, palabras clave y descripción del documento) a fin de ser detectados por los motores de búsqueda (Canet, 2002: 1901-1902).

En cuanto a los formatos recomendados para su publicación en Internet los profesores Canet y Serrano recomiendan duplicar los documentos y ofrecerlos al lector en formato HTML, XML y PDF (Canet, 2002: 1904). Otras recomendaciones atañen a la inclusión de imágenes y preliminares. Por último, los autores declaran que “la mejor edición es aquella que incorpora una edición facsimilar del texto y su transcripción” (Canet, 2002: 1905).

En 2002 aparece Literatura románica en Internet: los textos. En él José Manuel Lucía Megías reformula muchas de las ideas expuestas en sus artículos anteriores. El libro es extenso y variado: por un lado, ofrece un recuento de bases de datos y bibliotecas telemáticas en lengua románica (portugués, gallego, castellano, catalán, provenzal, francés, italiano y rumano) y una breve descripción de sus funciones y contenido; por el otro, se ocupa de algunas ediciones individuales que podían hallarse en Internet a principios del siglo XXI. Pero lo que interesa aquí es sin duda el concepto de “edición crítica hipertextual” presentado en la Introducción al libro. Según este investigador, que sigue los preceptos de la crítica neolachmanniana, el hipertexto permite nuevas modalidades de presentación del texto, es decir, afecta de lleno tanto a la constitutio textus como a la dispositio textus porque rompe con la linealidad del códice (Lucía Megías, 2002: 22-24). El modelo ideal de edición crítica hipertextual propuesto en este libro es el siguiente:

El texto crítico ha de considerarse el centro siempre de la edición, en los cimientos sobre los que se levantan otros materiales presentados; en otras palabras, se ofrece una determinada interpretatio textual, que ha utilizado una serie de materiales que ahora se ofrecen para que el lector o pueda contrastar la hipótesis de trabajo concretas que se presentan en la edición, o pueda trabajar con ellos de una manera independiente, poniéndolos en relación con otros materiales de igual naturaleza. A un tiempo se ofrece una lectura contemporánea y científica de un texto medieval (texto crítico) junto a los materiales que forman parte de su post-texto (facsímil de los testimonios conservados, trascripción paleográfica de cada uno de ellos, análisis de los aspectos externos que caracterizan cada testimonio, estudio de las marcas que proporcionan datos de su lectura coetánea). De este modo, la variance, que es más un sistema cultural que textual para comprender el mundo medieval se ofrece en la edición hipertextual de una manera “real”, al contrario de lo que le sucedía a sus lectores (u oidores) coetáneos. Y al mismo tiempo, la edición crítica, como sistema científico antes que cultural para la comprensión del mundo medieval, muestra también su esencial (y particular) mouvance, gracias a las diversas notas textuales, estudios preliminares o interpretaciones críticas que justifican una determinada elección y que pueden ser modificadas. (Lucía Megías, 2002: 27)

Un año más tarde, en “Nuevas posibilidades y nuevas exigencias de la crítica textual”, Pedro Sánchez-Prieto Borja recupera algunas de las ideas de José Manuel Lucía Megías: por un lado, afirma que la mera acumulación de contenidos no es garantía de calidad; por el otro, sitúa al texto crítico en el centro de la red de hipervínculos. El catedrático de la Universidad de Alcalá valora positivamente el acceso simultáneo a las transcripciones de los manuscritos o impresos, a los facsímiles de éstos y las grabaciones de las lecturas orales, pero insiste en que el texto limpio de errores y modernizado debe tener prioridad:

La pantalla básica de la edición electrónica tendría que contener el texto crítico como centro, y simultáneamente tres de información que constituyen el soporte fundamental de la “lectura asistida”: las notas léxicas, el aparato de variantes textuales y el de variantes de la lengua. La información que muestren estas ventanas debería “actualizarse” automáticamente a medida que nos movamos en el texto crítico, de modo que al visualizar una determinada porción del texto se nos muestren en las ventanas de notas léxicas, variantes textuales y variantes de la lengua las entradas correspondientes a esa porción del texto. [...] En segundo plano debería mantener otra información; primero, el facsímil de uno de los testimonios, manuscrito o impreso. El grado de articulación con el texto crítico queda justificado como ilustración de una de las manifestaciones concretas de la obra. Representa, como se ha dicho, una importante fuente de información textual, pero no constituye el texto, fundado críticamente en el examen de toda la tradición. En segundo lugar, la versión oral. (Sánchez-Prieto, 2003: 124)

Otras publicaciones interesantes vieron la luz en 2003. Por ejemplo, el tercer volumen de la revista Lamusa digital cuenta con varios artículos sobre edición académica digital. Por su parte, José Manuel Lucía Megías vuelve a publicar un importante trabajo en 2003 titulado “La ‘Informática Humanística’: notas volanderas desde el ámbito hispánico”. El catedrático de la Universidad Complutense de Madrid alude de manera explícita a las Humanities Computing anglosajonas, utiliza el membrete “Informática Humanística” para designar en español a la nueva disciplina y localiza sus orígenes en el celebre proyecto de Roberto Busa sobre la obra de santo Tomás de Aquino. Para este investigador la situación española es alarmante porque apenas ha tenido cabida en la enseñanza universitaria, a excepción de una asignatura impartida en la Universidad de Deusto por Carmen Isasi y Joseba Abaitua llamada “Lenguas Modernas y Nuevas Tecnologías de la Información” (Lucía Megías, 2003: 94). En cuanto a la investigación científica, José Manuel Lucía Megías destaca algunos proyectos enmarcados en lo que llama “Informática Textual” como PhiloBiblon, Parnaseo <http://parnaseo.uv.es/>, ADMYTE o el CORDE.

En estos años también surgen otros proyectos interesantes para la edición digital, como la red CHARTA, que ha establecido una metodología común para la edición de textos y la creación de corpus documentales en transcripción paleográfica, crítica y facsimilar <http://www.charta.es/nosotros/>[22].

Como broche para terminar esta sección he elegido “Bibliotecas digitales españolas a texto completo” de José Luis Canet (2005). En este trabajo el catedrático de la Universitat de València destaca que los primeros proyectos de digitalización se conformaban con dar acceso a los textos en formato HTML y en ocasiones explotaban los recursos multimedia y las posibilidades relacionales del hipertexto. Ahora bien, muchos de estos proyectos no pueden considerarse verdaderas bibliotecas digitales pues se estructuraban “mediante listados alfabéticos o por afinidades genéricas, sin verdaderas fichas catalográficas o de descripción bibliográfica indicadoras del autor, editor, lugar de publicación, etc.” (Canet, 2005: 150).

A continuación el profesor Canet establece tres tipos de biblioteca digital: en primer lugar, encontramos las Bibliotecas de Divulgación, que solo aspiran a dar acceso a textos digitalizados (Project Gutenberg, Electronic Text Listing[23], ABU: La Bibliothèque Universelle, ATHENA <http://athena.unige.ch/athena/admin/ath_id_en.html>, etc.); en segundo lugar, se sitúan las Bibliotecas de Investigación, “aquellas que intentan aunar el rigor filológico con el temático, agrupando normalmente textos de una o varias áreas de conocimiento” (Canet, 2005: 151), que a su vez pueden dividirse en tres: las que publican textos en formato HTML, XML, SGML o PDF; las que solo publican facsímiles; y las que publican texto y facsímil. Normalmente, afirma Canet, este tipo de bibliotecas digitales están gestionadas por un profesor universitario. Por último, están las Bibliotecas Tradicionales Mixtas, como Gallica <http://gallica.bnf.fr/?lang=ES> o en la actualidad la Biblioteca Nacional de España[24], que han digitalizado parte de sus fondos.

Sobre la situación en suelo peninsular, a la altura de 2005, el profesor Canet destaca la labor de varios proyectos. Como representantes del tipo Biblioteca de Investigación cita a Parnaseo, a la Biblioteca Virtual Extremeña <http://www.paseovirtual.net/biblioteca/> y al Centro Virtual Cervantes del Instituto Cervantes <http://cvc.cervantes.es/> , entre otras. La Biblioteca Virtual Miguel de Cervantes ejemplifica el modelo de la Biblioteca de Divulgación, aunque el autor reconoce que en los últimos años se han realizado algunos progresos orientados a la investigación. En cuanto a las Bibliotecas Tradicionales Mixtas, Canet afirma que son muy escasas en España: Dioscórides de la Universidad Complutense de Madrid <http://biblioteca.ucm.es/atencion/24063.php>, las diversas colecciones de la biblioteca de la Universitat de Barcelona <http://www.bib.ub.edu/es/recursos-informacion/colecciones/colecciones-digitales/> y la Col·lecció Somni de la Universitat de València <http://roderic.uv.es/handle/10550/43> son solo algunos ejemplos. Lo que caracteriza a este tipo de biblioteca es que “los documentos están perfectamente catalogados por profesionales, incluyendo en cada ficha bibliográfica todas las posibilidades de enlaces y búsquedas secundarias, normalmente mediante los enlaces activos” (Canet, 2005: 154).

La ausencia de una verdadera política nacional o autonómica sobre Bibliotecas Digitales Mixtas a texto completo acarrea reduplicaciones y complica su acceso porque las búsquedas deben realizarse en varios sitios (Canet, 2005: 155). Pero éstas no son las únicas debilidades del sistema español: la falta de coordinación dificulta la exportación o transformación del material digitalización, es decir, su preservación y el diálogo entre distintos proyectos, pues la mayoría se ha diseñado de manera autónoma sin contemplar el uso de estándares (Canet, 2005: 156). Finalmente, para paliar el descontrol en lo referente a las publicaciones electrónicas, Canet propone la creación de un registro de textos con una numeración normalizada de localización (algo así como un ISBN para el medio digital). En resumen, para que la situación española mejore, es necesario voluntad política, que podría derivar en un pacto entre ministerios y Comunidades Autónomas. De esta manera los bienes públicos no se convertirían en bienes privados, se evitarían duplicidades y el material existente podría ser reutilizado en el futuro por otros investigadores (Canet, 2005: 158-159).

4. Hacia la institucionalización de las Humanidades Digitales

Una búsqueda del membrete “Humanidades digitales” en Scopus proporciona un único resultado, “¿Humanidades digitales en español?” de José Luis Suárez, artículo aparecido en la revista Ínsula en 2011[25]>. La misma búsqueda en Dialnet, sin embargo, arroja un total 23 documentos, de entre los cuales tres (es decir, un 13,04%) utilizan el membrete en el título. Éstos, además, coinciden en el uso de un título interrogativo, que denota novedad e incertidumbre sobre la definición y límites de la disciplina.

El primero de ellos es “Humanidades digitales, ¿ciencia ficción o realidad inminente?” de Isabella Leibrandt (2006). El artículo fue publicado en la revista Espéculo y se ocupa del desarrollo de las Humanities Computing en al ámbito anglosajón. La autora destaca algunas característica de la nueva disciplina como la interdisciplinariedad, su orientación instrumental y, por tanto, la importancia del aprendizaje de destrezas, aunque, insiste, ello no significa que el pensamiento crítico se deje de lado. Del panorama español se mencionan libros como Literatura y multimedia (1997) y Filología e informática (1999), e iniciativas didácticas como el curso “Especialistas en Humanidades Digitales” impartido en la Universidad de Castilla-La Mancha, que dio origen en 2006 al primer máster en Humanidades Digitales desafortunadamente extinto cuatro años más tarde.

El segundo es el ya citado “¿Humanidades digitales en español?”. En él José Luis Suárez, profesor de la University of Western Ontario, se ocupa del paralelismo entre Imprenta-Internet, relativiza la importancia de los proyectos de digitalización tras la aparición de Google Books y ofrece un sucinto recuento de los principales proyectos hispánicos de Humanidades Digitales situados en Estados Unidos y Canadá (Proyecto Cervantes 2001, Corpus del español, Bracero History Archive <http://braceroarchive.org>, The Hispanic Baroque Project <http://www.hispanicbaroque.ca> y The CulturePlex <http://www.cultureplex.ca>). Pero lo más importante, a mi juicio, es el listado de recomendaciones que propone con el objetivo de crear “un ecosistema digital para la cultura en español” (Suárez, 2011: 36), tales como el acceso mediante API[26] a todas las bibliotecas y colecciones digitales públicas, la reforma de los estudios de Humanidades o la creación de herramientas por y para los humanistas.

Por último, desde otra perspectiva, Luis Rodríguez-Yunta (2012) reflexiona en “Humanidades digitales, ¿una mera etiqueta o un campo por el que deben apostar las ciencias de la documentación?” sobre las posibilidades laborales que la nueva disciplina brinda a archiveros, documentalistas y bibliotecarios. El artículo, publicado en la revista digital Anuario ThinkEpi, esboza unos planteamientos principalmente basados en el desarrollo y prácticas del ámbito anglosajón, aunque hacia el final del artículo menciona al máster en Humanidades Digitales de la Universidad de Castilla-La Mancha y la creación en México de la RedHD <http://www.humanidadesdigitales.net>.

Si se amplía la búsqueda a publicaciones latinoamericanas, cabe añadir al recuento el título “¿Qué son las humanidades digitales?” de Isabel Galina Russell. El artículo apareció en Revista Digital Universitaria y trata, muy brevemente, temas como el papel jugado por Roberto Busa en los orígenes de las Humanidades Digitales y principios elementales como la interdisciplinariedad o el diseño de bases de datos. A continuación, la investigadora de la Universidad Nacional Autónoma de México ofrece al lector un listado de las principales organizaciones, centros de investigación, congresos y revistas de Humanidades Digitales de habla anglosajona. Por último, se ocupa de la situación mexicana de las Humanidades Digitales y destaca tres proyectos: el Corpus Histórico del Español en México <http://www.corpus.unam.mx:8080/cemc/>, el Proceso judicial a Francisco I <http://www.iisue.unam.mx/ahunam/madero/> y la Biblioteca Digital del Pensamiento Novohispano <http://www.bdpn.unam.mx>.

En resumen, la bibliografía en español indexada en bases bibliográficas que lleva el membrete Humanidades Digitales en el título está orientada hacia el ámbito anglosajón: de los cuatro artículos mencionados solo uno se ocupa de las Humanidades Digitales en el ámbito hispánico. Ahora bien, conviene tener presente que la realidad siempre es más compleja, más vasta, y que al fin y al cabo las bases de datos son siempre una selección, una representación a escala menor del territorio. De hecho, durante la revisión de este trabajo, mientras buscaba los enlaces a los proyectos mencionados, he topado por accidente con un artículo que no está indexado ni en Scopus ni en Dialnet y que adelanta un año la fecha en que el membrete Humanidades Digitales es utilizado en el título de una contribución en lengua española. Me refiero a la comunicación “Humanidades Digitales, crítica textual y la Edición Variorum Electrónica del Quijote (EVE-DQ)”[27] que dio Eduardo Urbina en el XXIII congreso de la Associazione di Ispanisti Italiani celebrado en 2005, pero cuyas actas fueron publicadas dos años más tarde, en 2007. El artículo expone las líneas de acción del proyecto ya descrito más arriba por lo que no es necesario volver sobre su contenido. Lo interesante, a mi juicio, es que si el membrete en inglés tiene sus orígenes hacia el año 2000 y su difusión generalizada se produce en 2004 con la publicación del célebre A Companion to Digital Humanities de Schreibman y otros; esto quiere decir que los contactos y préstamos entre la comunidad anglosajona y la comunidad hispánica son más estrechos de lo que cabría imaginar en un primer momento. Ahora bien, no me atrevo a insinuar que el trabajo del profesor de la Texas A&M University sea el primero que titula con tal membrete -sería demasiado imprudente por mi parte cuando la diferencia entre la comunicación y su publicación en formato CD-ROM dista de dos años- pero es posiblemente uno de los más tempranos, junto con el artículo reseñado de Isabella Leibrandt (2006).

Por otra parte, el uso y difusión del membrete “Humanidades Digitales” no significa que otras fórmulas anteriores desaparecieran. Como ocurrió en Reino Unido y Norteamérica con la expresión Humanities Computing durante los primeros siete u ocho años de la pasada década, en los últimos años se han seguido publicando en España algunos trabajos que utilizan los términos “Informática Humanística”. Así, José Manuel Lucía Megías firmó en 2008 un artículo aparecido en Revista poética medieval que lleva por título “La Informática Humanística: una puerta abierta para los estudios medievales en el siglo XXI” y más recientemente, en 2010, Francisco José Varela Pose ha escrito un trabajo titulado “La Informática Humanística y la transmisión del texto digital” publicado en el libro colectivo Teoría del Humanismo.

Del artículo de José Manuel Lucía Megías no solo interesa aquí el título si no cómo caracteriza la situación española de los estudios literarios y la informática cinco años atrás. Según el catedrático de la Universidad Complutense de Madrid, pese a la existencia del CORDE, el CREA o la Biblioteca Virtual Miguel de Cervantes, la brecha entre, por una parte, la digitalización del patrimonio cultural, y por otra, la investigación y la didáctica era entonces abismal porque no se habían creado redes de colaboración entre distintas universidades:

Quizás esta falta de una vinculación real con los centros universitarios -unidos a la falta de interés de las universidades españolas en el tema de la Informática Humanística- hayan motivado que no se convirtieran en este tiempo en un punto de referencia, en motor para proyectos similares. Difícilmente estos centros de investigación que, por su propia naturaleza, están cerrados en sí mismos, podrían liderar “redes de investigación” o exportar sus resultados y modos de trabajo más allá de sus instalaciones. (Lucía Megías, 2008: 179)

Esta situación, no obstante, empezó a cambiar en 2011 cuando se pueden percibir varios intentos por dotar de una estructura oficial a los distintos proyectos humanísticos que se valen de la tecnología digital. Grupos de investigación como BIDESLITE y DIALOGYCA (Universidad Complutense de Madrid), SIELAE (Universidade da Coruña), El Seminario Alfonso Irigoien (Universidad de Deusto) o PROLOPE (Universitat Autònoma de Barcelona) han llevado a cabo seminarios, simposios y encuentros con el objetivo de intercambiar experiencias y dar a conocer su trabajo; en otras palabras, con el objetivo de construir una comunidad de investigadores interesados en la convergencia entre las Humanidades y la informática. Desde mi punto de vista, la consolidación del nuevo membrete no solo se explica porque los interesados son ahora más numerosos sino porque están muy distribuidos por la geografía española, es decir, su irradiación no se restringe al centro, a la capital madrileña y a algunos otros centros que habían despuntado hasta entonces como la Universidad de Castilla-La Mancha y la Universidad de Alicante.

Tras el seminario sobre bibliotecas digitales y bases de datos organizado por Consolación Baranda Leturio (BIDESLITE) en julio de 2011 y el seminario sobre edición digital con lenguaje de marcado XML organizado por Sagrario López Poza en septiembre de 2011, la idea de crear la asociación Humanidades Digitales Hispánicas (HDH <http://www.humanidadesdigitales.org>) surge en noviembre del mismo año en el marco del Simposio sobre Edición de Textos Múltiples celebrado en la Universidad de Deusto. Sus promotores, como reza la página web de la asociación, fueron: Carmen Isasi (Universidad de Deusto), Sagrario López Poza (Universidade da Coruña), Fiona Maguire (University of Liverpool), José Camoes (Universidade de Lisboa), Domenico Fiormonte (Università Roma Tre), Bautista Horcajada Diezma (Universidad Complutense de Madrid), Francesco Vincenzo Stella (Università di Siena) y María Jesús Torrens Álvarez (CSIC). La asociación cuenta en la actualidad con 52 miembros afiliados[28].

Los ocho miembros fundadores de la asociación Humanidades Digitales Hispánicas son profesores de filología o letras; de ahí, como es obvio, que hasta la fecha los intereses de la asociación se hayan centrado en la digitalización, la creación de bibliotecas virtuales y en la edición digital, es decir, en todas las prácticas relacionadas con el texto. Esta tendencia se hizo patente en el primer congreso de la asociación <http://hdh2013.humanidadesdigitales.org/>, que tuvo lugar en la Universidade da Coruña del 9 al 12 de julio de 2013 y contó con cinco sesiones plenarias, 59 comunicaciones y 82 ponentes. Si se coge el programa y se realizan varias búsquedas de palabras clave, puede comprobarse el predominio de la filología sobre otras disciplinas como el arte o la filosofía: la raíz *biblio* aparece catorce veces; la raíz *text*, siete veces; y la palabra “base”, seis; mientras que la palabra “arte” solo tiene tres ocurrencias. Los resultados de las elecciones a la junta directiva celebradas en el mismo congreso también ponen de manifiesto el predominio de la filología, pues de los ocho miembros solo uno, Nuria Rodríguez Ortega (Universidad de Málaga), pertenece a un departamento de Historia del Arte.

En 2013 otras iniciativas han confirmado el proceso de institucionalización: en primer lugar, el congreso organizado por el GRISO durante los días 23 y 24 de mayo titulado “Humanidades Digitales: visibilidad y difusión de la investigación” <http://www.unav.edu/congreso/humanidades-digitales/>; en segundo lugar, el Día de las Humanidades Digitales (10 de junio) que puso en contacto, por un lado, a los humanistas digitales de habla española de las dos partes del Atlántico (España y México, principalmente) y, por otro, a la comunidad hispánica con la luso-brasileña <http://dhd2013.filos.unam.mx/acerca/>. Por último, hay que sumar el reciente anuncio por parte del Departamento de Filología Española de la Universitat Autònoma de Barcelona de la creación de un máster en Humanidades Digitales <http://dfe.uab.es/mhd.php>.

Si dejamos de lado la organización de actos y seminarios, y dirigimos la mirada hacia los proyectos iniciados en el período que va desde 2006 hasta el presente, es obvio que la creación de bases de datos sobre literatura es una tendencia al alza. Así, por ejemplo, se puede encontrar proyectos como CLARISEL <http://clarisel.unizar.es>, que bajo la dirección de Juan Manuel Cacho Blecua y María Jesús Lacarra (Universidad de Zaragoza), recoge tres bases de datos bibliográficas sobre literatura caballeresca, el cuento medieval hispánico y la literatura aragonesa de la Edad Media. Otro caso relevante corresponde a CATCOM <http://catcom.uv.e> dirigida por Teresa Valls (Universitat de València) sobre menciones a comedias desde 1540 a 1700; y conviene tener presente la base de datos Inventarios y Bibliotecas del Siglo de Oro (IBSO <http://www.bidiso.es/IBSO/Presentacion.do>), el último proyecto coordinado por Sagrario López Poza (Universidade da Coruña) en sumarse a la plataforma del Seminario Interdisciplinar para el Estudio de la Literatura Áurea Española (SIELAE <http://www.bidiso.es/sielae/presentacion.htm>). Además, en los últimos años se da un fenómeno interesante desde el punto de vista de la taxonomía de los proyectos: la hibridación entre base de datos y biblioteca digital. Esto ocurre en proyectos como la Bibliografía de Escritoras Españolas (BIESES <http://www.bieses.net>), dirigida por Nieves Baranda Leturio (UNED), o la Biblioteca Digital de Diálogo Hispánico (DIALOGYCA. BDDH <http://pendientedemigracion.ucm.es/info/dialogycabddh/presentacion.html>), dirigida por Ana Vian Herrero (Universidad Complutense de Madrid), que no solo permiten realizar búsquedas complejas sino que también dan acceso a algunos de los textos en HTML y/o formato PDF.

En cuanto a bibliotecas digitales propiamente dichas, conviene destacar cuatro proyectos centrados en textos literarios, el primero de los cuales fue creado en 2007. Me refiero al Portal Andrés de Poza <http://andresdepoza.com> dirigido por Carmen Isasi (Universidad de Deusto) y dedicado a la edición con lenguaje de marcado TEI de textos múltiples (originales y traducciones, literarios y notariales)[29]. Fuera de nuestras fronteras, en la University of Liverpool, está radicado el proyecto que dirige desde 2007 Dorothy S. Severin, An Electronic Corpus of 15th Castilian Cancionero Manuscripts <http://cancionerovirtual.liv.ac.uk/>. Este corpus está compuesto por la transcripción de 140 manuscritos de poesía cancioneril del siglo XV y principios del XVI. Las distintas lecturas de las obras han sido cotejadas de manera mecánica con COLLATE; el texto resultante ha sido codificado con lenguaje de marcado siguiendo las recomendaciones de la TEI. El tercer proyecto corresponde a ARTELOPE dirigido desde hace más de diez años por Joan Oleza (Universitat de València). En los últimos tiempos ARTELOPE agrupa una Base de Datos y Argumentos del teatro de Lope de Vega <http://artelope.uv.es/baseArteLope.html>, y una Biblioteca Digital <http://artelope.uv.es/biblioteca/>, que cuenta en la actualidad con 98 piezas teatrales del Fénix codificadas con lenguaje XML siguiendo las recomendaciones de la TEI. Esta biblioteca ha logrado no solo dar acceso a los textos en formato HTML sino añadir el componente analítico que a menudo se echa en falta, pues permite realizar búsquedas, obtener estadísticas, visualizar marcas en las acotaciones, apartes y versos partidos, y mostrar el tipo de métrica y su localización en el texto.

Por lo que respecta a las ediciones académicas digitales, que tienen por objetivo publicar un solo texto, hay que señalar el proyecto coordinado por Paul Spence desde King’s College llamado La entretenida <http://entretenida.outofthewings.org/index.html>. El texto de Cervantes ha sido codificado siguiendo el modelo TEI/XML de tal modo que el lector pueda comparar con facilidad distintas presentaciones: facsímil, texto modernizado, texto sin puntuación, y edición crítica y traducción inglesa de la mano de John O’Neill. Por si no esto no fuera de por sí elogiable, la edición ofrece diversos índices que facilitan la exploración del texto y localiza en un mapa los lugares mencionados en la obra valiéndose del servicio de Google.

No me gustaría terminar este breve recuento sin mencionar dos proyectos de edición digital relevantes pese a no utilizar el sistema de codificación TEI: por un lado, en 2009 vio la luz el Quijote interactivo <http://quijote.bne.es/libro.html>, un proyecto coordinado por José Manuel Lucía Megías que cuenta con la colaboración de la Biblioteca Nacional de España y de Telefónica, que ofrece transcripción paleográfica, texto modernizado y facsímil del clásico de Cervantes junto con otros recursos audiovisuales; por el otro, el proyecto creado en 2012 por Pedro Ruiz Pérez (Universidad de Córdoba), PHEBO. Poesía Hispánica del Bajo Barroco <http://phebo.es>, que tiene por objetivo publicar en PDF poesía impresa entre 1650 y 1750 que no haya sido reeditada en época contemporánea[30].

Conclusiones

La abundancia de referencias bibliográficas y menciones a proyectos demuestra que la historia de las Humanidades Digitales en España es dilatada. La tecnología digital ha servido para que los humanistas revisaran la historia del libro y para que reflexionaran sobre el valor de su trabajo en un momento en que cualquier actividad parece que deba justificarse en términos utilitarios. Asimismo, el hipertexto y la interactividad, desde perspectivas más teóricas que positivistas, han servido para situar al lector en una situación privilegiada respecto al autor y al texto, que la Filología y los formalismos habían encumbrado durante gran parte del siglo XX.

Tal y como he intentado exponer en este trabajo, desvincular teoría, crítica y edición no me parece acertado porque el hipertexto ha permitido imaginar la potencialidad de la edición académica digital; en términos generales, los investigadores coinciden en que el acceso a los textos no es suficiente: a la mera publicación de contenidos digitales, en CD-ROM, Internet o quizá en el futuro en forma de app, hay que sumar algo más. Por supuesto, este suplemento que distingue a la edición académica digital de la edición impresa es muy variado pero quizás puedan señalarse tres opciones mayoritarias: 1) la posibilidad de comparar distintas versiones o presentaciones de una obra, de tal modo que el lector tenga argumentos para juzgar las decisiones editoriales; 2) el uso de enlaces para conectar los textos con varios documentos críticos o recursos multimedia, como audio y vídeo, con el objetivo de mejorar la comprensión de la obra; y 3) el diseño de una infraestructura que permita la recuperación de la información textual mediante búsquedas complejas estructuradas, concordancias o índices. En cualquier caso, lo que está claro es que en la edición digital quien tiene la última palabra es el lector, de quien se espera un alto grado de formación y participación. Olvidar cómo el hipertexto y la idea de colaboración han moldeado la edición académica digital sería desaprovechar una gran oportunidad para establecer puentes entre la filología, la teoría literaria y los estudios culturales.

Las Humanidades Digitales en territorio peninsular y en general en el ámbito hispánico gozan de buena salud en la actualidad. Diversas universidades y grupos de investigación han iniciado en los últimos años un proceso de institucionalización que dota de cohesión, estabilidad y legitimidad a la nueva disciplina. Pero para que las Humanidades Digitales sean un concepto-paraguas que dé cobijo no solo a la filología o a los estudios literarios, sino también a otras áreas de conocimiento, como la historia del arte y la filosofía, es necesario que la comunidad de practicantes fomente y valore la pluralidad de preguntas, objetos de estudio y metodologías, tales como el estudio de las narrativas transmedia, la creación de grafos, la visualización de datos y el análisis de artefactos digitales, ya sean redes sociales, blogs o colecciones de imágenes.

Por último, la promoción del uso de estándares que garanticen la preservación de los contenidos y faciliten el intercambio de datos, la difusión de buenas prácticas relativas al acceso abierto, que permita la reutilización del patrimonio digitalizado con fondos públicos, y el fomento de una estrategia de documentación que facilite el examen crítico de los proyectos por parte de todos, son algunos de los retos que conviene afrontar en el futuro para que la innovación, la transparencia y la diversidad sean algunos de los rasgos definidores de las Humanidades Digitales en España.

Bibliografía

Arrarte, Gerardo (1999). “Normas y estándares para la codificación de textos y para la ingeniería lingüística”. Ed. José Manuel Blecua, Gloria Clavería, Carlos Sánchez, y Joan Torruella. Filología e informática. Nuevas tecnologías en los estudios filológicos. Barcelona: Editorial Milenio-Universitat Autònoma de Barcelona. pp. 17-43.

Barnet, Belinda (2013). Memory Machines. The Evolution of Hypertext. Londres/Nueva York: Anthem Press. E-book.

Bia, Alejandro, y Andrés Pedreño (2001a). “The Miguel de Cervantes Digital Library: The Hispanic Voice on the Web”. Literary and Linguistic Computing 16 (1). pp. 161-177.

Bia, Alejandro, y Manuel Sánchez Quero (2001b). “Diseño de un procedimiento de marcado para la automatización del procesamiento de textos digitales usando XML y TEI”. Ed. Pablo Lucio de la Fuente Redondo y Adoración Pérez Alarcón. JBIDI. II Jornadas de bibliotecas digitales. Cuenca: Universidad de Castilla-La Mancha. <http://media.cervantesvirtual.com/research/articles/jbidi01.pdf>. (03-09-2013).

Barthes, Roland (1987). El susurro del lenguaje. Buenos Aires: Paidós Comunicación.

Borràs, Laura (2004). “De la estética de la recepción a la estética de la interactividad. Notas para una hermenéutica de la lectura hipertextual”. Ed. Miguel Ángel Muro Munilla. Arte y nuevas tecnologías: X Congreso de la Asociación Española de Semiótica. Logroño: Universidad de La Rioja-Fundación de San Millán de la Cogolla. <http://dialnet.unirioja.es/servlet/busquedadoc?t=de+la+est%C3%A9tica+de+la+recepci%C3%B3n+borr%C3%A0s&db=1&td=todo> (03-09-2013).

Borràs, Laura (ed.) (2005). Textualidades electrónicas: nuevos escenarios para la literatura. Barcelona: Editorial UOC.

Bush, Vannevar (1945, 1 julio). “As We May Think”. The Atlantic. <www.theatlantic.com/magazine/archive/1945/07/as-we-may-think/303881>. (03-09-2013).

Canet, José Luis, y Ricardo Serrano (2002). “Norma-recomendación de la Asociación Internacional Siglo de Oro sobre edición de textos electrónicos áureos”. Ed. María Luisa Lobato y Francisco Domínguez Matito. Actas del VI congreso de la Asociación Internacional Siglo de Oro. Frankfurt/Madrid: Vervuert-Iberoamericana. <http://cvc.cervantes.es/literatura/aiso/pdf/06/aiso_6_2_084.pdf>. pp. 1897-1912. (03-09-2012).

Canet, Josep Lluís (2005). “Bibliotecas digitales españolas a texto completo”. Syntagma. Revista del Instituto de Historia del Libro y de la Lectura 1: pp. 149-159.

Cerezo, José M. (dir.) (2006). La blogosfera hispana: pioneros de la cultura digital. Madrid: Fundación France Telecom España. <http://www.fundacionorange.es/areas/25_publicaciones/la_blogosfera_hispana.pdf>. (03-09-2013).

Codina, Lluís, Mari-Carmen Marcos y Rafael Pedraza (coords.) (2009). Web semántica y sistemas de información documental. Gijón: Trea Editorial.

Faulhaber, Charles B. (1986). “Hispanismo e informática”. Incipit 6: pp. 157-184.

Faulhaber, Charles B., y Francisco Marcos Marín (1992). “La conservación y utilización de textos en el futuro inmediato: ADMYTE, el archivo digital de manuscritos y textos españoles”. Hispania 75 (4): pp. 1010-1023.

Galina Russell, Isabel (2011). “¿Qué son las humanidades digitales?”. Revista digital universitaria 12 (7). <http://www.revista.unam.mx/vol.12/num7/art68/>: pp. 3-10. (03-09-2013).

González-Blanco García, Elena (2013). “Actualidad de las Humanidades Digitales y un ejemplo de ensamblaje poético en la red”. Cuadernos hispanoamericanos 761: pp. 53-67.

Isasi, Carmen (2010).. “Edición digital. Retos nuevos en los nuevos recursos”. Ed. Mariña Arbor y Antonio F. Guiadanes. Estudios de edición crítica y lírica galego portuguesa. Santiago de Compostela: Universidade de Santiago de Compostela. pp. 353-368.

Landow, George P. (1992). Hypertext: the convergence of contemporary critical theory and technology. Baltimore: Johns Hopkins University Press.

Leibrandt, Isabella (2006). “Humanidades digitales, ¿ciencia ficción o realidad inminente?”. Espéculo. Revista de estudios literarios 33. <http://pendientedemigracion.ucm.es/info/especulo/numero33/humadigi.html>. (03-09-2013).

Lucía Megías, José Manuel (1998). “Editar en Internet (che quanto piace il mondo è breve sogno)”, Incipit, XVIII (1998): pp. 1-40.

Lucía Megías, José Manuel (2000). “Internet y edición: algunas notas preliminares”. Ed. Florencio Sevilla y Carlos Alvar. Actas del XIII Congreso de la Asociación Internacional de Hispanistas. Madrid: Castalia. <http://cvc.cervantes.es/literatura/aih/pdf/13/aih_13_4_048.pdf>. pp. 410-420. (03-09-2013).

Lucía Megías, José Manuel (2002). Literatura románica en Internet: los textos. Madrid: Castalia.

Lucía Megías, José Manuel (2003). “La Informática Humanística: notas volanderas desde el ámbito hispánico”. Incipit 23: pp. 91-114.

Lucía Megías, José Manuel (2005). “Banco de imágenes del ‘Quijote’ (1605-1905)”. Voz y Letra 16 (1-2): pp. 187-200.

Lucía Megías, José Manuel (2008). “La ‘Informática Humanística’: una puerta abierta para los estudios medievales en el siglo XXI”. Revista poética medieval 20. <http://eprints.ucm.es/8942/>. (03-09-2013).

Lucía Megías, José Manuel (2012). Elogio del texto digital. Madrid: Fórcola. E-book.

Marcos Marín, Francisco (1986). “Metodología informática para la edición de textos”. Incipit 6: pp. 185-197.

Marcos Marín, Francisco (1987). “Filología e informática”. Libro de Alexandre / estudio y edición de Francisco Marcos Marín. <http://www.cervantesvirtual.com/obra-visor/libro-de-alexandre–0/html/ff1d1018-82b1-11df-acc7-002185ce6064_2.htm#14>. (03-09-2013).

Marcos Marín, Francisco (1987). “Metodología informática para la edición y crítica de textos”. Hispania 7, 4: pp. 960-965.

Marcos Marín, Francisco (1994). Informática y Humanidades. Madrid: Gredos.

Marcos Marín, Francisco (1996). El comentario filológico con apoyo informático. Madrid: Síntesis.

Martínez Poveda, Paloma, Raquel Pérez Barroso, y Jorge Carlos Villar Rodríguez (2005). “La edición facsímil digital en la biblioteca virtual Miguel de Cervantes”. Revista General de Información y Documentación 15, 1. <http://revistas.ucm.es/index.php/RGID/article/view/RGID0505120189A/9780>. pp. 189-204. (03-09-2013).

Marí-Domènec, Francesca y Alejandro Bia (2002). “Técnicas de producción masiva de contenidos para bibliotecas digitales”. Ed. Purificación García Delgado y José Hilario Canós Cerdá. JBIDI. III Jornadas de bibliotecas digitales. Madrid: Universidad Politécnica de Madrid. pp. 123-132. <http://media.cervantesvirtual.com/research/articles/JBIDI02b.pdf>. (03-09-2013).

Millán, José Antonio (1996). La edición electrónica y multimedia. Salamanca: Tesitex.

Millán, José Antonio (1999). “Estaciones filológicas”. Ed. José Manuel Blecua, Gloria Clavería, Carlos Sánchez, y Joan Torruella. Filología e informática. Nuevas tecnologías en los estudios filológicos. Barcelona: Editorial Milenio-Universitat Autònoma de Barcelona. pp. 143-164.

Mora, Vicente Luis (2006). Pangea: Internet, blogs y comunicación en un mundo nuevo. Sevilla: Fundación José Manuel Lara.

Moreno Hernández, Carlos (1998). Literatura e hipertexto: de la cultura manuscrita a la cultura electrónica. Madrid: Universidad Nacional de Educación a Distancia.

Morrás, María (1999). “Informática y crítica textual: realidades y deseos”. Ed. José Manuel Blecua, Gloria Clavería, Carlos Sánchez, y Joan Torruella. Filología e informática. Nuevas tecnologías en los estudios filológicos. Barcelona: Editorial Milenio-Universitat Autònoma de Barcelona. pp. 189-210.

Pajares Tosca, Susana (2004). Literatura digital: el paradigma hipertextual. Cáceres: Universidad de Extremadura.

Rodríguez de las Heras, Antonio (1997). “Hipertexto y libro electrónico”. Ed. José Romera Castillo, Francisco Gutiérrez Carbajo, y Mario García-Page. Literatura y multimedia. Actas del VI seminario internacional del instituto de semiótica literaria, teatral y nuevas tecnologías de la UNED. Madrid: Visor. pp. 83-90.

Rodríguez de las Heras, Antonio (2004). “Nuevas tecnologías y saber humanístico”. Ed. Domingo Sánchez-Mesa. Literatura y cibercultura. Madrid: Arco Libros. pp. 147-173.

Rodríguez-Yunta, Luis (2012). “Las humanidades digitales, ¿una mera etiqueta o un campo por el que deben apostar las ciencias de la documentación?”. Anuario ThinkEPI 1: <http://www.thinkepi.net/humanidades-digitales-etiqueta-campo-apostar-ciencias-documentacion>. (03-09-2013).

Romera Castillo, José (1997). “Literatura y nuevas tecnologías”. Ed. José Romera Castillo, Francisco Gutiérrez Carbajo y Mario García-Page. Literatura y multimedia. Actas del VI seminario internacional del instituto de semiótica literaria, teatral y nuevas tecnologías de la UNED. Madrid: Visor. pp. 13-82.

Rubio Tovar, Joaquín (2004). “De la oralidad al ciberespacio”. La vieja diosa. Madrid: Centro de Estudios Cervantinos. pp. 254-272.

Ruiz Pérez, Pedro (2012). “El canon y la red: editar la poesía del bajo Barroco”. Ed. Anne Cayuela. Edición y literatura en España (siglos XVI y XVII). Zaragoza: Prensas Universitarias de Zaragoza, 2012. pp. 319-342.

Sánchez, Fernando, Jordi Porta, José Luis Sancho, Amalio Nieto, Almudena Ballester, Adelaida Fernández, Javier Gómez, Laura Gómez, Encarnación Raigal, y Rafael Ruiz (1999). “La anotación de los corpus CREA y CORDE”. Procesamiento de lenguaje natural 25: <http://www.sepln.org/revistaSEPLN/revista/25/25-Pag175.pdf>. pp. 175-182. (03-09-2013).

Sánchez Sánchez, Mercedes y Carlos Domínguez Cintas (2007). “El banco de datos de la RAE: CREA y CORDE”. Boletín filológico de actualización académica y didáctica 2: pp. 137-148.

Sánchez-Mesa, Domingo (2004). “Los vigilantes de la metamorfosis. El reto de los estudios literarios ante las nuevas formas y medios de comunicación digital”. Ed. Domingo Sánchez-Mesa. Literatura y cibercultura. Madrid: Arco Libros. pp. 147-173.

Sánchez-Prieto Borja, Pedro (2003). “Nuevas posibilidades y nuevas exigencias de la crítica textual: la ‘lectura asistida’”. Letras de Deusto 33 (100): pp. 109-126.

Sánchez-Prieto Borja, Pedro (2012). “La red CHARTA: proyecto global de edición de documentos hispánicos”. Ed. María Jesús Torrens Álvarez y Pedro Sánchez-Prieto Borja. Nuevas perspectivas para la edición y el estudio de documentos hispánicos antiguos. Bern: Peter Lang.

Schreibman, Susan, Ray Siemens y John Unsworth (eds.) (2004). A Companion to Digital Humanities. Oxford: Blackwell

Scolari, Carlos A. (2013). Narrativas Transmedia: cuando todos los medios cuentan. Barcelona: Centro Libros PAPF.

Serés, Guillermo (2002). “Internet y la edición crítica de textos. Algunos ejemplos”. Ed. José Manuel Blecua, Gloria Clavería, Carlos Sánchez, y Joan Torruella. Filología e informática. Nuevas tecnologías en los estudios filológicos. Barcelona: Editorial Milenio-Universitat Autònoma de Barcelona. pp. 9-19.

Simón Palmer, María del Carmen (1997). “Teatro del Siglo de Oro en CD-ROM”. Ed. José Romera Castillo. Literatura y multimedia. Actas del VI seminario internacional del instituto de semiótica literaria, teatral y nuevas tecnologías de la UNED. Madrid: Visor. pp. 319-327.

Suárez, Juan Luis (2010). “¿Humanidades digitales en español?”. Ínsula 726: pp. 33-36.

Talens, Jenaro (1994). “El lugar de la teoría de la literatura en la era del lenguaje electrónico”. Ed. Darío Villanueva. Curso de teoría de la literatura. Madrid: Taurus. pp. 129-143.

Taracido, Marcos (2011). “Procomún y Biblioteca Virtual Miguel de Cervantes”. Libro de Notas. <http://librodenotas.com/textosdelcuervo/21549/procomun-y-biblioteca-virtual-miguel-de-cervantes>. (03-09-2013).

Torruella, Joan (2002). “Los diccionarios en la Red”. Ed. José Manuel Blecua, Gloria Clavería, Carlos Sánchez, y Joan Torruella. Filología e informática. Nuevas tecnologías en los estudios filológicos. Barcelona: Editorial Milenio-Universitat Autònoma de Barcelona. pp. 21-41.

Torruella, Joan (2008). “El Quijote, al miscoscopio”. Bulletin of the Cervantes Society of America 28 (2): <http://users.ipfw.edu/jehle/cervante/csa/artics08/Torruellas08.pdf>. pp. 11-52. (03-09-2013).

Torruella, Joan, y Joaquim Llisterri (1999). “Diseño de corpus textuales y orales”. Ed. José Manuel Blecua, Gloria Clavería, Carlos Sánchez, y Joan Torruella. Filología e informática. Nuevas tecnologías en los estudios filológicos. Barcelona: Editorial Milenio-Universitat Autònoma de Barcelona. pp. 45-80.

Urbina, Eduardo, Richard Furuta, y Shueh-Cheng Hu (1999). “El arte nuevo de editar textos en este tiempo. Descripción de la estructura y demostración del funcionamiento de la edición electrónica virtual variorum del ‘Quijote’ (EEVV-DQ) del Proyecto Cervantes 2001”. Espéculo. Revista de estudios literarios 12. <http://pendientedemigracion.ucm.es/info/especulo/numero12/artenuev.html>. (03-09-2013).

Urbina, Eduardo, Erica Pasquel, Richard Furuta, Carlos Monroy, Jie Deng, y Neal Audenauert (2007). “Humanidades digitales, crítica textual y la ‘Edición Variorum Electrónica del Quijote (EVE DQ)’”. Ed. Lorenzo Blino, M. Vittoria Calvi, y Antonella Cancellier. L’Insula de Don Chisciotte. Atti del XXIII Convegno, Palermo, 6-8 Ottobre 2005, 1. Madrid: Instituto Cervantes-Aispi. <http://cvc.cervantes.es/literatura/aispi/pdf/21/I_20.pdf>. pp. 223-235. (04-10-2013).

Vanhoutte, Edward (2010). “Defining Electronic Editions: A Historical and Functional Perspective”. Ed. Willard McCarty. Text and Genre in Reconstruction. Effects of Digitalization on Ideas, Behaviours, Products and Institutions. Cambridge: Open Book Publishers, pp. 119-144. <http://www.openbookpublishers.com/reader/64>. (04-11-2013).

Varela Pose, Francisco José (2010). “La Informática Humanística y la transmisión del texto digital”. Ed. Pedro Aullón de Haro. Teoría del Humanismo. Madrid: Verbum. pp. 55-80.

Vega, María José (2003). “Literatura hipertextual y teoría literaria”. Ed. María José Vega. Literatura hipertextual y teoría literaria. Madrid: Marenostrum comunicación. <http://cv.uoc.edu/~04_999_01_u07/vega1.html>. (3-9-2013).

Vilariño, Teresa, y Ángel Abuin González (eds.) (2006). Teoría del hipertexto. Madrid: Arcos.

 


Caracteres vol.2 n2

· Descargar el vol.2 nº2 de Caracteres como PDF.

· Descargar este texto como PDF.

· Regresar al índice de la edición web.

Notas:    (↵ regresa al texto)
  1. Este artículo ha sido financiado por el proyecto de investigación TODO GÓNGORA II [I+D+I FFI2010-17349].
  2. He intentado centrarme en publicaciones y proyectos radicados en España pero resulta muy difícil obtener una fotografía completa del desarrollo y las relaciones entre los estudios literarios, la tecnología digital y, más recientemente, la emergencia de las Humanidades Digitales sin tener en cuenta las aportaciones de los hispanistas, es decir, cuánto se ha hecho o se ha dicho más allá de las fronteras estatales y en otros idiomas.
  3. Por ejemplo, el grupo de Humanidades Digitales de Zotero cuenta en la actualidad con más de cien referencias bibliográficas en varios formatos e idiomas y, aunque probablemente predominen trabajos filológicos, la Semiótica y la Teoría de la Literatura están bien representadas. El enlace es el siguiente: <https://www.zotero.org/groups/humanidades_digitales>.
  4. Desarrollo abreviaturas y normalizo ortografía.
  5. Aunque como recuerda María Morrás (1999: 201): “la imprenta no inventó la paginación, los índices y las tablas haciendo posible la erudición. Estas son técnicas de lectura y consulta desarrolladas en las universidades a partir de los siglos XII y XIII en el mundo del manuscrito”.
  6. Parafraseo aquí la información contenida en la Wikipedia inglesa: <http://en.wikipedia.org/wiki/Hypertext>.
  7. Este, por cierto, es el argumento que vertebra el reciente Memory Machines de la australiana Belinda Barnet. En él se puede encontrar una definición más elaborada del hipertexto: “Written or pictorial material interconnected in an associative fashion, consisting of units of information retrieved by automated links, best read at a screen” (Barnet, 2013: ebook).
  8. Sobre todo esto en español puede consultarse Lluís Codina et al. (2009).
  9. Mucho de esto es debido a la influencia de Ted Nelson, cuyos escritos sobre el hipertexto se entienden mejor si se toma en consideración el ambiente hippy californiano en que sus teorías se fraguaron.
  10. Sobre este proyecto ver la descripción de José Manuel Lucía Megías (2005) y, por supuesto, la web <http://www.qbi2005.com>.
  11. Vuelvo a desarrollar abreviaturas y a normalizar la ortografía.
  12. La primera propuesta de la TEI conocida como P1 es de 1990 pero la primera versión considerada “definitiva” es la P3 publicada cuatro años más tarde. Para más detalles sobre la historia de la TEI puede verse el primer capítulo de las recomendaciones o la página web del consorcio <http://www.tei-c.org/About/history.xml>.
  13. Un ejemplo de este tipo es la edición de Miguel Garci-Gómez de la Celestina: <http://mgarci.aas.duke.edu/cgi-bin/celestina/sp/index-dq.cgi?libroId=1001>.
  14. Muchas de las ideas tratadas en este trabajo reaparecen en artículos posteriores del mismo autor. Por ejemplo, en “Internet y edición: algunas notas preliminares” de 2000 se analizan los mismos proyectos y se presenta la misma dicotomía entre acumulación-calidad. Sobre el concepto de “hiperedición” ver ahora Edward Vanhoutte (2010) en donde se analiza, entre otros asuntos, la propuesta editorial de Marilyn Deegan y Peter Robinson durante los años noventa.
  15. Para un análisis más detenido de la composición del corpus ver Mercedes Sánchez (2007).
  16. Aparte del artículo reseñado aquí el lector puede acudir a Alejandro Bia (2001b) y Francesca Marí-Domènec (2002) en donde se profundiza en muchos aspectos del proceso de codificación.
  17. Es decir, clásicos cuyos derechos de autor han caducado (70 años después de la muerte del autor según la legislación española).
  18. Sobre la política de marcado y los niveles del texto, en Alejandro Bia (2001b: 8) se puede hallar el criterio: “Nosotros pensamos que los textos literarios deben tener un marcado bastante completo, pero en todo caso no hasta el punto de marcar palabras individuales. No obstante, hemos visto que otros proyectos de digitalización usan un esquema de marcado innecesariamente complejo que lleva un incremento en el tiempo y el coste de producción de los textos. Por tanto, nosotros necesitábamos encontrar una solución de compromiso entre un marcado lo suficientemente complejo y un coste lo suficientemente bajo”.
  19. Para una explicación más detallada del proceso de generación de los facsímiles ver Paloma Martínez (2005).
  20. De hecho el mismo Alejandro Bia lo reconoce: “This is the area [exploitation] where more development is needed. Currently, users can retrieve only entire files, based on catalogue searches. We want to provide complex searches on smaller textual objects (as defined by our markup scheme). For instance: ‘show all the paragraphs that include the person name Cervantes’, or ‘all headings with the word cartas’ (letters). To allow such searches, a consistent markup scheme is needed for the whole collection, and adequate indexing and filtering techniques for search and retrieval of textual objects. This is a filed where research is needed to develop efficient methods for these costly complex tasks” (Bia, 2001a: 175).
  21. Puede verse la postura de un usuario, Marcos Taracido, en el blog Libro de Notas: <http://librodenotas.com/textosdelcuervo/21549/procomun-y-biblioteca-virtual-miguel-de-cervantes>.
  22. Para más información sobre el proyecto puede verse Pedro Sánchez-Prieto Borja (2012).
  23. No he encontrado página web correspondiente a este proyecto.
  24. Por ejemplo, de entre las muchas iniciativas, puede destacarse la Biblioteca Digital Hispánica: <http://www.bne.es/es/Catalogos/BibliotecaDigitalHispanica/Inicio/>.
  25. Todas las búsquedas que menciono en este apartado han sido realizadas el día 2 de septiembre de 2013. Durante la fase de revisión de este artículo ha aparecido una panorámica sobre las Humanidades Digitales y el proyecto ReMetCa de la mano de Elena González-Blanco García (2013).
  26. En español, IPA (Interfaz de Programación de Aplicaciones), es el conjunto de funciones y procedimientos que ofrece una biblioteca para ser utilizado por otro software como una capa de abstracción.
  27. El lector atento se habrá percatado de que los creadores de la edición han acortado el nombre: en 1998 el proyecto se llamaba Edición Electrónica Virtual Variorum del Quijote (EEVV-DQ).
  28. Según las actas remitidas por la Secretaría el 19 de septiembre de 2013 en la lista de correo de la asociación.
  29. Para más detalles ver Carmen Isasi (2010).
  30. Para una descripción del proyecto en detalle puede verse Pedro Ruiz Pérez (2012).

Una idea sobre “El mapa y el territorio. Una aproximación histórico-bibliográfica a la emergencia de las Humanidades Digitales en España

  1. Pingback: Notes towards moving ideas around the DH world* | Readers of Fiction