Acercamiento al análisis del sistema de los personajes en la narrativa escrita en español: el caso de Zumalacárregui y Mendizábal de Pérez Galdós

Towards a Methodology for the Analysis of Character Systems in the Spanish Novel: The case of Pérez Galdós’ Zumalacárregui and Mendizábal

Jennifer Isasi (University of Nebraska-Lincoln)

Artículo recibido: 04-09-2017 | Artículo aceptado: 14-10-2017

RESUMEN: Presento una metodología que combina acercamientos del análisis literario y las ciencias computacionales con el fin de mostrar cómo los resultados de una lectura distante encajan con interpretaciones previas de dos episodios nacionales de Benito Pérez Galdós: Zumalacárregui y Mendizábal (1898). Explico el concepto de sistema de personajes, las fases de la minería de datos de los personajes y las medidas para el análisis de redes sociales que utilizo. Los datos indican que la principal diferencia entre las redes de las dos novelas es una protagonicidad inversa de los actantes históricos y los ficticios. Además, los gráficos de estos “sistemas sincrónicos de relaciones sociales” (Jameson) también explican la percepción espontánea sobre una mayor historicidad en Zumalacárregui. De hecho, mientras que el gráfico de esta reconoce la división histórica entre carlistas e isabelinos, la red de Mendizábal, curiosamente, produce una clara distinción entre los personajes históricos y los ficticios.
ABSTRACT: I present a methodology that combines approaches from literary analysis and computer science in order to show how the results of distant reading replicate well established readings of Benito Pérez Galdós’ Zumalacárregui and Mendizábal (1898). I explain the concept of character system, the stages of data-mining the characters, and social network analysis measurements. Data show that the main difference between the two novels’ character networks is an opposite protagonicity of historical and fictional personae. In addition, the visualizations of these “synchronic system[s] of social relations” (Jameson) also explain the spontaneous perception of Zumalacárregui as having a bigger degree of historicity. Indeed, whereas Zumalacárregui’s graph recognizes the historical division between carlistas and isabelinos, Mendizábal’s, interestingly enough, produces a clear distinction between historical and fictional characters.

PALABRAS CLAVE: Redes sociales, personaje literario, episodio nacional, visualización de datos, humanidades digitales
KEY WORDS: Social networks, literary character, national episode, data visualization, digital humanities


1. Introducción

A raíz de la disponibilidad de obras literarias en forma digital se han puesto a punto metodologías de análisis que combinan la tradición hermenéutica con el análisis computacional. En concreto, el presente trabajo se apoya en el tipo de minería de datos que se ha desarrollado para el análisis de redes sociales,[1] una metodología que, por lo demás, se ha centrado por la mayor parte en textos escritos en inglés, y, claro, promoviendo técnicas de anotación pensadas para esta lengua. Esto indica que aquellos que investigamos la literatura escrita en español tenemos en la actualidad ciertas carencias en cuanto a las herramientas de anotación disponibles. Pero se trata de una limitación que estimo posible paliar mediante un trabajo de adaptación de tales herramientas al idioma español. Con este objetivo, me he centrado en el corpus formado por los Episodios nacionales de Benito Pérez Galdós (1843-1920), un conjunto de 46 novelas divididas en cinco series. Dada su extensión y homogeneidad, considero que este corpus es idóneo para investigar de manera computacional diferentes estructuras, contextos históricos, estilos, personajes, etc. En el presente trabajo me intereso específicamente por estos últimos y muestro la potencialidad de estos métodos presentando las redes sociales de Zumalacárregui y de Mendizábal, las dos primeras novelas de la tercera serie, ambas de 1898.[2]

2. Espacio y sistema de los personajes

A partir del análisis de algunas novelas realistas del siglo XIX escritas en francés y en inglés, Alex Woloch (2003) propuso que en toda narración a cada personaje se le asigna un espacio concreto en la estructura total de la novela. Si consideramos que esa estructura total la conforma el conjunto de todas las palabras utilizadas en el texto, el espacio de un personaje sería todas aquellas palabras asociadas directamente con él. Por ejemplo, el espacio del personaje X vendría dado por todas aquellas palabras que el narrador utiliza para describir al personaje, más las palabras que emite el propio personaje –sea discurso interno o externo–, junto con lo que otros personajes dicen de ese personaje, etc. Cabe añadir que Woloch estaba especialmente interesado en cómo una narración capta la atención del lector, pues fijándose en este fenómeno podía ver el proceso de funcionalización de la narración – más allá de la función individual del personaje (26). En este sentido, dentro de una narración hay una correlación entre los espacios de los personajes y la atención que los lectores prestan a cada uno de ellos, a saber, a mayor espacio mayor atención (13). Con todo ello Woloch exploró algunas preguntas de corte estructural. Por ejemplo, se pregunta “how much access are we given to a certain character’s thoughts, and how does the partial enactment of this perspective or point of view fit into the narrative as a whole?” (13-14). Ahora bien, para los objetivos de este trabajo, el planteamiento que más me interesa es la cuestión de la relación que una narración establece entre los personajes centrales (major characters) –los dos o tres personajes con mayor espacio–, los personajes secundarios (minor characters) –habitualmente más de dos o tres– y los terciarios (minor-minor characters) — que suelen ser los más abundantes.

De aquí la relevancia de la noción de sistema de personajes –“the arrangement of multiple and differentiated character-spaces[, that is,] differentiated configurations and manipulations of the human figure[,] into a unified narrative structure”– que Woloch desarrolla en conexión con la idea de espacio del personaje (14). Esta estructura a la que, por otra parte, Jameson considera “a synchronic system of social relations” (36), está formada por el posicionamiento de un personaje robusto o round respecto de otro personaje laxo o flat a lo largo de la narración (Woloch, 2003: 25), sin que necesariamente haya interacción o relación directa entre ellos en la trama (17). Esto indica que esa organización socio-formal de la narración únicamente es pensada y, por ende, analizada, como el conjunto de todos los espacios individuales en tensión vinculante (18).

Al hablar de distribución de palabras por personaje y de relaciones sociales, la posibilidad de cuantificar este análisis es más que aparente. En concreto, los conceptos planteados por Woloch tienen una clara relación con la definición de red social y, por ello, diversos críticos culturales lo han convertido en un método de lectura distante o computacional. En este trabajo, de hecho, presentamos la minería de datos del sistema sincrónico de los personajes de las dos novelas citadas. Asimismo, resolvemos el análisis del espacio individual del personaje en términos de la mención del nombre de cada personaje y la del sistema de personajes en términos de una conexión por coaparición en un mismo capítulo.

3. Redes sociales de los personajes en una novela

Una red está compuesta por un conjunto de entidades relacionadas. La representación gráfica de una red exhibe la forma de un conjunto de vértices o nodos que, en el caso de una red social, son actores tales como una persona, una organización, una máquina, etc. Por su parte, las líneas o aristas simbolizan algún tipo de vínculo entre ellos, como un parentesco o una colaboración. En general, al tratarse de estructuras de gran tamaño, interesa “el estudio de las redes […] en la estructura global de las interacciones de un sistema” y, a veces, “las propiedades particulares de cada elemento sencillamente se ignoran” (Caldarelli y Catanzaro 15). De esta manera, para nuestro propósito interpretamos estas estructuras sociales como redes de los personajes literarios, donde los nodos son los personajes y las aristas representan una interacción o referencia entre ellos. A diferencia de estudios de mayor amplitud, las estructuras aquí obtenidas son más bien reducidas –en comparación, por ejemplo, con las redes de Internet– lo que nos permite tener en cuenta algunas características de los personajes para clasificar su funcionalidad en la narración.

Como demuestran diversos ensayos, no existe una única técnica para extraer datos sobre el espacio y el sistema de los personajes en obras textuales debido, en parte, a que cada investigación trata cuestiones diferentes. Por ejemplo, en Operationalizing (2013), a diferencia de un primer ensayo en que se valió de la copresencia de los personajes en el escenario (2011), Moretti contabilizó el número de palabras intercambiadas entre emisor y receptor en obras teatrales con el fin de medir el peso en los vínculos de la red y de estudiar qué personajes tienen una mayor influencia en la historia. Por otro lado, Alberich et al. extrajeron datos de una base de datos de la Marvel Comics Group y relacionaron a los superhéroes en base a su coaparición en cómics mediante un grafo bipartito — en uno se consignan los distintos personajes y en el otro, los distintos números de las revistas de Marvel. Más recientemente, Agarval et al. dieron un paso más al clasificar y medir los vínculos de los personajes en términos del tipo de acción –sea esta un evento, una interacción o una observación–, además de incluir una variante dinámica al estudiar la evolución de los personajes por capítulos. Aún así, la mayoría de los estudios han coincidido en identificar y calcular el espacio del personaje por el uso de su nombre, apellido y/o apodo, que es el método que hemos seguido aquí.

3.1. Identificación de los personajes

Por su alto nivel de acierto en inglés y la existencia de una extensión para el español, en un primer momento opté por procesar los textos de los Episodios nacionales en formato electrónico[3] con la herramienta Core Natural Language Processing (CoreNLP) y el suplemento Name Entity Recognizer (NER) de Stanford. El primer sistema realiza un análisis y clasificado en base a la función sintáctica de las palabras en un texto, y después el NER analiza las palabras etiquetadas como sustantivo y especifica si denotan personas, organizaciones, lugares u otras cosas. En este primer intento, aunque la herramienta identificó nombres propios como Adán, Fernando, Lázaro, etc., en general, muchos nombres propios fueron identificados con las etiquetas de “otros” o de “lugar” y, además, algunos verbos se etiquetaron como “persona.” Este tipo de errores me hizo descartar este sistema automático de identificación y pasar a configurar uno adaptado al corpus galdosiano.

De forma manual, he organizado una base de datos de los personajes que aparecen en los Episodios nacionales a partir del censo publicado por Sainz de Robles en 1941. Aprovechando su meticulosa labor, este diccionario electrónico de personajes cuenta con un conjunto de metadatos de cada actante,[4] a saber: nombre propio; apodos, diminutivos, etc.; pertenencia a una u otra clase, grupo o estamento social; género; personaje ficticio o histórico/real; y personaje activo, a distinguir del personaje que no funciona como actante. En total, tenemos 4.644 personajes clasificados de la siguiente manera:[5]

 

Clase baja: 998 Militar: 742
Clase media: 642 Aristocracia: 238
Clase alta: 1199 Iglesia: 443
Género masculino: 3815 Género femenino: 824
Personaje ficticio: 1780 Personaje histórico/real: 2862
Personaje participante: 3146 Referencia a un personaje: 1486

Tabla 1. Clasificaciones en el censo de personajes de los Episodios nacionales.

De manera más certera que el método anterior, con esta base de datos se puede identificar a los personajes mencionados en el texto en todas sus variables registradas, contar su frecuencia de mención y su coaparición con otros personajes.

3.2. Extracción de datos

Con el objetivo de planificar un método de extracción, análisis y visualización de datos de novelas en español para cuantificar el sistema de personajes propuestos por Woloch, se tuvieron en cuenta las metodologías y los resultados de las investigaciones previas antes mencionadas. Debido a la dificultad de identificar todas las palabras dedicadas a un personaje por parte del narrador u otro actante, he optado por contabilizar el espacio del personaje por el número de menciones de su nombre, apellido o apodo. Además, por el carácter narrativo de las obras, cuento un vínculo entre dos personajes cuando sus nombres aparecen en un mismo capítulo, es decir, cuando hay una coaparición. Esta última decisión está basada en la hipótesis de que los personajes mencionados en un capítulo están conectados de alguna forma, tal como una relación directa, un conocimiento común, conocimiento cultural, etc. Podemos observar dicha lógica en esta conversación extraída del primer capítulo de Mendizábal:

– Es la primera vez… Por más que rebusco en mi memoria -dijo el don Fernando caviloso y otra vez inquieto-, no caigo en quién pueda ser ese don Manuel que ha dado a usted el encargo de recibirme y alojarme.

– Don Manuel de Azara.

– ¿De Azara?… Ese apellido me suena, sí, me suena… pero… vamos, que no le conozco ni le he visto en mi vida, así Dios me la conserve.

Aquí, Fernando Calpena pregunta a otro personaje, Filiberto Muñoz, por el nombre de quien ha sido el emisor de un encargo. Aunque Manuel de Azara no está presente en esta escena, su referencia nos basta para considerar que los tres personajes están conectados. Conviene recordar que en el sistema de personajes que tomamos como marco de análisis los vínculos se dan tanto por interacción directa como por referencia entre personajes.

Una vez tomadas dichas decisiones pasamos a la creación de algoritmos con el lenguaje de programación R en colaboración con el profesor Matthew Jockers. En cada archivo en forma de tabla, generado a partir del análisis sintáctico de CoreNLP, realizamos las siguientes operaciones de manera automática:[6]

  1. Se localiza a los personajes por sus variables (token name) y se normaliza su identificación con el nombre resuelto (resolved name), sustituyendo el uno por el otro
  2. Se crea un archivo con el recuento de la aparición de los personajes
  3. Se crea un archivo con el recuento de la coaparición de los personajes

 

3.3. Medidas para el análisis del espacio de los personajes

Con los datos de mención de nombre obtenidos analizamos el espacio individual de los personajes. Como se ha señalado, he escogido calcular el espacio de cada actante contando el número de veces que su nombre se menciona a lo largo de la narración. Además de contar con los datos de los nombres que aparecen en las dos novelas que nos ocupan en forma de tabla, creamos un gráfico para facilitar el análisis de los datos como muestran las figuras 1 y 2. Aquí podemos observar que en ambas novelas el espacio de los personajes presenta una distribución de larga estela:

Figura 1. Espacio de los personajes en Zumalacárregui
Figura 1. Espacio de los personajes en Zumalacárregui
Figura 2. Espacio de los personajes en Mendizábal
Figura 2. Espacio de los personajes en Mendizábal

Esta distribución indica que hay un número muy pequeño de personajes muy mencionados (entre dos y tres), una quincena de personajes menos frecuentes, y más de cien personajes que se mencionan menos de diez veces. Como Sack (2011), estimo que dicha distribución corresponde respectivamente a los protagonistas, los personajes secundarios y los terciarios. En este caso, los primeros serían Tomás de Zumalacárregui, José Fago y Carlos María Isidro de Borbón en Zumalacárregui y Fernando Calpena y Álvarez de Mendizábal en Mendizábal. Como personajes secundarios principales tenemos las figuras de Adrián Ulibarri y Ceferino Ibarburu en la primera novela y a Pedro Hillo y Jacoba Zahón en la segunda. El resto de personajes son los que Woloch denomina “minor minor characters” (116) o los que, en su interpretación, están abocados al olvido por parte del lector. Es decir, son actantes muy débiles que, por lo general, son casi prescindibles. Como apunta Sack, “readers experience [them] as a depersonalized mass rather than as individuals, as narrative scaffolding, on the border between character and landscape” (129). Como vemos, su espacio individual es muy limitado.

En consonancia con una lectura cercana de las novelas, sabemos que esta simple operacionalización del espacio del personaje ha captado quiénes son los actantes imprescindibles en las tramas de Zumalacárregui y de Mendizábal. Sin embargo, vamos a aprovechar estos datos junto con los del sistema de personajes para identificar y explicar la forma en que esos personajes cumplen una función que, a la vez, casa con una percepción espontánea de los mismos.

3.4. Medidas para el análisis del sistema de los personajes

El sistema de los personajes es una estructura de tipo social en la que hay un vínculo entre personajes. Habiendo calculado un vínculo no direccionado por la coaparición de dos personajes en un mismo capítulo (ver tablas 4 y 5 del apéndice 7.2), estudio los datos mediante el análisis aplicado a las redes sociales.

En primer lugar calculo la centralidad de grado (degree centrality) o valencia de cada vértice, esto es, el número total de vínculos que tiene cada nodo. En nuestro sistema, esto indica el número de conexiones con otros personajes. Por ejemplo, como personaje más conectado en su novela homónima, Zumalacárregui posee una valencia de 60 o, lo que es lo mismo, está conectado a 60 personajes. En términos de la función del personaje, equiparamos esta medida con la popularidad del mismo.

Otra de las medidas típicas en el estudio de redes sociales y que es de gran utilidad a la hora de calcular quién puede ser el personaje principal de una novela es la medida de centralidad de vector propio (eigenvector centrality). Esta centralidad depende de la localización del nodo en el sistema y con ella se calcula su influencia por conexión. Es decir, su peso relativo en la estructura depende no solo de sus propias conexiones sino también de los vínculos que estas otras posean. Dicho de otro modo, señala a aquellos personajes que están mejor conectados y que forman grupos cohesivos o cliques. En Mendizábal vemos cómo Fernando Calpena es el nodo más influyente del sistema de la novela, con centralidad de 1.0.

Por separado, tanto la centralidad de grado como la de vector propio pueden indicar quiénes son los personajes principales en la estructura social de la narración. Ahora bien, en nuestro método consideramos que el determinante de la protagonicidad viene dado por la suma de ambas medidas. Y es que es lógico pensar que si quien tiene más conexiones es también el personaje mejor conectado, este ha de ser el protagonista de la narración. Por tanto, ahora, podemos afirmar que Tomás de Zumalacárregui, José Fago, Fernando Calpena y Álvarez de Mendizábal son los protagonistas. Pedro Hillo, que podríamos considerar el tercer protagonista en Mendizábal según su valencia de grado (tiene 65 conexiones), ocupa un puesto menos determinante en cuanto a su influencia –es el sexto en el ranking de centralidad de vector propio con 0.76– y podemos considerarlo ya como personaje secundario.

También interesa localizar a aquellos personajes imprescindibles en términos de su función como conectores entre nodos principales, secundarios y terciarios. Para ello contamos con la medida de intermediación (betweenness centrality). Esta mide el número de veces que un vértice funciona como puente al calcular el camino más corto entre dos nodos al azar. Aquellos que aparecen con mayor probabilidad en ese camino poseen un mayor grado de intermediación. Por ejemplo, los conectores principales en Mendizábal son Calpena con 1334.7 apariciones y Mendizábal con 1087.4. Hillo aparece 365.2 veces, con lo que también es un personaje secundario según esta medida.

Finalmente, aplico la medida de modularidad (modularity) a los datos. A partir de los resultados de la centralidad de vector propio, la modularidad clasifica los nodos en grupos según su conectividad en el conjunto de la estructura del sistema. Con ello detecto divisiones estructurales o comunidades de personajes en el sistema de las novelas.[7]

4. Análisis de Zumalacárregui y Mendizábal: ¿En cuál pesa más el personaje histórico?

Tras haber leído la primera y la segunda serie de los Episodios nacionales, además de la primera novela de la tercera, Gómez de Baquero estimó que el último episodio publicado por Pérez Galdós, Mendizábal, no prestaba demasiada atención a la historia. En su crónica de 1899 expresó, sobre todo, una falta de protagonismo por parte de la figura de Mendizábal a favor de un mayor espacio para el personaje ficticio y su trama:

[A] diferencia de Zumalacárregui, en que el aparato histórico ahoga la apenas esbozada intriga novelesca, en Mendizábal predomina lo novelesco sobre lo histórico. Por la parte histórica pasa tan ligero el novelista, que apenas puede decirse que la esboza (…) La figura de Mendizábal no resalta lo bastante. La vemos de lejos y entre brumas. (172-173)

Cualquiera que haya leído ambos episodios, como además luego ratificaron otros galdosistas como Mary Coffey, puede percibir ese desequilibrio entre la ficción y la historia en Mendizábal. Como plantea Woloch, relaciono dicha percepción con la idea de la existencia de un espacio individual del personaje que influye en la atención prestada por el lector. Por ello, planteo la posibilidad de notar esa diferencia de espacios en el sistema de ambas narraciones para comprobar si, efectivamente, la primera novela se preocupa más que la segunda por la historia. Como veremos, nuestro análisis y la visualización del sistema de los personajes corroboran que hay una reducción de espacio del personaje histórico y un consecuente debilitamiento del aparato histórico en la segunda novela.

La red social de Zumalacárregui está formada por 61 nodos y 410 vínculos y la de Mendizábal por 102 personajes y 910 conexiones.[8] Aunque, en general, la diferencia entre la distribución de espacios no es demasiado pronunciada, una vez que prestamos atención a sus características particulares, vemos que el reparto de espacio de los personajes ficticios e históricos es sumamente diferente. Mientras que en Zumalacárregui de los seis primeros personajes cinco son históricos y uno es ficticio, en Mendizábal, al contrario, encontramos a un personaje histórico frente a cinco ficticios. Su distribución en la estructura, además, no es casual.

De manera relevante, si nos fijamos en las figuras 3 y 4 notamos que hay una clara división de comunidades entre los protagonistas principales de Mendizábal y, al revés, una pertenencia de los mismos a un único módulo en Zumalacárregui. En esta última, con tres comunidades, vemos cómo el general, el pretendiente a la corona y José Fago pertenecen al mismo grupo (comunidad 0, en morado), así como otros personajes históricos como Adrián Ulibarri, fusilado por el general (Sainz de Robles 1.068), y Fructuoso Arespacochaga, “cortesano de don Carlos” (Cap. XX). Curiosamente, en la segunda comunidad (1, en naranja) tenemos al capitán Fernández de Córdoba, Isabel II, Francisco Espoz y Mina o Baldomero Espartero, todos pertenecientes al bando isabelino. La formación de una tercera comunidad (2, en verde) la debemos a un menor grado de centralidad del vector propio, es decir, los personajes está relativamente desconectados del resto del sistema y, sin embargo, están conectados al grupo carlista (son ayudantes, familiares o médicos de Zumalacárregui).

Por su parte, en Mendizábal, la pareja de actores principales queda dividida en dos comunidades –aunque los personajes han sido clasificados en tres comunidades, la tercera no está claramente diferenciada de las dos principales. En la comunidad de Fernando Calpena (1, en morado) encontramos a otros personajes ficticios como Pedro Hillo, doña Jacoba Zahón y Aura Negretti y Montefiori. El grupo de de Mendizábal (comunidad 0, en naranja) está compuesto por otros personajes históricos como María Cristina de Borbón, Fermín Caballero, Carlos María Isidro de Borbón, Javier de Istúriz, Salustiano Olózaga o Agustín Argüelles.[9]

Figura 3. Sistema de personajes de Zumalacárregui con medidas de valencia y modularidad
Figura 3. Sistema de personajes de Zumalacárregui con medidas de valencia y modularidad
Figura 4. Sistema de personajes de Mendizábal con medidas de valencia y modularidad
Figura 4. Sistema de personajes de Mendizábal con medidas de valencia y modularidad

Estimo que las diferencias obtenidas con la medida de modularidad –que a su vez se apoya en el resto de medidas– son clave a la hora de explicar la impresión de Gómez de Baquero cuando apunta que “en Mendizábal predomina lo novelesco sobre lo histórico” (172). Teniendo en cuenta el contexto histórico en que Pérez Galdós se basó para escribir Zumalacárregui, en el grafo de la red social reconocemos la división histórica entre carlistas e isabelinos de la Primera Guerra Carlista (1833-1839). Esto es, desde nuestra perspectiva podemos afirmar que, efectivamente, hay un mayor hincapié en la historia y la estructura social sincrónica muestra el enfrentamiento bélico real. En la segunda novela la división entre personajes históricos y ficticios apunta hacia la gran relevancia que adquieren los segundos en el desarrollo de la trama, alejada de la conflictividad histórica.

Para comprender estas diferencias atendemos a lo apuntado por Coffey. Según esta autora, la tercera serie de los Episodios conforma, en realidad, un bildungsroman de ocho novelas enmarcadas por la primera, Zumalacárregui, y la última, Bodas reales, y dividido en dos partes simétricas por La campaña del Maestrazgo. Como tal, no es de extrañar la percepción de Gómez de Baquero y los resultados de nuestra lectura. En la primera novela, desde una posición tradicionalista, la búsqueda de identidad nacional personalizada en el ficticio Fago corre paralela a la vida del personaje histórico. Tanto es así que, al final, ambos mueren para representar la existencia truncada de la causa tradicionalista (Coffey 131). La segunda novela, en cambio, es solo el comienzo de la búsqueda de identidad de Calpena, ahora desde una postura progresista. Puesto que la evolución de este se extiende más en el tiempo que la de Fago, su vida va unida a la de otros personajes sin necesidad de crear un transcurrir paralelo a la figura de Mendizábal. Además, frente a la red social más bien reducida de Zumalacárregui, si tenemos en cuenta que “in nearly every novel which constitutes the third series, the search for identity is present and bound up in the struggle to accumulate and exercise various forms of power” (Coffey 125), el gran número de conexiones de Fernando apunta, como héroe romántico, tanto al desconocimiento de su origen como al poco control que tiene sobre sus actos. Su posicionamiento en este primer sistema de personajes del bildungsroman seriado es un claro indicador tanto de su protagonicidad en las novelas como del distanciamiento de la narración de los hechos puramente históricos. En efecto, los personajes históricos a los que aludía Gómez de Baquero quedan “descentrados” de la trama o, lo que es lo mismo, poseen un menor grado de distribución para captar la atención del lector en el sistema de la narración.

5. Conclusiones

La constatación de que nuestro modelo de análisis refleja la percepción de las lecturas a ras de texto centradas en los personajes de las novelas es esclarecedora. De nuestro análisis del sistema de los personajes concluimos que la diferencia central entre Zumalacárregui y Mendizábal es la oposición de grados de protagonicidad e intermediación entre los personajes históricos y los ficticios. Además, el análisis de la formación de comunidades explica la percepción de una mayor historicidad en Zumalacárregui al notar el enfrentamiento histórico de la Primera Guerra Carlista. Luego, es posible pensar en el uso de este tipo de herramientas para estudiar otras novelas y hacernos diferentes preguntas como, por ejemplo, si el sistema de los personajes de la tercera serie completa refleja el género del bildungsroman o si este sistema de relaciones refleja la estructura de una sociedad real.

6. Bibliografía

Agarwal, Apoorv, Anup Kotalwar and Owen Rambow (2012). “Social Network Analysis of Alice in Wonderland.” Proceedings of the Workshop on Computational Linguistics for Literature, The Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies: pp. 88–96.

Aggarwal, Charu C (2011). Social Network Data Analytics. New York: Springer.

Alberich, R., J. Miro-Julia and F. Roselló (2008). “Marvel Universe looks almost like a real social network.” Preprint submitted to Elsevier. <https://arxiv.org/abs/cond-mat/0202174v1> (12-5-2017)

Caldarelli, Guido y Michele Catanzaro (2014). Redes: Una Breve Introducción. Madrid: Alianza Editorial.

Elson, David K., Nicholas Dames and Kathleen R. McKeown (2010). “Extracting Social Networks  from Literary Fiction.” Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics: pp. 138-147.

Falk, Michael Gregory (2015). “Modelling Genre Using Character Networks: The National Tales and Domestic Novels of Maria Edgeworth.” Poster presentation at Digital Humanities International Conference.

Gómez de Baquero, Eduardo (1899). “Crónica literaria.” La España Moderna 11: pp. 171-181.

Holanda, Adriano, Mariane Matias, Sueli M. S. P. Ferreira, Gisele M. L. Benevides, and Osame Kinouchi (2017). “Character Networks and Book Genre Classification.” Submitted to Physica A.

Jameson, Fredric (1981). The Political Unconscious: Narrative as a Socially Symbolic Act. Cornell University Press.

Jockers, Matthew L (2014). Text Analysis with R for Students of Literature. New York: Springer.

Kenna, Ralph, Máirín MacCarron, and Pádraig MacCarron (2017). Maths Meets Myths: Quantitative Approaches to Ancient Narratives. New York: Springer.

Moretti, Franco (2011). “Network Theory, Plot Analysis.” Literary Lab. Stanford. <litlab.stanford.edu/LiteraryLabPamphlet2.pdf> (24-7-2017)

— (2013). “Operationalizing: Or, the Function of Measurement in Literary Theory.” New Left Review 84: pp. 103–119.

Newman, M.E.J and M. Girvan (2004). “Finding and Evaluating Community Structure in Networks.” Phys. Rev. E: pp. 69.2.

Pérez Galdós, Benito (2012). Episodios nacionales. Wikisource. <https://es.wikisource.org/wiki/Episodios_nacionales> (3-1-2016)

Sack, Graham Alexander (2011). “Simulating Plot: Towards a Generative Model of Narrative Structure.” Complex Adaptive Systems: Energy, Information and Intelligence Conference. Arlington, Virginia: pp. 127-136.

Sainz de Robles, Federico Carlos (1993). “Censo de personajes galdosianos.” En Benito Pérez Galdós. Episodios nacionales. Tomo V. Madrid: Aguilar.

Stiller, James, Daniel Nettle and Robin I. Dunbar (2003). “The Small World of Shakespeare’s Plays.” Human Nature, Vol. 14, No. 4: pp. 397-408.

Woloch, Alex (2003). The One Vs. The Many: Minor Characters and the Space of the Protagonist in the Novel. Princeton: Princeton University Press.

7. Apéndice

7.1. Conversión de la descripción del personaje en metadatos

Marijuán, Andresillo

Alegre mozo de mulas en casa de la condesa de Rumblar –tierras de Almunia de Doña Godina… Se disparaba como un cohete. Bravo. Peleó contra los franceses en todas partes. Y es suya la relación del sitio de Gerona, donde no estuvo Gabriel Araceli, narrador de los restantes nueve episodios de la Primera Serie. Andresillo protegió a los huérfanos de Mongat y se hizo novio de la angelical Siseta. (896)

resolved token social class gender F/H action/reference
Andresillo Marijuán Andresillo Marijuán baja m F a
Andresillo Marijuán Marijuán baja m F a
Andresillo Marijuán Andresillo baja m F a

Tabla 2. Ejemplo de metadatos de un personaje

7.2. Resultados resumidos de la minería de datos

Zumalacárregui Mendizábal
name count name count
_Tomás_Zumalacarregui_ 311 _Fernando_Calpena_ 364
_José_Fago_ 282 _Alvarez_de_Mendizábal_ 201
_Carlos_María_Isidro_de_Borbón_ 82 _Pedro_Hillo_ 176
_don_Adrián_Ulibarri_ 60 _doña_Jacoba_Zahón_ 151
_Ceferino_Ibarburu_ 58 _Aurora_Negretti_y_Montefioiri_ 105
_Fructuoso_Arespacochaga_ 39 _Carlos_Maturana_ 77
_don_Fernando_Fernández_de_Córdoba_ 33 _José_del_Milagro_ 68
_Saloma_la_Baturra_ 32 _don_Nicomedes_Iglesias_ 64
_Salomé_Ulibarri_ 28 _María_Cristina_de_Borbón_ 35
_Francisco_Javier_Espoz_y_Mina_ 26 _Cayetano_Lopresti_ 30
_Iturralde_ 23 _Jenaro_Negretti_ 29
_Gorría_ 19 _don_Fermín_Caballero_ 25
_don_Marcelino_Oraa_ 18 _don_Fernando_Fernández_de_Córdoba_ 24
_Isabel_II_ 17 _don_Agustín_Argüelles_ 19

Tabla 3. Menciones por personaje en Zumalacárregui y en Mendizábal —top 14

source target freq
_José_Fago_ _Tomás_Zumalacarregui_ 31
_Carlos_María_Isidro_de_Borbón_ _José_Fago_ 27
_Carlos_María_Isidro_de_Borbón_ _Tomás_Zumalacarregui_ 27
_don_Fernando_Fernández_de_Córdoba_ _Tomás_Zumalacarregui_ 15
_don_Adrián_Ulibarri_ _José_Fago_ 14
_don_Fernando_Fernández_de_Córdoba_ _José_Fago_ 14
_Carlos_María_Isidro_de_Borbón_ _don_Adrián_Ulibarri_ 13
_don_Adrián_Ulibarri_ _Tomás_Zumalacarregui_ 13
_Carlos_María_Isidro_de_Borbón_ _don_Fernando_Fernández_de_Córdoba_ 12
_Carlos_María_Isidro_de_Borbón_ _Fructuoso_Arespacochaga_ 12
_Francisco_Javier_Espoz_y_Mina_ _José_Fago_ 12
_Francisco_Javier_Espoz_y_Mina_ _Tomás_Zumalacarregui_ 12

Tabla 4. Coapariciones/vínculos en Zumalacárregui

source target freq
_Alvarez_de_Mendizábal_ _Fernando_Calpena_ 30
_doña_Jacoba_Zahón_ _Fernando_Calpena_ 20
_Fernando_Calpena_ _Pedro_Hillo_ 18
_Alvarez_de_Mendizábal_ _doña_Jacoba_Zahón_ 17
_Alvarez_de_Mendizábal_ _Pedro_Hillo_ 16
_Aurora_Negretti_y_Montefioiri_ _Fernando_Calpena_ 16
_Fernando_Calpena_ _José_del_Milagro_ 16
_Aurora_Negretti_y_Montefioiri_ _doña_Jacoba_Zahón_ 15
_doña_Jacoba_Zahón_ _José_del_Milagro_ 15
_Alvarez_de_Mendizábal_ _Aurora_Negretti_y_Montefioiri_ 14
_Alvarez_de_Mendizábal_ _José_del_Milagro_ 13
_Carlos_Maturana_ _Fernando_Calpena_ 13

Tabla 5. Coapariciones/vínculos en Mendizábal

7.3. Datos y resultados resumidos del análisis de las redes sociales

character H/F & class degree betweenness centrality eigen centrality community
_Tomás_Zumalacarregui_ H militar 60 413.956 1.0 0
_José_Fago_ F iglesia 59 390.372 0.992 0
_Carlos_María_Isidro_de_Borbón_ H aristocracia 56 313.106 0.973 0
_don_Fernando_Fernández_de_Córdoba_ H militar 33 58.816 0.724 1
_don_Adrián_Ulibarri_ H alta 31 46.699 0.695 0
_Fructuoso_Arespacochaga_ H alta 29 42.298 0.649 0
_Isabel_II_ H aristocracia 27 26.795 0.654 1
_Benito_Francisco_Eraso_ H militar 25 30.335 0.597 1
_Francisco_Javier_Espoz_y_Mina_ H militar 23 11.879 0.602 1
_Iturralde_ H militar 23 17.676 0.582 1
_Saloma_la_Baturra_ F baja 21 22.166 0.479 0
_don_Marcelino_Oraa_ H militar 19 8.776 0.514 1
_Salomé_Ulibarri_ F media 17 4.591 0.483 0
_don_Bruno_Villarreal_ F baja 16 1.990 0.479 1
_Gorría_ H militar 16 6.040 0.444 1
_brigadier_Lorenzo_ H militar 15 4.117 0.434 1
_don_Baldomero_Espartero_ H militar 14 2.526 0.424 1
_Chomín_ H iglesia 14 1.809 0.415 1
_San_Fernando_ F baja 14 2.000 0.415 1
_Ceferino_Ibarburu_ F iglesia 13 1.681 0.402 0

Tabla 6. Datos analizados en la red social de los personajes de Zumalacárregui —top 20.

character H/F & class degree betweenness centrality eigen centrality community
_Fernando_Calpena_ F media 101 1334.713 1.0 1
_Alvarez_de_Mendizábal_ H alta, militar 96 1087.429 0.981 0
_doña_Jacoba_Zahón_ F alta 65 263.169 0.824 1
_Pedro_Hillo_ F iglesia 65 365.256 0.766 1
_José_del_Milagro_ F media 60 204.548 0.795 1
_Aurora_Negretti_y_Montefioiri_ F media 59 214.523 0.776 1
_María_Cristina_de_Borbón_ H aristocracia 41 63.514 0.620 0
_don_Fermín_Caballero_ H alta 40 57.073 0.615 0
_don_Nicomedes_Iglesias_ F media 38 61.737 0.573 0
_Carlos_Maturana_ F alta 37 60.619 0.529 1
_Jenaro_Negretti_ F alta 36 49.226 0.535 1
_Carlos_María_Isidro_de_Borbón_ H aristocracia 34 36.682 0.555 0
_Francisco_Javier_de_Istúriz_ H alta 34 33.669 0.557 0
_Méndez_ F baja 33 42.343 0.505 1
_Salustiano_Olózaga_ H alta 33 30.150 0.543 0
_don_Agustín_Argüelles_ H alta 33 24.727 0.559 0
_Cayetano_Lopresti_ F baja 28 16.986 0.479 1
_Filiberto_Muñoz_ F baja 28 23.757 0.463 1
_Isabel_II_ H aristocracia 27 12.545 0.478 0
_don_Francisco_Martínez_de_la_Rosa_ H alta 26 10.581 0.461 0

Tabla 7. Datos analizados en la red social de los personajes de Mendizábaltop 20.

Caracteres vol.6 n2

· Descargar el vol.6 nº2 de Caracteres como PDF.

· Descargar este texto como PDF.

· Regresar al índice de la edición web.

Notas:    (↵ regresa al texto)

  1. Redes sociales en obras de teatro (Newman y Girvan 2003, Stiller et al. 2003, Moretti 2011 y 2013), en cómics (Alberich et al. 2008) y en novelas (Elson et al. 2010, Agarval et al. 2012). En este último caso también para entender mejor qué es lo que distingue a unos géneros novelísticos de otros (Falk 2015, Kenna et al. 2017, Holanda et al. 2017).
  2. El presente texto es parte de la investigación doctoral “Posibilidades de la minería de datos digital para el análisis del personaje literario en la novela española: el caso de Galdós y los Episodios nacionales” (en fase final).
  3. El corpus electrónico se ha preparado a partir de la versión digital de las novelas en la colección “Benito Pérez Galdós” de la biblioteca libre Wikisource. https://es.wikisource.org/wiki/Autor:Benito_Pérez_Galdós
  4. Se han descartado aquellos personajes que no cuentan con un nombre propio o un apodo, como “jardinero jovencito” (851), “vieja guipuzcoana,” “una vieja gruñona,” “una vieja vendedora de rosquillas,” “viejas de Torrejón de Ardoz” (1081), etc. Véase al apéndice 7.1 para ver un ejemplo de la conversión de la descripción de un personaje en metadatos.
  5. No es posible saber la clase social o género de todos los personajes y, por tanto, el número total de la suma de las diferentes clasificaciones no corresponde con el total de personajes.
  6. Véase el apéndice 7.2 para los resultados resumidos en las tablas 3, 4 y 5.
  7. Véase el apéndice 7.3 para leer los resultados resumidos de las operaciones de valencia, vector propio, intermediación y modularidad.
  8. Para este estudio hemos procesado la red con aquellas parejas de personajes que cuentan con 2 o más coapariciones.
  9. unque ha ocurrido con la mayoría, no todos los personajes han quedado divididos según su postura política en la historia o su condición de ficticio o histórico. Por ejemplo, en Zumalacárregui Benito Eraso está en la comunidad isabelina pero luchó por la causa carlista, de ahí que la tercera comunidad quede conectada también a él.

Caracteres. Estudios culturales y críticos de la esfera digital | ISSN: 2254-4496 | Salamanca