REFORMA CONSTITUCIONAL EN SANTA FE
Cómo la IA está desvelando textos antiguos y podría reescribir la historia
Domingo 05 de
Enero 2025
Desde descifrar pergaminos romanos quemados hasta leer tablillas cuneiformes desmoronadas, las redes neuronales podrían proporcionar a los investigadores más datos de los que han tenido en siglos.
En octubre de 2023, Federica Nicolardi recibió un correo electrónico en su teléfono con una imagen que transformaría su investigación para siempre. Mostraba un fragmento de un rollo de papiro que se había quemado en la erupción del Vesubio en el año 79 d . C. El rollo quemado era uno de los cientos descubiertos en los restos de una lujosa villa romana en Herculeaneum, cerca de Pompeya en Italia, en el siglo XVIII. Los intentos a lo largo de los siglos de separar las frágiles capas carbonizadas de los rollos dejaron muchas en pedazos, y los académicos se han visto obligados a aceptar que el resto nunca podrá abrirse.
Nicolardi, papirólogo de la Universidad de Nápoles, en Italia, había sido reclutado en un esfuerzo por utilizar inteligencia artificial (IA) para leer lo ilegible. Ahora habían llegado los últimos resultados. La imagen mostraba una tira de papiro llena de letras griegas nítidas, que brillaban intensamente sobre un fondo más oscuro. La escritura era claramente legible, tenía unas pocas líneas de profundidad y se extendía a lo largo de casi cinco columnas.
“Fue increíble”, dice Nicolardi. “Pensé: ‘Esto es realmente lo que está pasando’”. En ese momento supo que la papirología nunca volvería a ser la misma. “En ese momento, realmente piensas: ‘Ahora estoy viviendo algo que será un momento histórico para mi campo’”. Estaba leyendo líneas enteras de un texto que había sido completamente inaccesible durante 2000 años.
Ese proyecto, llamado Vesuvius Challenge, es sólo un ejemplo de cómo la sofisticada inteligencia artificial, que ya está revolucionando todas las áreas de la vida moderna, desde la banca hasta la investigación médica, está lista para transformar nuestra visión del mundo antiguo. Se están utilizando redes neuronales artificiales para descifrar textos antiguos, desde los incondicionales clásicos del griego y el latín hasta la escritura china sobre huesos de oráculo, antiguos textos de adivinación escritos en huesos de ganado y caparazones de tortuga. Están dando sentido a archivos demasiado vastos para que los humanos los lean, completando caracteres faltantes e ilegibles y descodificando lenguas raras y perdidas de las que apenas sobreviven rastros.
Los resultados prometen una avalancha de nuevos textos, que ofrecerán a los investigadores más datos de los que han tenido durante siglos. Pero eso no es todo. Debido a que las herramientas de inteligencia artificial pueden reconocer más idiomas y almacenar más información de la que cualquier persona puede conocer (y descubrir patrones estadísticos en los textos por sí mismas), estas tecnologías prometen una forma fundamentalmente nueva de explorar las fuentes antiguas. Eso podría transformar “no solo las preguntas que queremos responder”, dice Nicolardi, “sino las preguntas que podemos hacer”.
Reconstrucción de textos antiguos
Las computadoras se han utilizado para categorizar y analizar textos digitalizados durante décadas, pero el entusiasmo actual proviene del uso de redes neuronales, que comprenden capas jerárquicas de nodos interconectados y, en particular, las redes neuronales "profundas" que tienen múltiples capas internas.
Los primeros intentos de aplicar el aprendizaje profundo a los textos antiguos, en la década de 2010, se basaron en fotografías digitales de textos, ya sea en papiros o en hojas de palma. Los modelos llamados redes neuronales convolucionales (CNN), inspirados en la neurociencia visual, pueden capturar datos en forma de cuadrícula a partir de imágenes. Se utilizan para el reconocimiento óptico de caracteres, pero también hay otras aplicaciones: los equipos chinos que estudian Oracle Bone Script han utilizado estos modelos para completar imágenes de letras erosionadas 1 , analizar cómo evolucionaron los caracteres del oráculo con el tiempo 2 y reconstruir fragmentos rotos. Mientras tanto, las redes neuronales recurrentes (RNN), diseñadas para abordar secuencias de datos en las que importa el orden lineal, comenzaron a mostrar un enorme potencial para buscar, traducir y llenar vacíos en textos que ya han sido transcritos. Se han utilizado, por ejemplo, para sugerir caracteres faltantes en cientos de textos administrativos y legales formulaicos de la antigua Babilonia.
¿Pueden las redes neuronales ir más allá de acelerar tareas tediosas y establecer conexiones que los especialistas humanos no pueden? El primer gran proyecto para demostrar el potencial de la IA comenzó como una colaboración en la Universidad de Oxford, Reino Unido, en 2017, donde Thea Sommerschield estaba haciendo un doctorado en historia antigua y Yannis Assael estaba haciendo un doctorado en informática. Sommerschield estaba tratando de descifrar inscripciones griegas de Sicilia y le explicó a Assael los desafíos que implicaba. "Son muy complejas de leer, están mal conservadas, faltan partes de ellas", dice. "No estamos realmente seguros de dónde vinieron o cuáles son sus fechas; hay mezclas interesantes de dialectos".
Los clasicistas interpretan nuevas fuentes utilizando su conocimiento de textos similares existentes. Por lo general, son especialistas en obras de un tiempo y lugar en particular; no es posible que una persona esté al tanto de todas las fuentes potencialmente relevantes para un nuevo texto. Era justo el tipo de desafío en el que los modelos de aprendizaje automático podían ayudar, sugirió Assael, que ahora trabaja en Google DeepMind en Londres.
Los investigadores entrenaron inicialmente un modelo basado en RNN llamado Pythia con decenas de miles de inscripciones griegas escritas entre el siglo VII a. C. y el siglo V d . C. Luego le mostraron textos que no había visto antes y le pidieron que sugiriera palabras o caracteres faltantes.
Sommerschield, ahora en la Universidad de Nottingham, Reino Unido, todavía recuerda la primera vez que utilizó el modelo con Assael y su supervisor, Jonathan Prag, y vio cómo la restauración aparecía carácter por carácter en la pantalla, algo que nunca antes había sido posible.
“Fue como una escena de una película”, dice. “Realmente sentimos que se nos caía la mandíbula al suelo”. En 2022, continuaron con un modelo llamado Ithaca, que también sugiere la fecha y el lugar de origen de un texto desconocido 6 . Esta vez, los investigadores aprovecharon un avance en el aprendizaje automático llamado modelo transformador, que captura patrones lingüísticos más complejos que los que puede hacer una RNN al analizar diferentes características de una entrada, como caracteres o palabras, en paralelo, ponderándolas según el contexto. (Los chatbots populares como ChatGPT de OpenAI y Claude de Anthropic se basan en modelos transformadores).
Sommerschield afirma que el objetivo del equipo es diseñar herramientas que ayuden a los investigadores a trabajar de forma más eficaz: la red neuronal investiga las conexiones en un vasto archivo y el ser humano aporta su conocimiento especializado. "El ser humano está en el centro de nuestro diseño", coincide Assael. En las pruebas, Ithaca restauró los huecos producidos artificialmente en textos antiguos con un 62% de precisión, en comparación con el 25% de los expertos humanos. Pero los expertos ayudados por las sugerencias de Ithaca obtuvieron los mejores resultados de todos, rellenando los huecos con una precisión del 72%. Ithaca también identificó los orígenes geográficos de las inscripciones con un 71% de precisión y las fechó con un margen de 30 años respecto de las estimaciones aceptadas.
Ítaca está disponible en línea de forma gratuita y ya recibe cientos de consultas por semana, según sus creadores. No es posible saber cuándo ha contribuido a la investigación a menos que los autores decidan reconocerlo, dice Sommerschield, pero los ejemplos informados hasta ahora incluyen la redatación de decretos políticos atenienses y una investigación de tablillas del siglo IV a. C. que contienen preguntas formuladas al Oráculo de Dodona en el noroeste de Grecia.
Un océano de archivos
Mientras tanto, los investigadores surcoreanos se enfrentan a retos muy diferentes al abordar uno de los archivos históricos más grandes del mundo: registros diarios detallados con cientos de miles de artículos que cubren los reinados de 27 reyes coreanos, que datan desde el siglo XIV hasta principios del siglo XX. "La cantidad de datos es enorme", dice Kyunghyun Cho, un destacado investigador de traducción automática en la Universidad de Nueva York en la ciudad de Nueva York. Cho suele trabajar con idiomas modernos, pero se interesó en los archivos después de discutirlos con su padre, un profesor jubilado de literatura coreana. Estos registros están completos y se conocen sus orígenes, pero casi nadie puede leerlos. Están escritos en hanja, un antiguo sistema de escritura basado en caracteres chinos que es diferente del chino o el coreano modernos.
Un pequeño equipo de traductores del gobierno está trabajando para traducir los textos al coreano moderno de forma manual, pero es probable que la tarea tarde décadas en completarse. Trabajando con colegas en Corea del Sur, incluido JinYeong Bak en la Universidad Sungkyunkwan en Seúl, Cho entrenó una red basada en transformadores para traducir los registros automáticamente 7 . Todavía no se ha traducido suficiente material al coreano moderno para entrenar un modelo de este tipo, por lo que el equipo adoptó un enfoque multilingüe, utilizando hanja, traducciones realizadas hace varias décadas al coreano arcaico y el número limitado de traducciones modernas tanto al coreano como al inglés. Los especialistas humanos calificaron las traducciones de IA (descripciones de eventos como visitas de estado, castigos a traidores y conciertos musicales) como significativamente más precisas y legibles que las arcaicas, y en algunos casos mejores que la traducción moderna 8 .
En el otro extremo de la escala, los investigadores están utilizando redes neuronales para abordar idiomas antiguos para los que solo sobrevive una pequeña cantidad de texto. Los modelos de transformación no siempre se pueden utilizar en estos casos, porque necesitan grandes cantidades de material de entrenamiento. Por ejemplo, Katerina Papavassileiou de la Universidad de Patras, Grecia, y sus colegas utilizaron una RNN para restaurar el texto faltante de una serie de 1.100 tablillas micénicas de Cnosos, Creta, que contienen relatos de rebaños de ovejas escritos en una escritura llamada Lineal B en el segundo milenio a. C. 9 . En pruebas con espacios vacíos producidos artificialmente, las diez predicciones principales del modelo incluyeron la respuesta correcta el 72% de las veces, y en casos del mundo real a menudo coincidieron con las sugerencias de especialistas humanos. Para mejorar aún más los resultados, Papavassileiou espera agregar datos visuales, como rastros de letras incompletas, en lugar de confiar solo en el texto transliterado. También está investigando el "aprendizaje por transferencia", en el que el modelo aplica las lecciones aprendidas de una serie de tabletas a otra 10 .
Papavassilieou espera algún día utilizar modelos entrenados en Lineal B para abordar el Lineal A, una escritura utilizada por la civilización minoica que comparte muchos símbolos con el Lineal B pero que nunca ha sido descifrada.
Descifrando lo ilegible
Tal vez la prueba definitiva del poder de la IA para resolver desafíos monumentales sea el éxito de los investigadores que estudian los rollos de Herculano. "Creo que están haciendo uno de los trabajos más asombrosos que existen", dice Assael. El científico informático Brent Seales y sus colegas de la Universidad de Kentucky en Lexington, con la ayuda de los participantes del Vesuvius Challenge, están abordando la aparentemente imposible tarea de leer un texto que no se puede ver en absoluto.
La lectura de los rollos de Herculano implica superar dos grandes problemas. En primer lugar, los frágiles rollos no se pueden desenrollar. Para ver su interior, Seales pasó años desarrollando una tecnología de "desenrollado virtual", que implica tomar tomografías computarizadas (TC) de alta resolución de la estructura interna de un rollo, mapear minuciosamente a mano las superficies visibles en cada cuadro de la sección transversal y luego usar algoritmos para desenrollar las superficies en una imagen plana. En 2015, los investigadores utilizaron esta técnica para leer el texto completo del interior de un rollo carbonizado e inabrible de En-Gedi en Israel, que data del siglo III d. C. , que resultó ser del Libro bíblico de Levítico 11 .
El rollo de En-Gedi tiene cinco vueltas; los rollos de Herculano contienen cada uno cientos de vueltas, tan finas como la seda. Por eso, para capturar datos de TC de resolución extremadamente alta, el equipo transportó varios de los rollos al acelerador de partículas Diamond Light Source, cerca de Oxford. Pero mientras que la tinta del rollo de En-Gedi y otras obras posteriores tiende a contener hierro, que brilla intensamente en las tomografías computarizadas, los escribas de Herculano utilizaron tinta a base de carbono, invisible en las tomografías porque tiene la misma densidad que el papiro sobre el que se asienta. Seales y su equipo se dieron cuenta de que, aunque no podían ver la tinta directamente, podrían detectar su forma. Si había una diferencia sutil en la textura de la superficie de las fibras de papiro desnudas en comparación con las recubiertas de tinta, tal vez podrían entrenar una red neuronal para detectar la diferencia.
Era demasiado trabajo para el pequeño equipo de Seales, por lo que en marzo de 2023 se unieron al empresario de Silicon Valley Nat Friedman para lanzar el Vesuvius Challenge, que ofrecía grandes premios en efectivo. Seales y sus colegas publicaron imágenes aplanadas de superficies de pergaminos y pidieron a los concursantes que entrenaran redes neuronales para encontrar la tinta. Más de 1.000 equipos compitieron, y cientos de personas discutieron el progreso en el canal Discord del concurso todos los días. En febrero de 2024 se otorgó un gran premio: los estudiantes de informática Youssef Nader, Luke Farritor y Julian Schilliger recibieron juntos 700.000 dólares por producir 16 columnas de texto claramente legible .
El equipo ganador utilizó un TimeSformer, una variante más reciente del modelo de transformador, que se utiliza habitualmente para vídeos, que se ocupa de las dimensiones espaciales y temporales por separado. El equipo de Vesuvius lo utilizó para separar la dimensión de profundidad del papiro de la apariencia de su superficie. Nicolardi y sus colegas identificaron posteriormente el texto revelado como una obra hasta entonces desconocida de filosofía griega sobre música, placer y sensación, posiblemente del filósofo epicúreo Filodemo. Trabajar en él fue “mágico”, afirma.
Desde entonces, los concursantes han estado trabajando para mejorar sus algoritmos de detección de tinta, con la ayuda de los papirólogos. Mientras tanto, el equipo de Seales está escaneando más pergaminos y espera que el aprendizaje automático pueda acelerar el paso de desenrollado virtual. Ese es el cuello de botella que actualmente limita los datos con los que tienen que trabajar los concursantes, dice. Es optimista de que el desenrollado impulsado por IA estará disponible a tiempo para que alguien gane el Gran Premio de 2024, de 200.000 dólares, por leer el 90% de cuatro pergaminos. "Una vez que lo automatices, básicamente puedes escalarlo", dice Seales sobre el desenrollado. "Estamos en la cúspide de eso".
De hecho, Seales quiere leer toda la biblioteca. Hay cientos de rollos sin abrir de Herculano guardados en colecciones, la mayoría en Nápoles, pero también en París, Londres y Oxford. “Eso va a ser más texto nuevo del mundo antiguo para los papirólogos de lo que han visto en un siglo”, dice.
El método también permite acceder a otras fuentes inaccesibles, lo que Seales llama “la biblioteca invisible”. Entre ellas se encuentran los textos ocultos en las encuadernaciones de libros medievales o en los envoltorios de las momias del antiguo Egipto, para los que “está aquí, y sostenemos el objeto físico, pero no podemos leer la escritura”. El equipo ya ha capturado datos de un pergamino egipcio sin abrir que se conserva en el museo Smithsonian de Washington DC, y está en conversaciones para analizar papiros de Petra, Jordania, que se quemaron en un incendio en el siglo VII d . C.
Además, algunos arqueólogos creen que la mayor parte de la biblioteca de la villa de Herculano sigue estando bajo tierra. Si alguna vez se excavara, podrían encontrarse miles de pergaminos más. Leerlos todos sería “el mayor descubrimiento en la historia de la humanidad, en el mundo antiguo”, dice Seales. “Ahora tenemos la tecnología necesaria”.
Nicolardi, papirólogo de la Universidad de Nápoles, en Italia, había sido reclutado en un esfuerzo por utilizar inteligencia artificial (IA) para leer lo ilegible. Ahora habían llegado los últimos resultados. La imagen mostraba una tira de papiro llena de letras griegas nítidas, que brillaban intensamente sobre un fondo más oscuro. La escritura era claramente legible, tenía unas pocas líneas de profundidad y se extendía a lo largo de casi cinco columnas.
“Fue increíble”, dice Nicolardi. “Pensé: ‘Esto es realmente lo que está pasando’”. En ese momento supo que la papirología nunca volvería a ser la misma. “En ese momento, realmente piensas: ‘Ahora estoy viviendo algo que será un momento histórico para mi campo’”. Estaba leyendo líneas enteras de un texto que había sido completamente inaccesible durante 2000 años.
Ese proyecto, llamado Vesuvius Challenge, es sólo un ejemplo de cómo la sofisticada inteligencia artificial, que ya está revolucionando todas las áreas de la vida moderna, desde la banca hasta la investigación médica, está lista para transformar nuestra visión del mundo antiguo. Se están utilizando redes neuronales artificiales para descifrar textos antiguos, desde los incondicionales clásicos del griego y el latín hasta la escritura china sobre huesos de oráculo, antiguos textos de adivinación escritos en huesos de ganado y caparazones de tortuga. Están dando sentido a archivos demasiado vastos para que los humanos los lean, completando caracteres faltantes e ilegibles y descodificando lenguas raras y perdidas de las que apenas sobreviven rastros.
Los resultados prometen una avalancha de nuevos textos, que ofrecerán a los investigadores más datos de los que han tenido durante siglos. Pero eso no es todo. Debido a que las herramientas de inteligencia artificial pueden reconocer más idiomas y almacenar más información de la que cualquier persona puede conocer (y descubrir patrones estadísticos en los textos por sí mismas), estas tecnologías prometen una forma fundamentalmente nueva de explorar las fuentes antiguas. Eso podría transformar “no solo las preguntas que queremos responder”, dice Nicolardi, “sino las preguntas que podemos hacer”.
Reconstrucción de textos antiguos
Las computadoras se han utilizado para categorizar y analizar textos digitalizados durante décadas, pero el entusiasmo actual proviene del uso de redes neuronales, que comprenden capas jerárquicas de nodos interconectados y, en particular, las redes neuronales "profundas" que tienen múltiples capas internas.
Los primeros intentos de aplicar el aprendizaje profundo a los textos antiguos, en la década de 2010, se basaron en fotografías digitales de textos, ya sea en papiros o en hojas de palma. Los modelos llamados redes neuronales convolucionales (CNN), inspirados en la neurociencia visual, pueden capturar datos en forma de cuadrícula a partir de imágenes. Se utilizan para el reconocimiento óptico de caracteres, pero también hay otras aplicaciones: los equipos chinos que estudian Oracle Bone Script han utilizado estos modelos para completar imágenes de letras erosionadas 1 , analizar cómo evolucionaron los caracteres del oráculo con el tiempo 2 y reconstruir fragmentos rotos. Mientras tanto, las redes neuronales recurrentes (RNN), diseñadas para abordar secuencias de datos en las que importa el orden lineal, comenzaron a mostrar un enorme potencial para buscar, traducir y llenar vacíos en textos que ya han sido transcritos. Se han utilizado, por ejemplo, para sugerir caracteres faltantes en cientos de textos administrativos y legales formulaicos de la antigua Babilonia.
¿Pueden las redes neuronales ir más allá de acelerar tareas tediosas y establecer conexiones que los especialistas humanos no pueden? El primer gran proyecto para demostrar el potencial de la IA comenzó como una colaboración en la Universidad de Oxford, Reino Unido, en 2017, donde Thea Sommerschield estaba haciendo un doctorado en historia antigua y Yannis Assael estaba haciendo un doctorado en informática. Sommerschield estaba tratando de descifrar inscripciones griegas de Sicilia y le explicó a Assael los desafíos que implicaba. "Son muy complejas de leer, están mal conservadas, faltan partes de ellas", dice. "No estamos realmente seguros de dónde vinieron o cuáles son sus fechas; hay mezclas interesantes de dialectos".
Los clasicistas interpretan nuevas fuentes utilizando su conocimiento de textos similares existentes. Por lo general, son especialistas en obras de un tiempo y lugar en particular; no es posible que una persona esté al tanto de todas las fuentes potencialmente relevantes para un nuevo texto. Era justo el tipo de desafío en el que los modelos de aprendizaje automático podían ayudar, sugirió Assael, que ahora trabaja en Google DeepMind en Londres.
Los investigadores entrenaron inicialmente un modelo basado en RNN llamado Pythia con decenas de miles de inscripciones griegas escritas entre el siglo VII a. C. y el siglo V d . C. Luego le mostraron textos que no había visto antes y le pidieron que sugiriera palabras o caracteres faltantes.
Sommerschield, ahora en la Universidad de Nottingham, Reino Unido, todavía recuerda la primera vez que utilizó el modelo con Assael y su supervisor, Jonathan Prag, y vio cómo la restauración aparecía carácter por carácter en la pantalla, algo que nunca antes había sido posible.
“Fue como una escena de una película”, dice. “Realmente sentimos que se nos caía la mandíbula al suelo”. En 2022, continuaron con un modelo llamado Ithaca, que también sugiere la fecha y el lugar de origen de un texto desconocido 6 . Esta vez, los investigadores aprovecharon un avance en el aprendizaje automático llamado modelo transformador, que captura patrones lingüísticos más complejos que los que puede hacer una RNN al analizar diferentes características de una entrada, como caracteres o palabras, en paralelo, ponderándolas según el contexto. (Los chatbots populares como ChatGPT de OpenAI y Claude de Anthropic se basan en modelos transformadores).
Sommerschield afirma que el objetivo del equipo es diseñar herramientas que ayuden a los investigadores a trabajar de forma más eficaz: la red neuronal investiga las conexiones en un vasto archivo y el ser humano aporta su conocimiento especializado. "El ser humano está en el centro de nuestro diseño", coincide Assael. En las pruebas, Ithaca restauró los huecos producidos artificialmente en textos antiguos con un 62% de precisión, en comparación con el 25% de los expertos humanos. Pero los expertos ayudados por las sugerencias de Ithaca obtuvieron los mejores resultados de todos, rellenando los huecos con una precisión del 72%. Ithaca también identificó los orígenes geográficos de las inscripciones con un 71% de precisión y las fechó con un margen de 30 años respecto de las estimaciones aceptadas.
Ítaca está disponible en línea de forma gratuita y ya recibe cientos de consultas por semana, según sus creadores. No es posible saber cuándo ha contribuido a la investigación a menos que los autores decidan reconocerlo, dice Sommerschield, pero los ejemplos informados hasta ahora incluyen la redatación de decretos políticos atenienses y una investigación de tablillas del siglo IV a. C. que contienen preguntas formuladas al Oráculo de Dodona en el noroeste de Grecia.
Un océano de archivos
Mientras tanto, los investigadores surcoreanos se enfrentan a retos muy diferentes al abordar uno de los archivos históricos más grandes del mundo: registros diarios detallados con cientos de miles de artículos que cubren los reinados de 27 reyes coreanos, que datan desde el siglo XIV hasta principios del siglo XX. "La cantidad de datos es enorme", dice Kyunghyun Cho, un destacado investigador de traducción automática en la Universidad de Nueva York en la ciudad de Nueva York. Cho suele trabajar con idiomas modernos, pero se interesó en los archivos después de discutirlos con su padre, un profesor jubilado de literatura coreana. Estos registros están completos y se conocen sus orígenes, pero casi nadie puede leerlos. Están escritos en hanja, un antiguo sistema de escritura basado en caracteres chinos que es diferente del chino o el coreano modernos.
Un pequeño equipo de traductores del gobierno está trabajando para traducir los textos al coreano moderno de forma manual, pero es probable que la tarea tarde décadas en completarse. Trabajando con colegas en Corea del Sur, incluido JinYeong Bak en la Universidad Sungkyunkwan en Seúl, Cho entrenó una red basada en transformadores para traducir los registros automáticamente 7 . Todavía no se ha traducido suficiente material al coreano moderno para entrenar un modelo de este tipo, por lo que el equipo adoptó un enfoque multilingüe, utilizando hanja, traducciones realizadas hace varias décadas al coreano arcaico y el número limitado de traducciones modernas tanto al coreano como al inglés. Los especialistas humanos calificaron las traducciones de IA (descripciones de eventos como visitas de estado, castigos a traidores y conciertos musicales) como significativamente más precisas y legibles que las arcaicas, y en algunos casos mejores que la traducción moderna 8 .
En el otro extremo de la escala, los investigadores están utilizando redes neuronales para abordar idiomas antiguos para los que solo sobrevive una pequeña cantidad de texto. Los modelos de transformación no siempre se pueden utilizar en estos casos, porque necesitan grandes cantidades de material de entrenamiento. Por ejemplo, Katerina Papavassileiou de la Universidad de Patras, Grecia, y sus colegas utilizaron una RNN para restaurar el texto faltante de una serie de 1.100 tablillas micénicas de Cnosos, Creta, que contienen relatos de rebaños de ovejas escritos en una escritura llamada Lineal B en el segundo milenio a. C. 9 . En pruebas con espacios vacíos producidos artificialmente, las diez predicciones principales del modelo incluyeron la respuesta correcta el 72% de las veces, y en casos del mundo real a menudo coincidieron con las sugerencias de especialistas humanos. Para mejorar aún más los resultados, Papavassileiou espera agregar datos visuales, como rastros de letras incompletas, en lugar de confiar solo en el texto transliterado. También está investigando el "aprendizaje por transferencia", en el que el modelo aplica las lecciones aprendidas de una serie de tabletas a otra 10 .
Papavassilieou espera algún día utilizar modelos entrenados en Lineal B para abordar el Lineal A, una escritura utilizada por la civilización minoica que comparte muchos símbolos con el Lineal B pero que nunca ha sido descifrada.
Descifrando lo ilegible
Tal vez la prueba definitiva del poder de la IA para resolver desafíos monumentales sea el éxito de los investigadores que estudian los rollos de Herculano. "Creo que están haciendo uno de los trabajos más asombrosos que existen", dice Assael. El científico informático Brent Seales y sus colegas de la Universidad de Kentucky en Lexington, con la ayuda de los participantes del Vesuvius Challenge, están abordando la aparentemente imposible tarea de leer un texto que no se puede ver en absoluto.
La lectura de los rollos de Herculano implica superar dos grandes problemas. En primer lugar, los frágiles rollos no se pueden desenrollar. Para ver su interior, Seales pasó años desarrollando una tecnología de "desenrollado virtual", que implica tomar tomografías computarizadas (TC) de alta resolución de la estructura interna de un rollo, mapear minuciosamente a mano las superficies visibles en cada cuadro de la sección transversal y luego usar algoritmos para desenrollar las superficies en una imagen plana. En 2015, los investigadores utilizaron esta técnica para leer el texto completo del interior de un rollo carbonizado e inabrible de En-Gedi en Israel, que data del siglo III d. C. , que resultó ser del Libro bíblico de Levítico 11 .
El rollo de En-Gedi tiene cinco vueltas; los rollos de Herculano contienen cada uno cientos de vueltas, tan finas como la seda. Por eso, para capturar datos de TC de resolución extremadamente alta, el equipo transportó varios de los rollos al acelerador de partículas Diamond Light Source, cerca de Oxford. Pero mientras que la tinta del rollo de En-Gedi y otras obras posteriores tiende a contener hierro, que brilla intensamente en las tomografías computarizadas, los escribas de Herculano utilizaron tinta a base de carbono, invisible en las tomografías porque tiene la misma densidad que el papiro sobre el que se asienta. Seales y su equipo se dieron cuenta de que, aunque no podían ver la tinta directamente, podrían detectar su forma. Si había una diferencia sutil en la textura de la superficie de las fibras de papiro desnudas en comparación con las recubiertas de tinta, tal vez podrían entrenar una red neuronal para detectar la diferencia.
Era demasiado trabajo para el pequeño equipo de Seales, por lo que en marzo de 2023 se unieron al empresario de Silicon Valley Nat Friedman para lanzar el Vesuvius Challenge, que ofrecía grandes premios en efectivo. Seales y sus colegas publicaron imágenes aplanadas de superficies de pergaminos y pidieron a los concursantes que entrenaran redes neuronales para encontrar la tinta. Más de 1.000 equipos compitieron, y cientos de personas discutieron el progreso en el canal Discord del concurso todos los días. En febrero de 2024 se otorgó un gran premio: los estudiantes de informática Youssef Nader, Luke Farritor y Julian Schilliger recibieron juntos 700.000 dólares por producir 16 columnas de texto claramente legible .
El equipo ganador utilizó un TimeSformer, una variante más reciente del modelo de transformador, que se utiliza habitualmente para vídeos, que se ocupa de las dimensiones espaciales y temporales por separado. El equipo de Vesuvius lo utilizó para separar la dimensión de profundidad del papiro de la apariencia de su superficie. Nicolardi y sus colegas identificaron posteriormente el texto revelado como una obra hasta entonces desconocida de filosofía griega sobre música, placer y sensación, posiblemente del filósofo epicúreo Filodemo. Trabajar en él fue “mágico”, afirma.
Desde entonces, los concursantes han estado trabajando para mejorar sus algoritmos de detección de tinta, con la ayuda de los papirólogos. Mientras tanto, el equipo de Seales está escaneando más pergaminos y espera que el aprendizaje automático pueda acelerar el paso de desenrollado virtual. Ese es el cuello de botella que actualmente limita los datos con los que tienen que trabajar los concursantes, dice. Es optimista de que el desenrollado impulsado por IA estará disponible a tiempo para que alguien gane el Gran Premio de 2024, de 200.000 dólares, por leer el 90% de cuatro pergaminos. "Una vez que lo automatices, básicamente puedes escalarlo", dice Seales sobre el desenrollado. "Estamos en la cúspide de eso".
De hecho, Seales quiere leer toda la biblioteca. Hay cientos de rollos sin abrir de Herculano guardados en colecciones, la mayoría en Nápoles, pero también en París, Londres y Oxford. “Eso va a ser más texto nuevo del mundo antiguo para los papirólogos de lo que han visto en un siglo”, dice.
El método también permite acceder a otras fuentes inaccesibles, lo que Seales llama “la biblioteca invisible”. Entre ellas se encuentran los textos ocultos en las encuadernaciones de libros medievales o en los envoltorios de las momias del antiguo Egipto, para los que “está aquí, y sostenemos el objeto físico, pero no podemos leer la escritura”. El equipo ya ha capturado datos de un pergamino egipcio sin abrir que se conserva en el museo Smithsonian de Washington DC, y está en conversaciones para analizar papiros de Petra, Jordania, que se quemaron en un incendio en el siglo VII d . C.
Además, algunos arqueólogos creen que la mayor parte de la biblioteca de la villa de Herculano sigue estando bajo tierra. Si alguna vez se excavara, podrían encontrarse miles de pergaminos más. Leerlos todos sería “el mayor descubrimiento en la historia de la humanidad, en el mundo antiguo”, dice Seales. “Ahora tenemos la tecnología necesaria”.
Con información de
Nature