Cómo la IA puede hacer historia


Como millones de personas, lo primero que hizo Mark Humphries con ChatGPT cuando se lanzó a fines de 2022 fue pedirle que realizara trucos de salón, como escribir poesía al estilo de Bob Dylan, lo cual, aunque muy impresionante, no parecía particularmente útil. para él, un historiador que estudia el comercio de pieles en el siglo XVIII. Pero Humphries, profesor de 43 años de la Universidad Wilfrid Laurier en Waterloo, Canadá, llevaba mucho tiempo interesado en aplicar la inteligencia artificial a su trabajo. Ya estaba utilizando una herramienta especializada de reconocimiento de texto diseñada para transcribir escrituras y tipos de letra anticuados, aunque cometía errores frecuentes que llevaba tiempo corregir. Curioso, pegó la interpretación confusa de la herramienta de una carta francesa escrita a mano en ChatGPT. La IA corrigió el texto, arreglando todas las F que se habían leído erróneamente como S e incluso agregando acentos faltantes. Luego Humphries le pidió a ChatGPT que lo tradujera al inglés. También hizo eso. Tal vez, pensó, esto sería útil después de todo.

Para Humphries, las herramientas de inteligencia artificial representaban una promesa tentadora. Durante la última década, se han escaneado y digitalizado millones de documentos en archivos y bibliotecas (el propio Humphries participó en uno de esos esfuerzos), pero debido a que su amplia variedad de formatos, fuentes y vocabulario los hacía impenetrables para la búsqueda automatizada, era necesario trabajar con ellos. cantidades estupendas de investigación manual. Para un proyecto anterior, Humphries reunió biografías de varios cientos de soldados conmocionados de la Primera Guerra Mundial a partir de una variedad de registros médicos, diarios de guerra, periódicos, archivos personales y otros datos efímeros. Se necesitaron años y un equipo de asistentes de investigación para leer, etiquetar y comparar el material de cada individuo. Si los nuevos modelos de lenguaje fueran tan poderosos como parecían, pensó, sería posible simplemente cargar todo este material y pedirle al modelo que extrajera todos los documentos relacionados con cada soldado diagnosticado con shock de guerra.

“Ese es el trabajo de toda una vida, o al menos de una década”, dijo Humphries. “Y puedes imaginarte ampliar eso. Podrías conseguir que una IA averiguara si un soldado resultó herido en la fecha X, qué estaba pasando con esa unidad en la fecha X, y luego acceder a información sobre los miembros de esa unidad, que como historiadores, nunca tendrías tiempo de consultar. perseguir de forma individual”, dijo. «Podría abrir nuevas formas de entender el pasado».

La gestión mejorada de bases de datos puede estar muy lejos de la superinteligencia conquistadora del mundo que algunos predicen, pero es característica de la forma en que los modelos lingüísticos filtran el mundo real. De ley a programación a periodismo, los profesionales están tratando de descubrir si integrar esta tecnología prometedora, arriesgada y muy extraña en su trabajo y cómo hacerlo. Para los historiadores, una tecnología capaz de sintetizar archivos enteros que también tiene una inclinación por fabricar hechos es tan atractiva como aterradora, y este campo, como tantos otros, apenas está comenzando a lidiar con las implicaciones de una tecnología tan potencialmente poderosa pero resbaladiza. herramienta.

La IA parecía estar en todas partes en la 137ª reunión anual de la Asociación Histórica Estadounidense el mes pasado, según Cindy Ermus, profesora asociada de historia en la Universidad de Texas en San Antonio. Presidió uno de varios paneles sobre el tema. Ermus describió su relación y la de muchos de sus colegas con la IA como la de “niños curiosos”, preguntándose con entusiasmo y cautela qué aspectos de su trabajo cambiará y cómo. «Va a transformar cada parte de la investigación histórica, desde la recopilación hasta la curación, la escritura y, por supuesto, la enseñanza», dijo. Quedó particularmente impresionada por la presentación de la profesora de la Universidad de Lancaster, Katherine McDonough, de un programa de aprendizaje automático capaz de buscar mapas históricos, inicialmente entrenado en estudios de artillería de la Gran Bretaña del siglo XIX.

«Va a transformar cada parte de la investigación histórica, desde la recopilación, la curación, la escritura y, por supuesto, la enseñanza».

“Buscó la palabra ‘restaurante’ y encontró la palabra ‘restaurante’ en toneladas de mapas históricos a lo largo de los años”, dijo Ermus. «Para quienes no son historiadores, esto puede no parecer gran cosa, pero nunca antes habíamos podido hacerlo y ahora está a nuestro alcance».

Otra asistente, Lauren Tilton, profesora de artes liberales y humanidades digitales en la Universidad de Richmond, había estado trabajando con aprendizaje automático durante más de una década y recientemente trabajó con la Biblioteca del Congreso para aplicar la visión por computadora a los vastos tesoros de fotografías mínimamente etiquetadas de la institución. y películas. Todos los archivos están sesgados: para empezar, en qué material se guarda y en cómo se organiza. La promesa de la IA, dijo, es que puede abrir archivos a escala y hacer que se puedan buscar cosas que los archiveros del pasado no valoraban lo suficiente como para etiquetarlas.

«Los materiales más descritos en el archivo suelen ser el tipo de voces que hemos escuchado antes: los políticos famosos, los autores famosos», dijo. «Pero sabemos que hay muchas historias de personas de comunidades minoritarias, comunidades de color, comunidades LGBTQ que han sido difíciles de contar, no porque la gente no haya querido hacerlo, sino debido a los desafíos de cómo buscar en el archivo».

Sin embargo, los sistemas de IA tienen sus propios prejuicios. Tienen la tendencia bien documentada de reflejar los sesgos de género, raciales y de otro tipo en sus datos de entrenamiento; el hecho de que, como señaló Ermus, cuando le pidió a GPT-4 que creara una imagen de un profesor de historia, dibujó a un anciano. hombre blanco con coderas en su chaqueta, pero también muestran un sesgo que Tilton llama “presentismo”. Debido a que la gran preponderancia de los datos de entrenamiento se extrae de la Internet contemporánea, los modelos reflejan una visión del mundo contemporánea. Tilton encontró este fenómeno cuando descubrió que los sistemas de reconocimiento de imágenes tenían dificultades para dar sentido a fotografías más antiguas, por ejemplo, etiquetando las máquinas de escribir como computadoras y sus pisapapeles como sus ratones. Se trataba de sistemas de reconocimiento de imágenes, pero los modelos de lenguaje tienen un problema similar.

Impresionado con ChatGPT, Humphries se registró en la API OpenAI y se propuso convertirse en un asistente de investigación de IA. Estaba tratando de rastrear a los comerciantes de pieles del siglo XVIII a través de una maraña de cartas, diarios, certificados de matrimonio, documentos legales, registros parroquiales y contratos en los que aparecen sólo fugazmente. Su objetivo era diseñar un sistema que pudiera automatizar el proceso.

Uno de los primeros desafíos que encontró fue que los comerciantes de pieles del siglo XVIII no se parecían en nada a lo que supone un modelo lingüístico.

Uno de los primeros desafíos que encontró fue que los comerciantes de pieles del siglo XVIII no se parecían en nada a lo que supone un modelo lingüístico. Pídale a GPT-4 que escriba una entrada de muestra, como lo hice yo, y producirá largas reflexiones sobre la sublime soledad de la naturaleza, diciendo cosas como: «Esta mañana, los cielos se abrieron con una llovizna persistente, cubriendo el bosque con un velo de niebla y melancolía” y “Bruno, que había enfrentado todas las dificultades con el estoicismo de un leñador experimentado, ahora yacía quieto bajo el refugio de nuestra tienda improvisada, un testimonio silencioso de la fragilidad de la vida en estas tierras indómitas”.

Mientras que un verdadero comerciante de pieles sería mucho más conciso. Por ejemplo, “Buen tiempo. Esta mañana fue enterrado el joven que falleció ayer y su tumba fue rodeada de piquetes. 9 Los hombres fueron a recolectar goma y la llevaron a las canoas de Gum 3, los demás trabajaron como ayer”, como escribió uno en 1806, refiriéndose a la recolección de savia de árboles para sellar las costuras de sus canoas de corteza.

«El problema es que el modelo de lenguaje no captaría un registro como ese, porque no contiene el tipo de escritura reflexiva que está entrenado para ver como representativa de un evento como ese», dijo Humphries. Educado en publicaciones de blogs y ensayos contemporáneos, esperaría que a la muerte de un compañero le siguieran largos recuerdos emocionales, no un inventario de suministros de savia.

Al ajustar el modelo a partir de cientos de ejemplos de prosa de comerciantes de pieles, Humphries consiguió que sacara entradas del diario en respuesta a preguntas, pero no siempre relevantes. El vocabulario anticuado todavía planteaba un problema: palabras como varangueun término francés para la nervadura de una canoa que rara vez aparecería en los datos de entrenamiento del modelo, si es que alguna vez aparece.

Después de muchas pruebas y errores, terminó con una línea de ensamblaje de IA que utiliza múltiples modelos para ordenar documentos, buscar palabras clave y significado, y sintetizar respuestas a consultas. Le llevó mucho tiempo y muchos retoques, pero GPT le ayudó a enseñarle el Python que necesitaba. Llamó al sistema HistoryPearl, en honor a su gato más inteligente.

Probó su sistema con casos extremos, como el comerciante noruego Ferdinand Wentzel, que escribía sobre sí mismo en tercera persona y desplegaba un extraño sentido del humor, por ejemplo, escribiendo sobre el nacimiento de su hijo especulando sobre su paternidad y haciendo autocríticas. despreciando los chistes sobre su propia altura: “La niña de FW dio a luz a un niño de manera segura. – Casi creo que es su Hijo porque sus rasgos parecen tener cierto parecido con él y sus cortas piernas parecen determinar esta opinión más allá de toda duda.” Este tipo de escritura obstaculizaba los modelos anteriores, pero HistoryPearl pudo sacarla a la luz en respuesta a una pregunta vagamente formulada sobre el humor de Wentzel, junto con otros ejemplos del ingenio de Wentzel que Humphries no había estado buscando.

La herramienta aún omitía algunas cosas, pero funcionó mejor que el estudiante graduado promedio que Humphries normalmente contrataría para hacer este tipo de trabajo. Y más rápido. Y mucho, mucho más barato. En noviembre pasado, después de que OpenAI bajara los precios de las llamadas API, hizo algunos cálculos aproximados. Lo que le pagaría a un estudiante de posgrado alrededor de $16,000 por hacer durante todo un verano, GPT-4 podría hacerlo por alrededor de $70 en aproximadamente una hora.

«Todavía hablan de la tecnología como si fuera algo teórico sin comprender plenamente que representa una amenaza existencial muy real para toda nuestra razón de ser como educadores superiores».

“Ese fue el momento en el que me di cuenta: ‘Está bien, esto empieza a cambiarlo todo’”, dijo. Como investigador, fue emocionante. Como profesor, era aterrador. La organización de registros de comercio de pieles puede ser una aplicación de nicho, pero una gran cantidad de trabajos administrativos consisten en tareas similares de gestión de información. Se suponía que sus estudiantes debían aprender el tipo de habilidades de investigación y pensamiento que les permitirían tener éxito precisamente en este tipo de trabajos. En noviembre publicó un Boletin informativo implorando a sus pares académicos que se tomen en serio el rápido desarrollo de la IA. «La IA simplemente está empezando a dejar atrás la imaginación de muchas personas», escribió. «Todavía hablan de la tecnología como si fuera algo teórico sin comprender plenamente que representa una amenaza existencial muy real para toda nuestra razón de ser como educadores superiores».

Mientras tanto, sin embargo, estaba satisfecho de que sus retoques hubieran dado como resultado lo que él llama una “prueba de concepto”: lo suficientemente confiable como para ser potencialmente útil, aunque todavía no lo suficiente como para confiar plenamente. Humphries y su compañera de investigación, la historiadora Lianne Leddy, presentaron una subvención para ampliar su investigación a los 30.000 viajeros de su base de datos. En cierto modo, encontró reconfortante el trabajo necesario para desarrollar este sistema que ahorra trabajo. Las mayores mejoras en el modelo provinieron de proporcionarle los datos correctos, algo que sólo pudo hacer gracias a su experiencia en el material. Últimamente, ha estado pensando que en realidad puede haber más demanda de expertos en el campo con el tipo de habilidades de investigación y evaluación crítica que enseñan las humanidades. Este año enseñará un programa de IA generativa aplicada que diseñó y que se ejecuta en la Facultad de Artes.

«En cierto modo, esto es vino viejo en botellas nuevas, ¿verdad?» él dijo. A mediados del siglo XX, señaló, las empresas tenían vastos archivos corporativos atendidos por investigadores expertos, no sólo en almacenar y organizar documentos, sino en el material mismo. “Para que muchos de estos datos sean útiles, se necesitan personas que tengan la capacidad de descubrir cómo entrenar modelos y, lo que es más importante, que comprendan qué es un buen contenido y qué no. Creo que eso es tranquilizador”, dijo. «Si simplemente me estoy engañando a mí mismo, esa es otra cuestión».



Source link-37