{"id":1010533,"date":"2024-02-15T14:23:07","date_gmt":"2024-02-15T14:23:07","guid":{"rendered":"https:\/\/magazineoffice.com\/como-la-ia-puede-hacer-historia\/"},"modified":"2024-02-15T14:23:10","modified_gmt":"2024-02-15T14:23:10","slug":"como-la-ia-puede-hacer-historia","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/como-la-ia-puede-hacer-historia\/","title":{"rendered":"C\u00f3mo la IA puede hacer historia"},"content":{"rendered":"


\n<\/p>\n

\n
\n

Como millones de personas, lo primero que hizo Mark Humphries con ChatGPT cuando se lanz\u00f3 a fines de 2022 fue pedirle que realizara trucos de sal\u00f3n, como escribir poes\u00eda al estilo de Bob Dylan, lo cual, aunque muy impresionante, no parec\u00eda particularmente \u00fatil. para \u00e9l, un historiador que estudia el comercio de pieles en el siglo XVIII. Pero Humphries, profesor de 43 a\u00f1os de la Universidad Wilfrid Laurier en Waterloo, Canad\u00e1, llevaba mucho tiempo interesado en aplicar la inteligencia artificial a su trabajo. Ya estaba utilizando una herramienta especializada de reconocimiento de texto dise\u00f1ada para transcribir escrituras y tipos de letra anticuados, aunque comet\u00eda errores frecuentes que llevaba tiempo corregir. Curioso, peg\u00f3 la interpretaci\u00f3n confusa de la herramienta de una carta francesa escrita a mano en ChatGPT. La IA corrigi\u00f3 el texto, arreglando todas las F que se hab\u00edan le\u00eddo err\u00f3neamente como S e incluso agregando acentos faltantes. Luego Humphries le pidi\u00f3 a ChatGPT que lo tradujera al ingl\u00e9s. Tambi\u00e9n hizo eso. Tal vez, pens\u00f3, esto ser\u00eda \u00fatil despu\u00e9s de todo. <\/p>\n<\/div>\n

\n

Para Humphries, las herramientas de inteligencia artificial representaban una promesa tentadora. Durante la \u00faltima d\u00e9cada, se han escaneado y digitalizado millones de documentos en archivos y bibliotecas (el propio Humphries particip\u00f3 en uno de esos esfuerzos), pero debido a que su amplia variedad de formatos, fuentes y vocabulario los hac\u00eda impenetrables para la b\u00fasqueda automatizada, era necesario trabajar con ellos. cantidades estupendas de investigaci\u00f3n manual. Para un proyecto anterior, Humphries reuni\u00f3 biograf\u00edas de varios cientos de soldados conmocionados de la Primera Guerra Mundial a partir de una variedad de registros m\u00e9dicos, diarios de guerra, peri\u00f3dicos, archivos personales y otros datos ef\u00edmeros. Se necesitaron a\u00f1os y un equipo de asistentes de investigaci\u00f3n para leer, etiquetar y comparar el material de cada individuo. Si los nuevos modelos de lenguaje fueran tan poderosos como parec\u00edan, pens\u00f3, ser\u00eda posible simplemente cargar todo este material y pedirle al modelo que extrajera todos los documentos relacionados con cada soldado diagnosticado con shock de guerra.<\/p>\n<\/div>\n

\n

\u201cEse es el trabajo de toda una vida, o al menos de una d\u00e9cada\u201d, dijo Humphries. \u201cY puedes imaginarte ampliar eso. Podr\u00edas conseguir que una IA averiguara si un soldado result\u00f3 herido en la fecha X, qu\u00e9 estaba pasando con esa unidad en la fecha X, y luego acceder a informaci\u00f3n sobre los miembros de esa unidad, que como historiadores, nunca tendr\u00edas tiempo de consultar. perseguir de forma individual\u201d, dijo. \u00abPodr\u00eda abrir nuevas formas de entender el pasado\u00bb. <\/p>\n<\/div>\n

\n

La gesti\u00f3n mejorada de bases de datos puede estar muy lejos de la superinteligencia conquistadora del mundo que algunos predicen, pero es caracter\u00edstica de la forma en que los modelos ling\u00fc\u00edsticos filtran el mundo real. De ley<\/a> a programaci\u00f3n<\/a> a periodismo<\/a>, los profesionales est\u00e1n tratando de descubrir si integrar esta tecnolog\u00eda prometedora, arriesgada y muy extra\u00f1a en su trabajo y c\u00f3mo hacerlo. Para los historiadores, una tecnolog\u00eda capaz de sintetizar archivos enteros que tambi\u00e9n tiene una inclinaci\u00f3n por fabricar hechos es tan atractiva como aterradora, y este campo, como tantos otros, apenas est\u00e1 comenzando a lidiar con las implicaciones de una tecnolog\u00eda tan potencialmente poderosa pero resbaladiza. herramienta.<\/p>\n<\/div>\n

\n

La IA parec\u00eda estar en todas partes en la 137\u00aa reuni\u00f3n anual de la Asociaci\u00f3n Hist\u00f3rica Estadounidense el mes pasado, seg\u00fan Cindy Ermus, profesora asociada de historia en la Universidad de Texas en San Antonio. Presidi\u00f3 uno de varios paneles sobre el tema. Ermus describi\u00f3 su relaci\u00f3n y la de muchos de sus colegas con la IA como la de \u201cni\u00f1os curiosos\u201d, pregunt\u00e1ndose con entusiasmo y cautela qu\u00e9 aspectos de su trabajo cambiar\u00e1 y c\u00f3mo. \u00abVa a transformar cada parte de la investigaci\u00f3n hist\u00f3rica, desde la recopilaci\u00f3n hasta la curaci\u00f3n, la escritura y, por supuesto, la ense\u00f1anza\u00bb, dijo. Qued\u00f3 particularmente impresionada por la presentaci\u00f3n de la profesora de la Universidad de Lancaster, Katherine McDonough, de un programa de aprendizaje autom\u00e1tico capaz de buscar mapas hist\u00f3ricos, inicialmente entrenado en estudios de artiller\u00eda de la Gran Breta\u00f1a del siglo XIX. <\/p>\n<\/div>\n

\n
\n

\u00abVa a transformar cada parte de la investigaci\u00f3n hist\u00f3rica, desde la recopilaci\u00f3n, la curaci\u00f3n, la escritura y, por supuesto, la ense\u00f1anza\u00bb.<\/p>\n<\/div>\n<\/div>\n

\n

\u201cBusc\u00f3 la palabra ‘restaurante’ y encontr\u00f3 la palabra ‘restaurante’ en toneladas de mapas hist\u00f3ricos a lo largo de los a\u00f1os\u201d, dijo Ermus. \u00abPara quienes no son historiadores, esto puede no parecer gran cosa, pero nunca antes hab\u00edamos podido hacerlo y ahora est\u00e1 a nuestro alcance\u00bb. <\/p>\n<\/div>\n

\n

Otra asistente, Lauren Tilton, profesora de artes liberales y humanidades digitales en la Universidad de Richmond, hab\u00eda estado trabajando con aprendizaje autom\u00e1tico durante m\u00e1s de una d\u00e9cada y recientemente trabaj\u00f3 con la Biblioteca del Congreso para aplicar la visi\u00f3n por computadora a los vastos tesoros de fotograf\u00edas m\u00ednimamente etiquetadas de la instituci\u00f3n. y pel\u00edculas. Todos los archivos est\u00e1n sesgados: para empezar, en qu\u00e9 material se guarda y en c\u00f3mo se organiza. La promesa de la IA, dijo, es que puede abrir archivos a escala y hacer que se puedan buscar cosas que los archiveros del pasado no valoraban lo suficiente como para etiquetarlas. <\/p>\n<\/div>\n

\n

\u00abLos materiales m\u00e1s descritos en el archivo suelen ser el tipo de voces que hemos escuchado antes: los pol\u00edticos famosos, los autores famosos\u00bb, dijo. \u00abPero sabemos que hay muchas historias de personas de comunidades minoritarias, comunidades de color, comunidades LGBTQ que han sido dif\u00edciles de contar, no porque la gente no haya querido hacerlo, sino debido a los desaf\u00edos de c\u00f3mo buscar en el archivo\u00bb.<\/p>\n<\/div>\n

\n

Sin embargo, los sistemas de IA tienen sus propios prejuicios. Tienen la tendencia bien documentada de reflejar los sesgos de g\u00e9nero, raciales y de otro tipo en sus datos de entrenamiento; el hecho de que, como se\u00f1al\u00f3 Ermus, cuando le pidi\u00f3 a GPT-4 que creara una imagen de un profesor de historia, dibuj\u00f3 a un anciano. hombre blanco con coderas en su chaqueta, pero tambi\u00e9n muestran un sesgo que Tilton llama \u201cpresentismo\u201d. Debido a que la gran preponderancia de los datos de entrenamiento se extrae de la Internet contempor\u00e1nea, los modelos reflejan una visi\u00f3n del mundo contempor\u00e1nea. Tilton encontr\u00f3 este fen\u00f3meno cuando descubri\u00f3 que los sistemas de reconocimiento de im\u00e1genes ten\u00edan dificultades para dar sentido a fotograf\u00edas m\u00e1s antiguas, por ejemplo, etiquetando las m\u00e1quinas de escribir como computadoras y sus pisapapeles como sus ratones. Se trataba de sistemas de reconocimiento de im\u00e1genes, pero los modelos de lenguaje tienen un problema similar. <\/p>\n<\/div>\n

\n

Impresionado con ChatGPT, Humphries se registr\u00f3 en la API OpenAI y se propuso convertirse en un asistente de investigaci\u00f3n de IA. Estaba tratando de rastrear a los comerciantes de pieles del siglo XVIII a trav\u00e9s de una mara\u00f1a de cartas, diarios, certificados de matrimonio, documentos legales, registros parroquiales y contratos en los que aparecen s\u00f3lo fugazmente. Su objetivo era dise\u00f1ar un sistema que pudiera automatizar el proceso.<\/p>\n<\/div>\n

\n
\n

Uno de los primeros desaf\u00edos que encontr\u00f3 fue que los comerciantes de pieles del siglo XVIII no se parec\u00edan en nada a lo que supone un modelo ling\u00fc\u00edstico.<\/p>\n<\/div>\n<\/div>\n

\n

Uno de los primeros desaf\u00edos que encontr\u00f3 fue que los comerciantes de pieles del siglo XVIII no se parec\u00edan en nada a lo que supone un modelo ling\u00fc\u00edstico. P\u00eddale a GPT-4 que escriba una entrada de muestra, como lo hice yo, y producir\u00e1 largas reflexiones sobre la sublime soledad de la naturaleza, diciendo cosas como: \u00abEsta ma\u00f1ana, los cielos se abrieron con una llovizna persistente, cubriendo el bosque con un velo de niebla y melancol\u00eda\u201d y \u201cBruno, que hab\u00eda enfrentado todas las dificultades con el estoicismo de un le\u00f1ador experimentado, ahora yac\u00eda quieto bajo el refugio de nuestra tienda improvisada, un testimonio silencioso de la fragilidad de la vida en estas tierras ind\u00f3mitas\u201d.<\/p>\n<\/div>\n

\n

Mientras que un verdadero comerciante de pieles ser\u00eda mucho m\u00e1s conciso. Por ejemplo, \u201cBuen tiempo. Esta ma\u00f1ana fue enterrado el joven que falleci\u00f3 ayer y su tumba fue rodeada de piquetes. 9 Los hombres fueron a recolectar goma y la llevaron a las canoas de Gum 3, los dem\u00e1s trabajaron como ayer\u201d, como escribi\u00f3 uno en 1806, refiri\u00e9ndose a la recolecci\u00f3n de savia de \u00e1rboles para sellar las costuras de sus canoas de corteza. <\/p>\n<\/div>\n

\n

\u00abEl problema es que el modelo de lenguaje no captar\u00eda un registro como ese, porque no contiene el tipo de escritura reflexiva que est\u00e1 entrenado para ver como representativa de un evento como ese\u00bb, dijo Humphries. Educado en publicaciones de blogs y ensayos contempor\u00e1neos, esperar\u00eda que a la muerte de un compa\u00f1ero le siguieran largos recuerdos emocionales, no un inventario de suministros de savia.<\/p>\n<\/div>\n

\n

Al ajustar el modelo a partir de cientos de ejemplos de prosa de comerciantes de pieles, Humphries consigui\u00f3 que sacara entradas del diario en respuesta a preguntas, pero no siempre relevantes. El vocabulario anticuado todav\u00eda planteaba un problema: palabras como varangue<\/em>un t\u00e9rmino franc\u00e9s para la nervadura de una canoa que rara vez aparecer\u00eda en los datos de entrenamiento del modelo, si es que alguna vez aparece. <\/p>\n<\/div>\n

\n

Despu\u00e9s de muchas pruebas y errores, termin\u00f3 con una l\u00ednea de ensamblaje de IA que utiliza m\u00faltiples modelos para ordenar documentos, buscar palabras clave y significado, y sintetizar respuestas a consultas. Le llev\u00f3 mucho tiempo y muchos retoques, pero GPT le ayud\u00f3 a ense\u00f1arle el Python que necesitaba. Llam\u00f3 al sistema HistoryPearl, en honor a su gato m\u00e1s inteligente. <\/p>\n<\/div>\n

\n

Prob\u00f3 su sistema con casos extremos, como el comerciante noruego Ferdinand Wentzel, que escrib\u00eda sobre s\u00ed mismo en tercera persona y desplegaba un extra\u00f1o sentido del humor, por ejemplo, escribiendo sobre el nacimiento de su hijo especulando sobre su paternidad y haciendo autocr\u00edticas. despreciando los chistes sobre su propia altura: \u201cLa ni\u00f1a de FW dio a luz a un ni\u00f1o de manera segura. – Casi creo que es su Hijo porque sus rasgos parecen tener cierto parecido con \u00e9l y sus cortas piernas parecen determinar esta opini\u00f3n m\u00e1s all\u00e1 de toda duda.\u201d Este tipo de escritura obstaculizaba los modelos anteriores, pero HistoryPearl pudo sacarla a la luz en respuesta a una pregunta vagamente formulada sobre el humor de Wentzel, junto con otros ejemplos del ingenio de Wentzel que Humphries no hab\u00eda estado buscando. <\/p>\n<\/div>\n

\n

La herramienta a\u00fan omit\u00eda algunas cosas, pero funcion\u00f3 mejor que el estudiante graduado promedio que Humphries normalmente contratar\u00eda para hacer este tipo de trabajo. Y m\u00e1s r\u00e1pido. Y mucho, mucho m\u00e1s barato. En noviembre pasado, despu\u00e9s de que OpenAI bajara los precios de las llamadas API, hizo algunos c\u00e1lculos aproximados. Lo que le pagar\u00eda a un estudiante de posgrado alrededor de $16,000 por hacer durante todo un verano, GPT-4 podr\u00eda hacerlo por alrededor de $70 en aproximadamente una hora. <\/p>\n<\/div>\n

\n
\n

\u00abTodav\u00eda hablan de la tecnolog\u00eda como si fuera algo te\u00f3rico sin comprender plenamente que representa una amenaza existencial muy real para toda nuestra raz\u00f3n de ser como educadores superiores\u00bb.<\/p>\n<\/div>\n<\/div>\n

\n

\u201cEse fue el momento en el que me di cuenta: ‘Est\u00e1 bien, esto empieza a cambiarlo todo’\u201d, dijo. Como investigador, fue emocionante. Como profesor, era aterrador. La organizaci\u00f3n de registros de comercio de pieles puede ser una aplicaci\u00f3n de nicho, pero una gran cantidad de trabajos administrativos consisten en tareas similares de gesti\u00f3n de informaci\u00f3n. Se supon\u00eda que sus estudiantes deb\u00edan aprender el tipo de habilidades de investigaci\u00f3n y pensamiento que les permitir\u00edan tener \u00e9xito precisamente en este tipo de trabajos. En noviembre public\u00f3 un Boletin informativo<\/a> implorando a sus pares acad\u00e9micos que se tomen en serio el r\u00e1pido desarrollo de la IA. \u00abLa IA simplemente est\u00e1 empezando a dejar atr\u00e1s la imaginaci\u00f3n de muchas personas\u00bb, escribi\u00f3. \u00abTodav\u00eda hablan de la tecnolog\u00eda como si fuera algo te\u00f3rico sin comprender plenamente que representa una amenaza existencial muy real para toda nuestra raz\u00f3n de ser como educadores superiores\u00bb.<\/p>\n<\/div>\n

\n

Mientras tanto, sin embargo, estaba satisfecho de que sus retoques hubieran dado como resultado lo que \u00e9l llama una \u201cprueba de concepto\u201d: lo suficientemente confiable como para ser potencialmente \u00fatil, aunque todav\u00eda no lo suficiente como para confiar plenamente. Humphries y su compa\u00f1era de investigaci\u00f3n, la historiadora Lianne Leddy, presentaron una subvenci\u00f3n para ampliar su investigaci\u00f3n a los 30.000 viajeros de su base de datos. En cierto modo, encontr\u00f3 reconfortante el trabajo necesario para desarrollar este sistema que ahorra trabajo. Las mayores mejoras en el modelo provinieron de proporcionarle los datos correctos, algo que s\u00f3lo pudo hacer gracias a su experiencia en el material. \u00daltimamente, ha estado pensando que en realidad puede haber m\u00e1s demanda de expertos en el campo con el tipo de habilidades de investigaci\u00f3n y evaluaci\u00f3n cr\u00edtica que ense\u00f1an las humanidades. Este a\u00f1o ense\u00f1ar\u00e1 un programa de IA generativa aplicada que dise\u00f1\u00f3 y que se ejecuta en la Facultad de Artes. <\/p>\n<\/div>\n

\n

\u00abEn cierto modo, esto es vino viejo en botellas nuevas, \u00bfverdad?\u00bb \u00e9l dijo. A mediados del siglo XX, se\u00f1al\u00f3, las empresas ten\u00edan vastos archivos corporativos atendidos por investigadores expertos, no s\u00f3lo en almacenar y organizar documentos, sino en el material mismo. \u201cPara que muchos de estos datos sean \u00fatiles, se necesitan personas que tengan la capacidad de descubrir c\u00f3mo entrenar modelos y, lo que es m\u00e1s importante, que comprendan qu\u00e9 es un buen contenido y qu\u00e9 no. Creo que eso es tranquilizador\u201d, dijo. \u00abSi simplemente me estoy enga\u00f1ando a m\u00ed mismo, esa es otra cuesti\u00f3n\u00bb.<\/p>\n<\/div>\n<\/div>\n


\n
Source link-37 <\/a><\/p>\n","protected":false},"excerpt":{"rendered":"

Como millones de personas, lo primero que hizo Mark Humphries con ChatGPT cuando se lanz\u00f3 a fines de 2022 fue pedirle que realizara trucos de sal\u00f3n, como escribir poes\u00eda al…<\/p>\n","protected":false},"author":1,"featured_media":1010534,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[216,437,232,495],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1010533"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=1010533"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1010533\/revisions"}],"predecessor-version":[{"id":1010535,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1010533\/revisions\/1010535"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/1010534"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=1010533"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=1010533"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=1010533"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}