15 de febrero de 2023

De cómo ChatGPT y sus sucesores impulsarán la productividad de la investigación científica

En esta publicación del blog de RIED-Revsta Iberoamericana de Educación a Distancia, queremos compartir un interesante artículo titulado “Language Models and Cognitive Automation for Economic Research" ("Modelos de lenguaje y automatización cognitiva para la investigación económica”) escrito por Anton Korinek, profesor de la Universidad de Virginia y destacado experto en economía de la inteligencia artificial. Korinek presentó su trabajo en este hilo de Twitter que se ha hecho viral dentro de la comunidad académica:

El artículo se publicó este mes de febrero de 2023 y explora el potencial de los Modelos Grandes de Lenguaje (Large Language Models, LLM) para transformar la investigación en economía y otras disciplinas científicas.

Los LLM son un nuevo paradigma en inteligencia artificial que puede generar texto en lenguaje natural basado en una variedad de entradas y tareas. Es posible que hayan oído hablar de ChatGPT, una versión popular de LLM que ha ganado millones de usuarios y ha sido apodado como el "chatbot más inteligente del mundo". 

Korinek describe 25 casos de uso de LLM como asistentes de investigación y tutores, que van desde la ideación, la escritura, la investigación de antecedentes, el análisis de datos, la codificación y las derivaciones matemáticas.

También especula sobre las implicaciones a medio y largo plazo de los LLM para la investigación económica y de otras disciplinas, centrándose en dos aspectos: ganancias de productividad y automatización cognitiva, y desafíos éticos y sociales. 

Brinda una descripción general sistemática de las capacidades actuales y emergentes de los LLM, así como algunas instrucciones prácticas y ejemplos sobre cómo aprovecharlas. También pide el desarrollo de estándares y normas para el uso responsable de los LLM, así como el establecimiento de mecanismos de supervisión y gobernanza. 

Korinek predice que los LLM tendrán efectos profundos en la naturaleza y dirección de la investigación científica y el descubrimiento en economía y otras disciplinas. 

Presentamos a continuación un resumen del artículo "Modelos de lenguaje y automatización cognitiva para la investigación económica", para el que, obviamente, hemos usado algunas de las técnicas que propone el documento.

Introducción

Los modelos grandes de lenguaje (LLM) como ChatGPT tienen el potencial de revolucionar la investigación en economía y otras disciplinas. Pueden realizar una amplia gama de tareas cognitivas que pueden ayudar a los investigadores en la ideación, la escritura, la investigación de antecedentes, la codificación, el análisis de datos y las derivaciones matemáticas. Sin embargo, también plantean desafíos éticos y sociales que deben abordarse. 

El propósito del artículo de Anton Korinek es describir los casos de uso de los LLM para la investigación económica, con base en la propia exploración del espacio del autor, y especular sobre las implicaciones de los LLM para la investigación económica a mediano y largo plazo.

Los LLM son una categoría de modelos básicos, que son amplios modelos de aprendizaje profundo que se entrenan previamente en grandes cantidades de datos para crear una base que luego se puede adaptar para diferentes aplicaciones. Estos modelos han ido mejorando de acuerdo con leyes de escala predecibles en función de la cantidad de cómputo, el recuento de parámetros y el tamaño de los datos de entrenamiento empleados. 

Esto ha llevado a un rápido aumento de las capacidades de los LLM, muchos de los cuales son emergentes, es decir, no están presentes en modelos más pequeños, sino que emergen repentinamente una vez que se cruza un cierto umbral. Los LLM modernos están, de alguna manera, comenzando a difuminar la diferencia entre las capacidades cognitivas de los humanos y los sistemas de IA.

Casos de uso de LLM para la investigación científica

Un modelo de lenguaje grande (LLM) es un tipo de modelo de aprendizaje automático que puede manejar una amplia gama de casos de uso de procesamiento de lenguaje natural (NLP). Los LLM están capacitados en cantidades masivas de datos de texto y pueden generar textos coherentes y fluidos sobre varios temas y dominios. Los LLM también pueden comprender y manipular el lenguaje natural de diferentes maneras, como responder preguntas, resumir textos, traducir idiomas y extraer información.

Los LLM pueden ser muy útiles para la investigación económica y de otras disciplinas, ya que pueden ayudar a los investigadores en varios aspectos de su trabajo. Korinek ha explorado 25 casos de uso de LLM para la investigación económica, a lo largo de seis dominios: ideación, escritura, investigación de antecedentes, codificación, análisis de datos y derivaciones matemáticas. Estos casos de uso se describen en detalle en la Sección 3 del paper de Korinek, pero aquí hay una breve descripción general de cada dominio:

  • Ideación: los LLM pueden ayudar a los investigadores a generar ideas, evaluar ideas y proporcionar contraargumentos. Por ejemplo, los LLM pueden generar preguntas de investigación, sugerir literatura relacionada y criticar hipótesis.
  • Escritura: los LLM pueden ayudar a los investigadores a sintetizar texto, proporcionar ejemplos, editar y evaluar texto y generar tweets o títulos atractivos para un artículo. Por ejemplo, los LLM pueden escribir introducciones, resúmenes y conclusiones, así como generar citas y referencias.
  • Investigación de antecedentes: los LLM pueden ayudar a los investigadores a buscar y resumir la literatura, traducir textos, explicar conceptos y formatear referencias. Por ejemplo, los LLM pueden encontrar documentos relevantes, extraer puntos clave y proporcionar definiciones y ejemplos.
  • Codificación: los LLM pueden ayudar a los investigadores a escribir código basado en instrucciones en lenguaje natural, explicar código, traducir código entre lenguajes de programación y depurar código. Por ejemplo, los LLM pueden escribir código para la limpieza, el análisis y la visualización de datos, así como para comentar y documentar el código.
  • Análisis de datos: los LLM pueden ayudar a los investigadores a extraer datos de texto, reformatear datos, clasificar texto, extraer opiniones y simular humanos para generar datos. Por ejemplo, los LLM pueden extraer variables, valores y unidades del texto, convertir datos en diferentes formatos y etiquetar texto según categorías o emociones.
  • Derivaciones matemáticas: los LLM pueden ayudar a los investigadores a establecer modelos y trabajar con derivaciones, así como a explicar modelos. Por ejemplo, los LLM pueden escribir ecuaciones, resolver valores óptimos y proporcionar intuición e interpretación.

Estos casos de uso demuestran el potencial de los LLM para revolucionar la investigación económica, al automatizar y mejorar varias tareas cognitivas en las que participan los investigadores. Sin embargo, los LLM también plantean desafíos éticos y sociales que deben abordarse, como garantizar su confiabilidad, equidad y responsabilidad.

Implicaciones de los LLM para la investigación económica

Korinek especula sobre las implicaciones a medio y largo plazo de los LLM para la investigación económica, centrándose en dos aspectos: ganancias de productividad y automatización cognitiva, y desafíos éticos y sociales.

  • Ganancias de productividad y automatización cognitiva: el autor plantea la hipótesis de que los LLM permitirán a los investigadores económicos automatizar y mejorar varias micro tareas que actualmente consumen mucho tiempo y son tediosas, como buscar, resumir, escribir, codificar y derivar. Esto conducirá a ganancias significativas de productividad y permitirá a los investigadores concentrarse en tareas más creativas y de alto nivel. Además, el autor sugiere que los LLM también pueden realizar algunas tareas macro que actualmente están fuera del alcance de los investigadores humanos, como generar hipótesis, modelos y resultados novedosos y perspicaces. Esto conducirá a la automatización cognitiva y acelerará el progreso científico en economía y otras disciplinas.
  • Desafíos éticos y sociales: el autor reconoce que los LLM también plantean desafíos éticos y sociales que deben abordarse, como garantizar su confiabilidad, equidad y responsabilidad. El autor señala que los LLM pueden generar contenidos falsos o engañosos, reproducir o amplificar sesgos y prejuicios e infringir los derechos de propiedad intelectual y privacidad. Korinek pide el desarrollo de estándares y normas para el uso de LLM en la investigación económica, así como el establecimiento de mecanismos de supervisión y gobernanza. También advierte que los LLM pueden tener efectos disruptivos sobre el valor del trabajo cognitivo y la distribución del ingreso y el poder en la sociedad.

Conclusiones

Korinek concluye que los LLM son una herramienta poderosa y versátil que puede revolucionar la investigación económica en varios dominios. 

Los investigadores deben intentar familiarizarse con las capacidades actuales y emergentes de los LLM y aprovecharlas para mejorar su productividad y creatividad. A su vez, deben ser conscientes también de las implicaciones éticas y sociales de los LLM y contribuir al desarrollo de mejores prácticas y mecanismos de gobernanza para su uso responsable. 

Korinek, finalmente, predice que los LLM tendrán efectos profundos en la naturaleza y la dirección de la investigación científica y los nuevos hallazgos en economía y otras disciplinas.

Referencia

Korinek, A. (2013). Language Models and Cognitive Automation for Economic Research. NBER. Working Paper No. w30957. https://doi.org/10.3386/w30957