Marco Baroni es un reconocido profesor de lingüística computacional e inteligencia artificial. Actualmente ocupa el puesto de profesor de investigación en la Institución Catalana de Investigación y Estudios Avanzados (ICREA) y está afiliado al Departamento de Lingüística de la Universidad Pompeu Fabra en Barcelona[1](https://marcobaroni.org/)[2](https://marcobaroni.org/baroni_short_cv.html). A lo largo de su carrera, Baroni ha acumulado una amplia experiencia en el campo de la inteligencia artificial y la lingüística, con roles destacados como investigador y gerente en Facebook Artificial Intelligence Research (FAIR) en París de 2016 a 2021, así como varias posiciones de investigación y enseñanza en universidades de Italia y Austria[2](https://marcobaroni.org/baroni_short_cv.html).
Baroni completó su doctorado en lingüística en la Universidad de California, Los Ángeles en junio de 2000, con una disertación titulada «Distributional cues in morpheme discovery: A computational model and empirical evidence»[2](https://marcobaroni.org/baroni_short_cv.html). Desde entonces, su investigación ha abordado aspectos fundamentales de cómo las máquinas aprenden y utilizan el lenguaje, centrándose en cómo los modelos de lenguaje de aprendizaje automático interactúan entre sí y cómo desarrollan su propio «lenguaje alienígena»[1](https://marcobaroni.org/).
En su trabajo, Baroni ha observado que los modelos de lenguaje como GPT pueden generar respuestas extrañas e ilógicas a ciertas entradas, lo que sugiere que estos modelos no comprenden realmente el lenguaje humano en la forma en que lo hacen los humanos. Cuando dos modelos de lenguaje comienzan a interactuar, inicialmente utilizan lenguaje humano, pero con el tiempo desarrollan su propio lenguaje computacional, con propiedades distintas a las del lenguaje humano. Por ejemplo, en este «lenguaje alienígena», las palabras más frecuentes tienden a ser más largas, lo que es contrario a lo que se observa en los lenguajes humanos.
El proyecto «Aliens» de Baroni, financiado por el Consejo Europeo de Investigación (ERC), se centra en estudiar este fenómeno. Su objetivo es comprender este «lenguaje alienígena» para permitir una mejor traducción entre humanos e IA, lo que podría mejorar la comunicación entre ambos. Este comportamiento emergente no es algo que las empresas como OpenAI, que desarrollan modelos de lenguaje, hayan previsto[1](https://marcobaroni.org/).
Además de su investigación, Baroni ha contribuido al campo de la lingüística computacional y la inteligencia artificial mediante la creación de una serie de recursos y herramientas. Estos incluyen EGG, un conjunto de herramientas para implementar juegos de emergencia de lenguaje; CommAI-env, un entorno para entrenar y evaluar IA basadas en la comunicación; y SCAN, tareas de navegación CommAI simplificadas para evaluar el aprendizaje composicional y la generalización cero-shot. También ha contribuido a la construcción de grandes corpus web derivados, etiquetados y lematizados de inglés, alemán, italiano y francés; y ha desarrollado el conjunto de datos LAMBADA para probar la comprensión del contexto amplio de los modelos de lenguaje, entre otros recursos[3](https://marcobaroni.org/tools_and_resources.html).
Espero que os haya resultado interesante, y si queréis estar al día de los nuevos episodios del podcast os podéis suscribir aquí en la plataforma que más os guste —> https://podcasters.spotify.com/pod/show/horacio-ps o también a la newsletter para recibir información adicional de los episodios, de nuestra comunidad de investigadores, o consejos para mejorar tus procesos de investigación —> https://horacio-ps.com/newsletter/
—
Send in a voice message: https://podcasters.spotify.com/pod/show/horacio-ps/message