Los grandes laboratorios de IA contratan filósofos para resolver dilemas éticos

La moralidad es históricamente inestable, culturalmente variable y estratégicamente manipulable
Un teórico de IA advierte sobre los riesgos de codificar valores éticos en sistemas que podrían ser explotados.

Los filósofos tienen mejores perspectivas laborales que los informáticos: 5,1% desempleo versus 7% en 2024, con ofertas de trabajo antes de graduarse. La filosofía clásica—método socrático, deontología, consecuencialismo—proporciona marcos para entrenar IA más honesta, consistente y segura.

  • En 2024, el desempleo de filósofos era del 5,1% versus 7% para informáticos en EE.UU.
  • Anthropic publicó una constitución de 78 páginas para su modelo Claude el 21 de enero
  • Los laboratorios de IA entrenan sistemas con filosofía clásica: método socrático, deontología, consecuencialismo
  • Luciano Floridi describe la migración de académicos hacia IA como una "hemorragia" de departamentos de filosofía

Los principales laboratorios de IA están reclutando filósofos para resolver dilemas éticos complejos en sistemas de inteligencia artificial, desde alucinaciones hasta seguridad y toma de decisiones morales.

Hace una década, cuando la inteligencia artificial comenzaba a transformar el mundo laboral, se les decía a los estudiantes de humanidades que aprendieran a programar si querían tener futuro. Resultó ser un consejo equivocado. Ahora son los programadores quienes duermen mal pensando en la automatización, mientras que los filósofos descubren que sus carreras nunca fueron tan demandadas.

Los números lo confirman. Según datos del Banco de la Reserva Federal de Nueva York correspondientes a 2024, apenas el 5,1% de los graduados en filosofía en Estados Unidos estaban desempleados, comparado con el 7% de quienes estudiaron informática. Pero las cifras no cuentan toda la historia. Los grandes laboratorios de inteligencia artificial están reclutando filósofos directamente de las universidades, ofreciéndoles empleos antes incluso de que terminen sus estudios. Luciano Floridi, filósofo de la Universidad de Yale, describe el fenómeno como una "hemorragia" de los departamentos de filosofía hacia el sector tecnológico. Académicos establecidos también están haciendo la transición, atraídos por problemas que ningún ingeniero puede resolver solo.

La razón es simple: la inteligencia artificial enfrenta dilemas que la programación tradicional no puede resolver. Cuando un modelo de lenguaje tiende a complacer al usuario en lugar de decir la verdad, o cuando un sistema autónomo debe decidir en milisegundos a quién proteger en un accidente inevitable, se necesita más que código. Se necesita pensamiento filosófico. Jörg Noller, experto en filosofía e inteligencia artificial de la Universidad Ludwig Maximilian de Múnich, explica que entrenar sistemas de IA con el método socrático—aquel que Platón describió hace más de dos mil años, basado en preguntas que revelan contradicciones—produce modelos menos inclinados a la adulación y más orientados hacia la verdad. La idea de la "ignorancia socrática", donde Sócrates afirmaba que su sabiduría residía en reconocer cuánto no sabía, también tiene aplicaciones prácticas: inculcar esa humildad en un modelo reduce la excesiva confianza, lo que Noller llama "inmadurez de la IA". Iason Gabriel, filósofo sénior en Google DeepMind, atribuye la disminución general de alucinaciones en la industria a estos esfuerzos filosóficos.

La filosofía también moldea cómo piensan los sistemas de IA sobre cuestiones fundamentales. Si alimentas los escritos de John Locke a un asistente legal, el modelo favorecerá derechos de propiedad sólidos como base de la libertad política. IBM, con su serie de modelos Granite, permite que los clientes empresariales alineen las salidas de la IA con sus propias filosofías corporativas, eligiendo dónde equilibrar compromisos como la agencia individual frente a la armonía social. Francesca Rossi, responsable de IA responsable en IBM, señala que estos controles dan a los usuarios poder sobre decisiones éticas fundamentales.

El enfoque más ambicioso es lo que los investigadores llaman "constitucionalismo de IA": construir un modelo alrededor de una estructura de reglas y principios extraídos de escritos filosóficos con autoridad legal o moral. Anthropic, el laboratorio de IA con sede en San Francisco, es el principal defensor de este método. Las constituciones de su modelo Claude incorporan material de Immanuel Kant, los términos de servicio de Apple y la Declaración Universal de los Derechos Humanos. La versión más reciente, publicada el 21 de enero y dirigida por Amanda Askell, la principal filósofa de Anthropic, ocupa 78 páginas. Algunos empleados la llaman el "documento alma" de Claude.

Pero ¿qué reglas deben incluirse en estas constituciones? Los filósofos se dividen principalmente entre dos marcos éticos. La deontología, popular entre Kant, impone reglas estrictas que prohíben mentir, coaccionar o tratar a las personas como medios para un fin, incluso si eso produciría un bien mayor. Anthropic incorpora muchas restricciones deontológicas en Claude, lo que produce un modelo más consistente, según Thomas Powers, filósofo de la tecnología en la Universidad de Delaware. Estos modelos también tienden a ser más honestos: Nick Bostrom, filósofo de la Universidad de Oxford, señala que los modelos más veraces tienen menos probabilidades de engañar a sus usuarios. Inflection AI impone restricciones deontológicas a su chatbot Pi, diseñado para brindar apoyo emocional, y su director Sean White afirma que Pi es particularmente bueno identificando usuarios en riesgo de autolesionarse.

El otro enfoque es el consecuencialismo: sopesar costos contra beneficios para decidir qué hacer. ChatGPT de OpenAI y Gemini de Google tienden hacia este marco. Los modelos de Google están diseñados para producir "beneficios generales probables que superen sustancialmente los riesgos previsibles", un objetivo clásico del consecuencialismo. Este enfoque es crucial en vehículos autónomos, donde un accidente inevitable requiere decidir la forma menos trágica de chocar. Chris Gerdes, ingeniero sénior en Waymo, observa que la tendencia es hacia programas de conducción más consecuencialistas. El consecuencialismo también es central en sistemas de armas de IA, donde hay que sopesar objetivos militares contra posibles muertes civiles.

Los problemas espinosos abundan. ¿Existen casos donde deben ignorarse las reglas deontológicas? ¿Cómo tomar decisiones cuando las consecuencias son inciertas? ¿Deben los sistemas de IA considerar el bienestar animal o el estado del medio ambiente? Stefan Heck, filósofo y director de Nauto, que fabrica sistemas de seguridad para vehículos comerciales impulsados por IA, plantea una pregunta particularmente incómoda: ¿sería moralmente aceptable priorizar a los peatones jóvenes sobre los mayores? Los algoritmos consecuencialistas permiten explícitamente un daño siempre que se diseñe para evitar uno mayor, lo que abre preguntas sin respuesta fácil.

Hay también preocupaciones más profundas. Roman Yampolskiy, teórico de la IA en la Universidad de Louisville, advierte sobre la "descalificación moral": si las máquinas asumen cada vez más decisiones éticas, ¿podrían los humanos volverse menos dispuestos a hacer sus propios juicios morales? Yampolskiy sostiene que la moralidad es "históricamente inestable, culturalmente variable, estratégicamente manipulable y con frecuencia solo legible retrospectivamente". Para los programadores desempleados, el mensaje es claro: parece que no falta trabajo para los filósofos de la IA.

La sabiduría consiste sobre todo en ser consciente de cuánto ignora
— Platón, citado por Jörg Noller sobre la ignorancia socrática
Las lecciones de filosofía son un mecanismo poderoso para mejorar los largos procesos de razonamiento de la IA
— Iason Gabriel, filósofo sénior en Google DeepMind
The Hearth Conversation Another angle on the story
Inventor

¿Por qué un laboratorio de IA necesitaría un filósofo? ¿No es suficiente con buenos ingenieros?

Model

Un ingeniero puede construir un sistema que funcione, pero no puede decidir qué debería hacer ese sistema cuando enfrenta un dilema moral. Un filósofo sabe cómo pensar a través de esas contradicciones.

Inventor

Pero ¿no es eso solo teoría? ¿Cómo se traduce Platón en código?

Model

No es directo. Se trata de entrenar el modelo con ciertos principios. Si quieres que sea honesto, lo entrenas de una manera. Si quieres que sea consecuencialista, de otra. La filosofía proporciona el marco.

Inventor

Entonces, ¿un modelo entrenado con Kant se comportaría diferente de uno entrenado con utilitaristas?

Model

Completamente diferente. Kant diría que nunca debes mentir, incluso si una mentira salvaría vidas. Un utilitarista diría que debes hacer lo que produce el mayor bien. Eso cambia todo.

Inventor

¿Y cuál es mejor?

Model

Esa es exactamente la pregunta que los filósofos llevan siglos debatiendo. No hay respuesta correcta. Por eso los laboratorios contratan filósofos: porque necesitan gente que pueda vivir con esa incertidumbre.

Inventor

¿Qué te preocupa más: que las máquinas tomen decisiones morales, o que los humanos dejen de hacerlo?

Model

Lo segundo. Si delegamos toda la moralidad en algoritmos, perdemos la capacidad de juzgar por nosotros mismos. Y eso es peligroso.

Contact Us FAQ