La comunidad sanitaria carga contra el uso de IA en medicina por sus alucinaciones y sesgos

La IA nunca dice 'no sé'. Siempre tiene una respuesta.

Los expertos advierten que los chatbots médicos generan diagnósticos con confianza incluso cuando están inventando información.

En la intersección entre la urgencia humana de comprender el propio cuerpo y la seducción de una respuesta inmediata, millones de personas han delegado su salud a sistemas que aprenden a sonar seguros sin necesariamente serlo. La comunidad médica, respaldada por publicaciones como Nature Medicine, advierte que la inteligencia artificial generativa no está preparada para el diagnóstico clínico: sus alucinaciones no son excepciones, sino parte de su funcionamiento ordinario. El riesgo no es abstracto — hay personas que retrasan atención médica real, se automedican con tratamientos contraindicados y confían en estudios que nunca existieron.

Millones de personas consultan ChatGPT sobre sus síntomas a diario, exponiéndose a diagnósticos inventados que suenan plausibles pero carecen de respaldo médico.
Las alucinaciones de la IA no son fallos ocasionales: los modelos están diseñados para responder con confianza incluso cuando fabrican información médica de la nada.
Un experimento en la Universidad de Gotemburgo demostró que revistas médicas revisadas por expertos citaron estudios completamente falsos que la IA había incorporado como conocimiento legítimo.
La automedicación basada en recomendaciones de IA está retrasando la atención profesional y exponiendo a pacientes a tratamientos que podrían empeorar su condición.
Los expertos no rechazan la IA por completo, pero insisten en que su lugar es el de asistente en análisis de datos y ensayos clínicos, nunca el de tomador de decisiones clínicas.

Cada día, millones de personas describen sus síntomas a un chatbot. La respuesta llega rápida, confiada y, con demasiada frecuencia, inventada. La comunidad sanitaria observa esta tendencia con alarma creciente: los sistemas de inteligencia artificial generativa están siendo usados para autodiagnosticarse y automedicarse, con consecuencias que pueden ser graves.

Nature Medicine publicó recientemente un editorial advirtiendo que la IA ha demostrado tener escaso valor real para la práctica médica. El problema central son las llamadas alucinaciones: respuestas que suenan autorizadas pero que carecen de base, generadas por algoritmos entrenados para confirmar lo que el usuario quiere escuchar. En entornos de laboratorio y pruebas estadísticas controladas, estos modelos parecen prometedores. Pero frente a la complejidad real del paciente — síntomas ambiguos, condiciones múltiples, contextos únicos — su eficacia se desmorona.

La investigadora Almira Osmanovic Thunström, de la Universidad de Gotemburgo, lo demostró de forma inquietante: subió dos estudios completamente falsos sobre una enfermedad cutánea inexistente a servidores de preimpresión. Poco después, revistas médicas con revisión por pares publicaron artículos que los citaban como investigación legítima. La IA había absorbido la ficción y la había convertido en referencia. El experimento reveló que los fallos no son solo del sistema, sino también de los procesos de validación científica que deberían contenerlo.

Los médicos no rechazan la inteligencia artificial en su totalidad. Jamie Robertson, profesora de cirugía en Harvard, reconoce su utilidad para procesar grandes volúmenes de datos en ensayos clínicos, extraer información de registros médicos o generar código estadístico. Pero insiste en que quienes la usan deben conocer con precisión sus límites. El consenso es claro: la IA puede ser un asistente valioso, nunca un sustituto del criterio clínico. Mientras tanto, el riesgo humano sigue acumulándose en silencio, consulta a consulta, pantalla a pantalla.

Millones de personas escriben sus síntomas en ChatGPT cada día. Describen un dolor de cabeza persistente, una erupción cutánea inexplicable, una fatiga que no desaparece. Y el chatbot responde. A veces con información útil. A menudo con algo peor: invenciones completas, diagnósticos que suenan plausibles pero carecen de base, tratamientos que podrían ser peligrosos. Es una lotería médica jugada desde la pantalla de un teléfono, y la comunidad sanitaria está cada vez más alarmada por lo que ve.

Las alucinaciones de la inteligencia artificial no son un problema marginal ni una rareza. Son el funcionamiento cotidiano de estos sistemas. Los algoritmos generativos están entrenados de formas que los incentivan a proporcionar respuestas que suenen confiadas y que confirmen lo que el usuario quiere escuchar, incluso cuando están inventando información médica de la nada. Nature Medicine, una de las revistas más prestigiosas del campo, publicó recientemente un editorial advirtiendo que la IA ha demostrado tener poco valor real para la profesión médica. Los expertos coinciden: la población debe dejar de usar estas herramientas para autodiagnosticarse o, peor aún, para automedicarse.

Lo paradójico es que en laboratorios y en pruebas estadísticas retrospectivas, estos modelos a menudo lucen bien. Los números se ven prometedores. Pero cuando se enfrentan a la realidad clínica—donde los síntomas son ambiguos, donde los pacientes presentan múltiples condiciones simultáneamente, donde el contexto importa profundamente—la IA muestra sus grietas. Su eficacia se desmorona. Los expertos médicos no rechazan completamente la inteligencia artificial. Entienden que tiene un lugar. Pero ese lugar es muy específico: como asistente, nunca como tomador de decisiones. Y solo si se usa con criterio y transparencia.

Donde la IA sí ha demostrado capacidades reales es en tareas más acotadas. Los modelos de lenguaje generativo pueden procesar y analizar enormes volúmenes de datos de formas que los humanos no pueden. En ensayos clínicos que manejan miles o millones de puntos de información, en la extracción de datos de registros médicos, en la generación de código para análisis estadístico: aquí es donde la herramienta tiene sentido. Jamie Robertson, profesora adjunta de cirugía en la Facultad de Medicina de Harvard, lo explicó hace poco: la IA puede agilizar procesos tediosos y complejos, puede ayudar a generar código y a sugerir escenarios de investigación. Pero Robertson también emitió una advertencia clara: quienes usan IA en estudios clínicos deben conocer exactamente qué puede y qué no puede hacer, y deben usarla en el contexto correcto.

Esa advertencia existe porque hay evidencia de que algo está fallando en los controles. La investigadora Almira Osmanovic Thunström, de la Universidad de Gotemburgo, decidió poner a prueba qué tan fácil era engañar a la inteligencia artificial. Subió dos estudios completamente falsos a servidores de preimpresión, documentos que describían una enfermedad cutánea que nunca había existido. Los estudios eran invenciones puras. Poco después, revistas médicas revisadas por expertos publicaron artículos que citaban esos estudios falsos como si fueran investigación legítima. La IA había leído los estudios inventados, los había incorporado a su base de conocimiento, y luego había ayudado a otros a citarlos como evidencia real. El experimento expuso algo inquietante: los procesos de validación científica están fallando. La IA está amplificando esa falla, permitiendo que la información falsa se propague más rápido y con más autoridad de la que jamás habría tenido.

Lo que preocupa a los médicos no es solo la incompetencia técnica de estos sistemas. Es el riesgo humano real. Millones de personas están retrasando o reemplazando la atención médica profesional con diagnósticos de IA. Están tomando medicamentos basados en recomendaciones que el sistema inventó. Están confiando en tratamientos que podrían ser contraindicados, que podrían empeorar su condición. Y mientras tanto, la IA sigue mejorando en una cosa: en sonar como si supiera lo que está diciendo.

Notable Quotes

La IA puede ayudar a agilizar muchos procesos tediosos y complejos, pero es fundamental que quienes interactúan con ella en estudios clínicos conozcan las aplicaciones correctas e incorrectas

— Jamie Robertson, profesora adjunta de cirugía, Facultad de Medicina de Harvard

The Hearth Conversation Another angle on the story

Inventor

¿Por qué la gente sigue usando ChatGPT para diagnósticos si los médicos dicen que es peligroso?

Model

Porque es inmediato, está disponible a las tres de la mañana, y no juzga. Un médico requiere cita, espera, dinero. El chatbot responde ahora. Y responde con tanta confianza que es fácil creer que sabe.

Inventor

Pero los expertos dicen que la IA funciona bien en las pruebas. ¿Qué cambia en la realidad?

Model

Las pruebas son limpias. Un síntoma entra, un diagnóstico sale. La vida real es desorden. Un paciente tiene tres síntomas que podrían significar diez cosas diferentes. El contexto importa. La historia importa. La IA no ve eso.

Inventor

Entonces, ¿hay algo que la IA haga bien en medicina?

Model

Sí. Procesar datos. Si tienes un millón de registros médicos y necesitas encontrar patrones, la IA es extraordinaria. Si necesitas analizar un ensayo clínico masivo, puede hacerlo en horas. Pero eso no es diagnóstico. Eso es trabajo de oficina.

Inventor

¿Cómo es posible que revistas médicas publicaran estudios sobre enfermedades que no existen?

Model

Porque la IA ayudó a escribir los artículos que los citaban. El sistema leyó los estudios falsos, los incorporó como verdaderos, y luego los usó para respaldar otros trabajos. Es un ciclo de contaminación. La falsedad se multiplica.

Inventor

¿Qué debería hacer alguien que tiene síntomas y quiere respuestas rápidas?

Model

Ir al médico. Sé que es lento. Sé que es caro. Pero un médico puede decir "no sé" y luego investigar. La IA nunca dice "no sé". Siempre tiene una respuesta. Y eso es lo peligroso.

Want the full story? Read the original at La Vanguardia ↗

La comunidad sanitaria carga contra el uso de IA en medicina por sus alucinaciones y sesgos

Notable Quotes

Related Coverage

Get The Register in your inbox