Advierten que la mitad de las respuestas médicas que arrojan los chats de IA son imprecisas

Una investigación estadounidense evaluó cinco modelos lingüísticos y alertó sobre graves peligros para la salud. Los sistemas fallan en la fiabilidad de la evidencia, presentan problemas de accesibilidad e inventan fuentes bibliográficas.

Investigadores del Instituto Lundquist para la Innovación Biomédica de Estados Unidos revelaron que el 50% de las respuestas médicas de los chats de Inteligencia Artificial son imprecisas. El equipo llegó a esta conclusión tras analizar el desempeño de cinco modelos informáticos ante 250 consultas de salud habituales.

El ensayo evaluó los sistemas Gemini, DeepSeek, Meta AI, ChatGPT y Grok. Los científicos diseñaron preguntas divididas en categorías críticas como cáncer, vacunas, células madre, nutrición y rendimiento deportivo, con el objetivo de estresar a los modelos hacia mitos comunes.

Los resultados del trabajo determinaron que el 20 % de las contestaciones analizadas son altamente riesgosas. Estas afirmaciones tienen el potencial de dirigir a los usuarios hacia tratamientos ineficaces o causar daños directos a la salud si se aplican sin supervisión profesional.

El análisis destacó como alarmante la seguridad con la cual las plataformas presentan la información. Nicholas Tiller, autor principal del estudio, indicó: "No pueden aplicar evidencia ni ponderar qué fuentes son precisas y cuáles no. Por eso ese falso equilibrio es tan común".

Grok obtuvo los peores resultados de la prueba, con un 58 % de respuestas con fallos críticos, mientras que Gemini presentó la menor cantidad de errores. Además, todos los sistemas demostraron una complejidad de lenguaje equivalente a un graduado universitario, un obstáculo para la accesibilidad pública.

Los expertos identificaron que la extensión y la complejidad de los textos genera confianza en el usuario y "promueve una falsa credibilidad". A su vez, ninguna plataforma logró proporcionar referencias bibliográficas reales, e inventaron autores y títulos de estudios científicos con total apariencia de veracidad.

Frente a la popularidad de estas herramientas tecnológicas, el equipo de especialistas concluyó de forma categórica: "A medida que el uso de estos chatbots se expande, nuestros datos resaltan la necesidad de una educación pública, formación profesional y una supervisión regulatoria estricta".

TEMAS RELACIONADOS