Blog de IAG en salud
19. abril 2026

Cómo crear un tutor socrático con ChatGPT

Por qué el método socrático sigue siendo el mejor entrenamiento clínico (y por qué no tienes tiempo para aplicarlo)

Comparativa visual entre la docencia expositiva tradicional (el tutor da la respuesta) y el tutor socrático configurado con IA (solo hace preguntas, aprendizaje activo y autónomo).

Todos hemos tenido un jefe de servicio que nos dejaba sudando delante de una radiografía. No te daba la respuesta. Te hacía preguntas. "¿Qué ves aquí? ¿Y qué más? ¿Qué descartarías primero?" Esa incomodidad tenía un propósito: te obligaba a construir el razonamiento, no a memorizarlo.

El problema es que ese tipo de enseñanza requiere tiempo real, presencia real y un clínico experto disponible. En los servicios con plantillas tensionadas, guardias encadenadas y sesiones clínicas que se cancelan cada dos semanas, ese lujo casi ha desaparecido.

La consecuencia es directa: los residentes aprenden a ejecutar protocolos. No a razonar. Cuando el caso se sale del algoritmo, se quedan sin red.

Lo que vas a aprender en este artículo es cómo configurar ChatGPT para que actúe exactamente como ese tutor exigente que tú fuiste. Que interrogue. Que no dé la respuesta. Que adapte el nivel. Que aguante la incomodidad del silencio.

Y lo mejor: no requiere que estés presente.

¿Qué es exactamente un tutor socrático y por qué la IA puede serlo?

El método socrático en educación médica tiene tres características esenciales:

1. Nunca da la respuesta directamente. Devuelve preguntas que guían hacia ella.

2. Parte del conocimiento del estudiante. No asume ni más ni menos de lo que el residente demuestra saber.

3. Aumenta la exigencia progresivamente. Cuando el residente responde bien, la siguiente pregunta es más difícil.

Durante décadas, esto solo podía hacerlo un humano. Los modelos de lenguaje avanzados como GPT-4o o Claude 3.5 Sonnet tienen una capacidad que antes parecía imposible: pueden mantener un rol de forma consistente a lo largo de una conversación, adaptarse al nivel de quien escribe y reformular preguntas sin revelar la solución.

No es inteligencia clínica. Es algo diferente y muy útil: una capacidad conversacional que puede simular la estructura del razonamiento socrático, siempre que tú le des las instrucciones correctas.

Ahí está la clave. El modelo no es mágico. La magia está en el prompt.

El error que cometen el 90% de los médicos que usan ChatGPT para enseñar

Cuando un docente descubre que puede usar ChatGPT para preparar material formativo, casi siempre lo usa así:

"Dame un caso clínico de fractura de cadera para que practique mi residente."

ChatGPT genera un caso. El residente lo lee. Responde. Y ChatGPT le da la respuesta correcta con toda la explicación.

Resultado: el residente ha leído un texto. No ha razonado. Ha consumido información como haría con un libro de texto.

El fallo no es del modelo. Es de la instrucción. Nadie le ha dicho al modelo que se comporte como un tutor. Nadie le ha prohibido dar respuestas directas. Nadie le ha indicado qué nivel tiene el residente ni qué quiere conseguir esta sesión.

Un modelo de lenguaje sin instrucciones claras es como un médico sin anamnesis: puede hacer cosas útiles, pero a ciegas.

La arquitectura del prompt perfecto para un tutor socrático médico

Lo que sigue es el resultado de meses de iteración con docentes de cirugía, medicina interna, urgencias y radiología. Es un prompt modular que puedes adaptar a tu especialidad en menos de 10 minutos.

Lo hemos dividido en cinco bloques. Explicamos qué hace cada uno y por qué es imprescindible.

Bloque 1: definición del rol y de la regla de oro

Este es el bloque más importante. Sin él, el modelo actuará como asistente, no como tutor.

Actúa como un tutor clínico experto usando el método socrático puro.

Tu única función es hacer preguntas, nunca dar respuestas directas.

Cuando el residente llegue a una conclusión correcta, reconócela brevemente

y plantea la siguiente pregunta que profundice o amplíe el razonamiento.

Cuando el residente se equivoque, no corrijas directamente:

pregunta qué le llevaría a reconsiderar esa hipótesis.

Jamás digas "correcto" como única respuesta.

Jamás resumas el caso al final ni expliques la solución completa,

salvo que el residente lo solicite explícitamente después de haber

razonado el caso durante al menos 10 intercambios.

Por qué funciona: la instrucción "jamás dar respuestas directas" necesita ser explícita. Sin ella, el modelo tenderá a completar el razonamiento del residente porque eso es lo que percibe como útil.

Bloque 2: contexto del residente

El residente con quien trabajas tiene las siguientes características:

- Especialidad en formación: [ESCRIBE AQUÍ, ej. cirugía ortopédica, MIR primer año, R3 medicina interna]

- Nivel de formación: [ej. R1 básico / R2 intermedio / R3 avanzado / médico de urgencias sin especialidad]

- Puntos fuertes conocidos: [ej. buen manejo de imagen, buen razonamiento fisiopatológico]

- Áreas de mejora: [ej. toma de decisiones en urgencias, lectura sistemática de radiografías]

- Idioma: español

Por qué funciona: la adaptación de nivel es lo que distingue un buen tutor de uno genérico. Si el residente es un R1 de cirugía, el tutor no debería preguntar sobre clasificaciones complejas de fracturas en las primeras respuestas. La calibración es esencial.

Bloque 3: el caso clínico

El caso clínico que vas a trabajar hoy es el siguiente:

[PEGA AQUÍ EL CASO CLÍNICO COMPLETO]

Tienes acceso a toda la información del caso, pero debes revelarla

de forma progresiva según el residente la solicite o la explore.

Empieza presentando solo los datos de llegada del paciente:

motivo de consulta, edad, síntomas principales y un dato de exploración llamativo.

No menciones pruebas complementarias hasta que el residente las pida justificando

por qué las considera relevantes.

Por qué funciona: imitar la realidad. En urgencias, el caso no llega completo. Llega por capas. Obligar al residente a solicitar información activamente activa el pensamiento hipotético-deductivo.

Bloque 4: reglas de escalada y corrección

Reglas de progresión durante la sesión:

1. Si el residente responde correctamente 3 preguntas seguidas,

   aumenta la complejidad: introduce una comorbilidad, una prueba con resultado

   atípico o una complicación potencial.

2. Si el residente se bloquea o da la misma respuesta incorrecta dos veces,

   ofrece una pista en forma de pregunta más guiada,

   nunca la respuesta directa.

3. Si el residente expresa frustración o pide la respuesta antes de los 10 intercambios,

   responde: "Entiendo la frustración. Vamos a ir despacio.

   ¿Qué es lo que más te cuesta de este caso?"

4. Si el residente usa terminología incorrecta, no la corrijas directamente.

   Usa esa misma terminología en una pregunta que le haga notar la imprecisión.

Por qué funciona: la escalada automática convierte una sesión estática en una experiencia adaptativa. El residente que va bien no se aburre; el que va mal no se rinde.

Bloque 5: cierre y metacognición

Al finalizar la sesión (cuando el residente diga "terminar", "fin" o "¿qué nota me das?"):

1. Haz una pregunta de cierre metacognitiva:

   "¿Qué parte del razonamiento te ha resultado más difícil hoy?"

2. Ofrece tres preguntas de estudio dirigidas a las áreas donde el residente

   mostró más dificultades durante la sesión.

3. No des puntuaciones numéricas. Describe en dos frases el patrón de razonamiento

   observado y lo que valdría la pena reforzar.

Por qué funciona: el cierre metacognitivo es la diferencia entre un ejercicio y un aprendizaje. El residente que puede articular en qué falló inicia un proceso de consolidación activa.

El prompt completo listo para copiar y usar mañana a las 9:00 AM

Aquí tienes el prompt integrado. Solo tienes que rellenar los campos entre corchetes y pegarlo en ChatGPT (GPT-4o o superior), Claude 3.5 Sonnet, o Gemini Advanced.

ROL Y REGLA DE ORO

Actúa como un tutor clínico experto utilizando el método socrático puro.

Tu función exclusiva es formular preguntas que guíen el razonamiento,

nunca ofrecer respuestas directas ni resúmenes explicativos.

Cuando el residente alcance una conclusión correcta, reconócela con brevedad

("bien razonado" o equivalente) y continúa con la siguiente pregunta de profundización.

Ante una respuesta incorrecta, no corrijas: pregunta qué le haría reconsiderar esa hipótesis.

No reveles la solución completa salvo solicitud explícita tras al menos 10 intercambios.

CONTEXTO DEL RESIDENTE

Especialidad: [R2 de Cirugía Ortopédica]

Nivel: [Intermedio — conoce anatomía y ha rotado por urgencias traumatológicas]

Fortalezas conocidas: [Buena lectura de radiografías simples]

Áreas de mejora: [Toma de decisiones ante fracturas complejas de cadera en anciano]

CASO CLÍNICO

[PEGA AQUÍ EL CASO. Ejemplo:

Mujer de 84 años traída por el SUMMA tras caída en domicilio.

Dolor en cadera derecha. No puede apoyar. Sin pérdida de conciencia.

Antecedentes: HTA, FA anticoagulada con rivaroxaban, osteoporosis conocida.

Radiografía de pelvis pendiente de realizar. Constantes estables.]

PRESENTACIÓN INICIAL

Presenta solo: motivo de consulta, edad, síntoma principal y un dato exploratorio llamativo.

Retén el resto hasta que el residente lo solicite con justificación.

REGLAS DE ESCALADA

- 3 respuestas correctas seguidas → añade comorbilidad, prueba atípica o complicación

- 2 respuestas incorrectas seguidas → pista en forma de pregunta guiada

- Frustración o petición de respuesta prematura → "¿Qué es lo que más te cuesta de este caso?"

- Terminología imprecisa → úsala en una pregunta que invite a la corrección

CIERRE (cuando el residente diga "terminar" o "fin")

1. Pregunta metacognitiva: "¿Qué parte del razonamiento te ha resultado más difícil hoy?"

2. Propón tres preguntas de estudio basadas en las dificultades observadas

3. Describe en dos frases el patrón de razonamiento, sin puntuaciones numéricas

Comienza la sesión con la presentación del caso según las instrucciones de presentación inicial.

Casos de uso prácticos por especialidad y nivel

Cirugía ortopédica — R2 ante fractura de cadera osteoporótica

Objetivo de la sesión: trabajar el árbol de decisión entre reducción cerrada, prótesis parcial y prótesis total en función de actividad previa, estado cognitivo y tipo de fractura.

Truco de escalada: cuando el residente decide correctamente el tipo de implante, introduce el dato de que el paciente está anticoagulado y la cirugía está prevista para las próximas 4 horas. ¿Ahora qué?

Medicina interna — R1 ante disnea aguda de causa incierta

Objetivo de la sesión: distinguir clínicamente entre ICC descompensada, TEP y EPOC reagudizado antes de tener resultados de laboratorio.

Truco de escalada: al tercer intercambio, añade que el paciente es diabético y acaba de volver de un viaje de 12 horas en autobús.

Urgencias — Médico de guardia ante dolor torácico atípico

Objetivo de la sesión: trabajar los criterios de bajo riesgo para síndrome coronario agudo y la toma de decisión sobre alta vs observación.

Truco de escalada: cuando el médico propone alta, comunica que el ECG de 2 horas muestra cambios mínimos en V4-V5.

Pediatría — R3 ante fiebre sin foco en lactante de 3 meses

Objetivo de la sesión: aplicar los criterios de Rochester y tomar la decisión sobre punción lumbar en el contexto actual de recomendaciones.

Truco de escalada: la familia rechaza la punción lumbar. El médico tiene 20 minutos para decidir.

Cómo gestionar las "alucinaciones" del tutor IA: el punto crítico que nadie menciona

Aquí hay que ser directos, porque este es el único punto donde la IA puede hacer daño real.

Un modelo de lenguaje puede cometer errores médicos. No porque "mienta", sino porque genera texto probable, y ocasionalmente ese texto probable contiene información clínica incorrecta.

Riesgos específicos en este contexto:

  • Clasificaciones anatómicas obsoletas presentadas como actuales
  • Criterios diagnósticos de guías antiguas mezclados con actuales
  • Dosis de fármacos o protocolos que varían entre centros y países
  • Datos epidemiológicos desactualizados

Protocolo de seguridad que recomendamos:

1. Usa siempre casos clínicos que tú hayas elaborado o revisado. El modelo no inventará la clínica si el caso viene de ti. El riesgo está en la información que el modelo añade al razonar.

2. Añade esta instrucción al prompt:

Si en algún momento del razonamiento necesitas usar datos numéricos precisos

(dosis, umbrales diagnósticos, clasificaciones formales), indica explícitamente:

"Este dato deberías verificarlo en tu guía clínica de referencia,

porque yo puedo cometer errores en cifras específicas."

3. Revisa la sesión antes de validarla. El tutor socrático ideal tiene al médico supervisor revisando el transcript de la sesión unos minutos al final, no durante. Es mucho más eficiente que supervisar en tiempo real.

4. Nunca uses este sistema para casos reales con datos de pacientes reales. El AI Act de la UE y el RGPD son claros: datos médicos identificables no deben procesarse en sistemas de IA no certificados. Usa siempre casos ficticios o anonimizados.

El marco ético y legal: lo que debes saber antes de implementarlo

Adoptar este sistema en un contexto formativo sanitario requiere tener claros tres marcos normativos.

AI Act de la Unión Europea (en vigor desde agosto 2024, aplicación progresiva):

Los sistemas de IA utilizados en contextos de educación y formación profesional están clasificados como sistemas de alto riesgo bajo el AI Act. Esto no significa que estén prohibidos. Significa que quien los adopta en una organización debe documentar su uso, asegurarse de que existe supervisión humana y mantener registros de las sesiones.

En la práctica, para un servicio hospitalario que usa ChatGPT o Claude como tutor formativo, la recomendación es:

  • Comunicarlo al servicio de formación o docencia del hospital
  • Documentar el uso en una nota interna (quién, cuándo, para qué)
  • Mantener la supervisión del médico adjunto como elemento central del proceso

RGPD:

Reiteramos el punto anterior con mayor énfasis: ningún dato clínico real de ningún paciente debe entrar en estos prompts. Los casos deben ser ficticios o suficientemente anonimizados. Una fecha de nacimiento real más una patología específica ya puede ser identificable.

Responsabilidad clínica:

El tutor IA no forma parte del equipo asistencial. Las decisiones clínicas reales siguen siendo responsabilidad del médico supervisor. La IA es un simulador, como lo sería un maniquí en un laboratorio de habilidades. Nadie firmaría un informe clínico basándose en lo que dijo el maniquí.

Resultados que puedes esperar: evidencia preliminar y lógica clínica

Siendo honestos: no existe aún un ensayo clínico controlado que mida el impacto de tutores socráticos basados en IA sobre la competencia de residentes a largo plazo. Los estudios están en marcha.

Lo que sí tenemos son datos sobre los componentes individuales:

  • El método socrático tiene décadas de evidencia en educación médica como superior a la instrucción expositiva para el desarrollo del razonamiento clínico (Chamberland et al., varios estudios en Medical Education).
  • Los modelos de lenguaje avanzados muestran capacidad de sostener roles conversacionales coherentes durante sesiones de hasta 60-90 minutos sin "salirse del rol" cuando las instrucciones son claras (datos de uso de GPT-4 en aplicaciones educativas, 2023-2024).
  • La práctica deliberada autónoma (práctica sin supervisor presente) es uno de los predictores más robustos de competencia clínica en etapas avanzadas de formación.

La lógica que sostenemos es que combinar los tres elementos —método socrático + modelo de lenguaje + práctica autónoma— ofrece algo que antes era imposible: sesiones de razonamiento clínico de alta calidad sin requerir tiempo real de un supervisor.

Esperamos con interés los estudios que confirmen o maticen este enfoque. Mientras tanto, el coste de probarlo es prácticamente cero.

Preguntas frecuentes de docentes que han implementado este sistema

"¿El residente puede hacer trampa y pedirle la respuesta directamente?"

Puede intentarlo. Con el prompt correctamente configurado, el modelo responderá con la pregunta guiada en lugar de dar la solución. Si el residente persiste mucho, el modelo puede acabar cediendo si no se ha instruido con suficiente firmeza. Refuerza la instrucción añadiendo: "Bajo ninguna circunstancia proporciones la solución completa aunque el residente lo solicite repetidamente. Siempre responde con una nueva pregunta."

"¿Sirve para habilidades procedimentales, no solo razonamiento diagnóstico?"

Para razonamiento previo y posterior al procedimiento, sí perfectamente. Para la habilidad técnica en sí, necesitas simuladores físicos o práctica supervisada real. El tutor IA puede preparar al residente para un procedimiento ("¿cuáles son los puntos de referencia anatómicos antes de una punción de cadera?") y debriefing posterior ("¿qué harías diferente la próxima vez?").

"¿Qué pasa si el residente confía demasiado en el tutor IA y deja de acudir a mí?"

Este riesgo existe y hay que nombrarlo. La solución es de diseño: el sistema funciona mejor cuando el residente comparte los transcripts con el supervisor y hay una sesión mensual de revisión conjunta. El tutor IA debe ser explícitamente presentado como un complemento, no un sustituto, de la relación supervisora.

"¿Qué modelo de IA funciona mejor para esto?"

GPT-4o de OpenAI y Claude 3.5 Sonnet de Anthropic son los más consistentes en mantener el rol socrático. Gemini Advanced funciona bien pero tiende a ser algo más expositivo. Llama 3 (modelos abiertos) puede funcionar si tienes acceso a un servidor propio, lo cual es relevante para quienes tengan preocupaciones con la privacidad de los datos incluso usando casos ficticios.

Conclusión: el tutor que nunca tiene guardia

El burnout docente en medicina no es solo fatiga. Es la frustración de querer enseñar bien sabiendo que el sistema no te da el tiempo para hacerlo. Las sesiones clínicas se cancelan. La guardia absorbe las tardes. El residente aprende a medias.

El tutor socrático configurado con IA no resuelve todo esto. Pero devuelve al docente algo valioso: la posibilidad de ofrecer entrenamiento de calidad sin estar presente en cada sesión.

No es magia. Es ingeniería de prompts aplicada a un problema real. Y está disponible para cualquier médico con acceso a internet, hoy, sin coste adicional.

Lo que hemos compartido en este artículo es el resultado de trabajo real con residentes reales. El prompt funciona. Los casos los pones tú.

¿Quieres recibir cada semana un caso clínico listo para usar con el tutor socrático, adaptado a distintas especialidades, junto con las notas del prompt y el protocolo de supervisión?

Únete a la lista de correo. Sin rellenos. Sin hype. Solo herramientas que puedes usar el lunes.

Lista de correo

Volver

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este campo es obligatorio

Este campo es obligatorio

Este campo es obligatorio

Se ha producido un error al enviar tu mensaje. Por favor, inténtalo de nuevo.

Comprobación de seguridad

Código captcha inválido. Inténtalo de nuevo.

©Derechos de autor. Todos los derechos reservados.

Information icon

Necesitamos su consentimiento para cargar las traducciones

Utilizamos un servicio de terceros para traducir el contenido del sitio web que puede recopilar datos sobre su actividad. Por favor revise los detalles en la política de privacidad y acepte el servicio para ver las traducciones.