El 94% usa IA en trabajos evaluados, y no es el problema

La Encuesta de IA Generativa para Estudiantes 2026 del Higher Education Policy Institute llegó la semana pasada con una estadística que acaparó titulares: el 94% de los estudiantes universitarios británicos ahora usan IA generativa para ayudar con trabajos evaluados (HEPI, 2026). La reacción fue predecible. Algunos comentaristas se lamentaron por la integridad académica. Otros pidieron herramientas de detección más estrictas. Unos pocos sugirieron simplemente aceptar la derrota y dejar que la IA escriba todo.

Todas estas respuestas pierden el punto. La cifra del 94% no es evidencia de que los estudiantes estén haciendo trampa en masa. Es evidencia de que la evaluación tradicional está rota, y lo ha estado por algún tiempo. Hemos estado calificando resultados que la IA ahora puede producir sin esfuerzo, y luego actuamos sorprendidos cuando los estudiantes usan IA para producirlos. El problema no son los estudiantes. El problema es que hemos estado evaluando las cosas equivocadas.

¿Qué muestra realmente la encuesta HEPI?

El informe HEPI, realizado por Savanta en diciembre de 2025 con 1.054 estudiantes universitarios a tiempo completo en el Reino Unido, revela una imagen más matizada de lo que sugiere el titular. Sí, el 94% usa IA para ayudar con trabajos evaluados. Pero "ayudar" cubre un amplio espectro: resumir lecturas densas, generar borradores de esquemas, explicar conceptos difíciles y revisar gramática. Solo el 12% reporta incluir directamente texto generado por IA en sus entregas, frente al 8% del año anterior.

Las respuestas cualitativas son particularmente reveladoras. Un estudiante explicó que "las herramientas de IA me permitieron resumir rápidamente lecturas densas y generar borradores o esquemas para tareas, ahorrando horas de trabajo tedioso y permitiéndome enfocarme en el análisis crítico y una comprensión más profunda." Otro admitió simplemente: "No estoy usando mi cerebro en absoluto." Los autores de HEPI notan el contraste llamativo: "Hay una diferencia entre un estudiante que utiliza la IA para avanzar en su aprendizaje y un estudiante que externaliza su aprendizaje a la IA."

Esta distinción importa. El primer estudiante está usando la IA como andamiaje cognitivo, liberando recursos mentales para el pensamiento de orden superior. El segundo está experimentando lo que la OCDE llama "descarga cognitiva", dejando que la IA haga el pensamiento y perdiendo la lucha necesaria para el aprendizaje genuino. Ambos comportamientos se registran como "uso de IA", pero sus implicaciones educativas son opuestas.

Por qué la detección no puede resolver este problema

La respuesta instintiva al aumento del uso de IA es mejorar la detección. Si los estudiantes están usando IA inapropiadamente, atrápelos. Pero este enfoque ha fallado, está fallando y continuará fallando por razones que ahora están bien documentadas.

Análisis independientes han encontrado que las herramientas de detección de IA producen tasas de falsos positivos entre el 5% y el 20%, lo que significa que el trabajo genuino de estudiantes es rutinariamente marcado como generado por máquina (Nesenoff & Miltenberg, 2025). Las consecuencias no son abstractas. En 2024, la Australian Catholic University acusó falsamente a aproximadamente 1.500 estudiantes basándose en el detector de IA de Turnitin. Los estudiantes perdieron puestos de enfermería para graduados. Los expedientes fueron marcados como "resultados retenidos" durante meses. Algunos fueron obligados a entregar todo su historial de navegación de internet para probar su inocencia.

Estas herramientas son particularmente poco confiables para hablantes no nativos de inglés y estudiantes neurodivergentes, cuyos patrones de escritura pueden diferir naturalmente de lo que los algoritmos esperan que parezca "escritura humana". Un estudiante de la Yale School of Management demandó en 2025 alegando suspensión injusta después de que GPTZero marcara su examen, citando discriminación contra hablantes no nativos de inglés. La carrera armamentista de detección no solo es ineficaz; daña activamente a los estudiantes que dice proteger.

Incluso cuando la detección funciona, solo aborda el síntoma. Un estudiante que evade exitosamente la detección aún no ha aprendido nada de la tarea. Un estudiante que es atrapado ha sido castigado, pero la estructura de incentivos subyacente permanece sin cambios. Mientras evaluemos resultados que la IA puede producir, incentivamos a los estudiantes a usar IA para producirlos. La detección trata el comportamiento como un fracaso moral cuando en realidad es una respuesta racional a incentivos mal alineados.

El verdadero problema: Evaluar resultados que ya no requieren pensamiento humano

El ensayo tradicional, el informe de laboratorio, el conjunto de problemas: estos formatos de evaluación evolucionaron cuando producirlos requería un esfuerzo cognitivo sostenido. Si querías un argumento bien estructurado sobre la fotosíntesis, tenías que entender la fotosíntesis. Si querías un análisis coherente de resultados de titulación, tenías que realizar la titulación y pensar en los datos. El resultado servía como evidencia razonable del proceso.

Esa correlación se ha roto. Un estudiante ahora puede pedir a una IA que genere un ensayo sofisticado, completo con citas, en menos de un minuto. Pueden solicitar un informe de laboratorio con observaciones plausibles, análisis de errores apropiado y conclusiones bien razonadas sin tocar ningún equipo. El resultado parece correcto porque la IA puede sintetizar cómo se ven los resultados correctos. Pero el estudiante no ha desarrollado ninguna de las habilidades que la tarea estaba diseñada para enseñar.

Este no es un problema nuevo. Los estudiantes siempre han encontrado formas de acortar las evaluaciones: copiar de años anteriores, dividir el trabajo entre grupos de estudio, comprar ensayos en línea. La IA simplemente ha democratizado el atajo, haciéndolo accesible para todos en lugar de solo para aquellos con recursos o conexiones. La escala ha cambiado, pero el problema subyacente, que evaluamos resultados desconectados del proceso, ha existido por décadas.

¿Cómo es la evaluación a prueba de IA?

El Panorama de la Educación Digital de la OCDE 2026 respondió a esta pregunta explícitamente: "En lugar de calificar el trabajo final, los profesores deberían evaluar cómo un estudiante interactuó con la IA, cómo criticó su resultado y cómo refinó sus ideas a lo largo del tiempo" (OCDE, 2026). Esta es la evaluación orientada a procesos: evaluar no lo que los estudiantes producen, sino cómo se involucran con el aprendizaje para producirlo.

En la práctica, esto significa capturar el proceso mismo. Cuando un estudiante trabaja en un problema, ¿qué decisiones toma? Cuando encuentra dificultades, ¿cómo responde? Cuando su primer enfoque falla, ¿se adapta o se rinde? Estas preguntas abordan lo que la educación realmente busca desarrollar: habilidades de pensamiento, capacidad de resolución de problemas y la capacidad de aprender de los errores.

La ciencia de laboratorio ofrece un ejemplo particularmente claro. No puedes usar IA para atravesar la técnica de pipeteo. No puedes pedirle a ChatGPT que desarrolle tu control motor fino, tu capacidad de observar cambios sutiles de color, o tu instinto para cuando un experimento se siente mal. Estas habilidades existen en el cuerpo y se desarrollan a través de la práctica. Un estudiante que observa a la IA generar un informe de laboratorio perfecto no ha aprendido nada sobre trabajar en un laboratorio.

Cómo los laboratorios virtuales hacen posible la evaluación de procesos

En WhimsyLabs, la evaluación orientada a procesos no es una adaptación en respuesta a la IA. Es cómo diseñamos nuestra plataforma desde el principio. Nuestros laboratorios virtuales capturan cada acción que realiza un estudiante: qué equipo selecciona, en qué orden realiza los pasos, cómo responde a resultados inesperados y cómo mejora su técnica con el tiempo. Este registro de interacciones crea un registro detallado del pensamiento científico en acción.

El registro de acciones es la base. Cuando un estudiante pipetea una solución, rastreamos su técnica: el ángulo en que sostiene la pipeta, la velocidad con que dispensa, si prehumedece la punta. Cuando mide la temperatura, registramos no solo la lectura final sino cuándo la tomó, cuántas lecturas hizo y si esperó al equilibrio. Estos detalles granulares revelan si un estudiante está desarrollando hábitos de laboratorio adecuados o simplemente pasando por los movimientos.

La calificación de técnica se basa en el registro de acciones para evaluar la competencia procedimental. Un estudiante que alcanza el punto final correcto en una titulación a través de técnica descuidada recibe retroalimentación diferente que uno cuya técnica fue precisa pero que calculó mal la molaridad. Ambos necesitan mejorar, pero de diferentes maneras. La evaluación tradicional, enfocada solo en la respuesta final, no puede distinguir entre ellos.

La comparación de caminos expertos pone el comportamiento del estudiante en contexto. Hemos mapeado cómo los científicos expertos abordan experimentos comunes, identificando los árboles de decisión y patrones de resolución de problemas que caracterizan el pensamiento científico competente. Cuando el enfoque de un estudiante diverge significativamente de los caminos expertos, señala una oportunidad para orientación dirigida. Cuando su enfoque se alinea con el razonamiento experto incluso si llega a una conclusión incorrecta, sugiere que su pensamiento científico se está desarrollando apropiadamente.

La crisis de evaluación también es una oportunidad

La encuesta HEPI revela algo que debería preocupar a todo educador: casi dos tercios de los estudiantes (65%) dicen que la evaluación ha cambiado significativamente en respuesta a la IA, y muchos articulan ansiedad sobre falsas acusaciones de mala conducta. Los estudiantes viven en un ambiente de vigilancia donde su trabajo auténtico podría ser marcado como fraudulento, mientras que el trabajo asistido por IA podría pasar desapercibido. Los incentivos son perversos.

Pero la misma encuesta muestra un camino hacia adelante. Los estudiantes ven abrumadoramente las habilidades de IA como esenciales, con el 68% creyendo que estas capacidades son necesarias para prosperar en el mundo actual. No están tratando de hacer trampa. Están tratando de desarrollar habilidades que perciben correctamente como importantes. El problema es que las estructuras de evaluación actuales los obligan a elegir entre desarrollar alfabetización en IA y demostrar conocimiento de la materia, cuando ambos deberían ser posibles simultáneamente.

La evaluación orientada a procesos resuelve esta tensión. Cuando evaluamos cómo piensan los estudiantes en lugar de lo que producen, la IA se convierte en una herramienta en lugar de una amenaza. Los estudiantes pueden usar IA para resumir lecturas, generar borradores de esquemas o verificar su razonamiento, mientras siguen siendo evaluados por el trabajo cognitivo que importa: formar hipótesis, interpretar datos, adaptarse a resultados inesperados y desarrollar habilidades de laboratorio físicas que ninguna IA puede replicar.

Qué significa esto para la educación científica

La educación científica enfrenta un desafío particular porque las habilidades de laboratorio son centrales para la disciplina. Un estudiante que nunca ha sostenido una pipeta, ajustado un microscopio u observado una reacción química no puede afirmar entender la ciencia en ningún sentido significativo. Sin embargo, la evaluación tradicional de laboratorio, enfocada en informes escritos, siempre ha sido vulnerable a los atajos. La IA simplemente ha hecho imposible ignorar la vulnerabilidad.

La solución no es prohibir la IA de la educación científica. Es evaluar lo que la IA no puede hacer: las habilidades físicas, la competencia procedimental, la capacidad de responder a desafíos experimentales en tiempo real. Los laboratorios virtuales que capturan datos de procesos hacen esto posible a escala. El registro de interacciones de un estudiante proporciona evidencia más rica de su desarrollo científico que cualquier informe escrito podría, y no puede ser falsificado por ninguna IA.

Los autores de HEPI concluyen que "las instituciones tienen un papel crucial en asegurar que la IA mejore el aprendizaje en lugar de disminuirlo." Recomiendan inducción estructurada de IA, cambios curriculares para enseñar habilidades de IA explícitamente y orientación clara específica de evaluación. Todo esto es importante. Pero el cambio más fundamental requerido es repensar qué evaluamos en primer lugar.

El noventa y cuatro por ciento de los estudiantes usando IA no es una crisis. Es una señal de que la evaluación debe evolucionar. Las herramientas existen. La investigación lo respalda. La única pregunta es si la educación se adaptará, o continuará luchando una guerra de detección que ya ha perdido.