Análise de pesquisa · Junho de 2026

Um tutor de IA da Harvard venceu a aula presencial. Veja o que o estudo realmente diz.

Um experimento revisado por pares descobriu que um tutor de IA feito sob medida superou uma aula presencial dada por professores experientes — mais aprendizado, em menos tempo. Aqui está o contexto completo: o que foi medido, como o tutor foi construído e o que o estudo deliberadamente deixou de fora.

Fontes primárias publicadas entre março e junho de 2025

As fontes

As duas fontes abaixo são primárias — um artigo revisado por pares e a newsletter da própria autora. Cada número vem do estudo original, com o link e a data anexados.

Kestin, Miller, Klales et al. — Universidade Harvard
Ensaio controlado randomizado com desenho cruzado · 194 alunos de física da graduação · duas semanas consecutivas, outono de 2023 · temas: tensão superficial e fluxo de fluidos · tutor de IA feito sob medida ("PS2 Pal") vs. aula presencial de aprendizagem ativa com professores experientes
"AI tutoring outperforms in-class active learning" — Scientific Reports, 3 de junho de 2025
Dr Philippa Hardman
Pesquisadora de learning design · consultora de educação da OpenAI · conduz um programa de IA para designers instrucionais · mais de 20 anos em design de cursos online e híbridos
"Learning Design in the Agentic AI Era" — Dr Phil's Newsletter, 20 de março de 2025
Resumo

Cinco coisas que o estudo encontrou

  1. Em um ensaio controlado com 194 alunos de física da Harvard, o grupo ensinado por um tutor de IA feito sob medida tirou notas mais altas no teste do que o grupo numa aula presencial de aprendizagem ativa, conduzida por especialistas.
  2. O grupo da IA também terminou mais rápido — uma mediana de 49 minutos contra cerca de 60 na sala de aula. 70% dos alunos da IA terminaram em menos de uma hora.
  3. O efeito foi grande (0,73–1,3 desvios-padrão) e a chance de ser acaso ficou abaixo de uma em cem milhões.
  4. O tutor não era o ChatGPT puro. Foi deliberadamente projetado sobre princípios pedagógicos baseados em pesquisa — ele não entregava respostas diretas, quebrava os problemas em etapas e respondia ao erro específico de cada aluno.
  5. O estudo cobriu apenas um tema, ao longo de duas semanas, com um único público. Ele não mediu retenção no longo prazo, colaboração, pensamento de ordem superior nem motivação que dura além de uma única sessão.
O resultado

Mais aprendizado, em menos tempo

Os números principais do artigo da Scientific Reports.

O desenho foi um ensaio controlado randomizado cruzado. Os alunos foram divididos em dois grupos: um aprendeu um tema de física por meio de um tutor de IA feito sob medida, o outro por meio de uma aula presencial de aprendizagem ativa conduzida por professores experientes. Na semana seguinte os grupos trocaram de tema e de condição. É um desenho mais robusto do que uma comparação A/B simples, porque cada aluno passa pelas duas condições.

4,5
Nota mediana no teste, grupo da IA (vs. 3,5 na sala)
49 min
Tempo mediano na tarefa, grupo da IA (vs. ~60 na sala)
0,73–1,3
Tamanho do efeito, em desvios-padrão
4,1 / 3,6
Nota de engajamento, IA vs. sala (escala de 5 pontos)

A diferença de aprendizado foi estatisticamente esmagadora — o artigo relata que a probabilidade de a diferença ser acaso ficou abaixo de uma em cem milhões. Os alunos na condição de IA também relataram mais engajamento (4,1 vs. 3,6) e motivação ligeiramente maior (3,4 vs. 3,1). Ou seja, o grupo da IA não só tirou notas melhores no papel; eles relataram uma experiência melhor enquanto faziam.

O detalhe

Não era o ChatGPT puro

O resultado veio de como o tutor foi construído, não do modelo sozinho.

O detalhe mais importante do artigo é fácil de pular: a vantagem do tutor veio do design, não de colocar um chatbot na frente dos alunos. Os pesquisadores o descrevem como "deliberadamente projetado segundo princípios pedagógicos baseados em pesquisa". Na prática, isso significou:

  • Ele se recusava a entregar respostas. Em vez de resolver o problema, ele guiava o aluno a resolvê-lo sozinho — o mesmo movimento que um bom professor faz.
  • Ele gerenciava a carga cognitiva. Os problemas eram quebrados em etapas sequenciais, em vez de despejados de uma vez.
  • Ele respondia ao erro específico de cada aluno. O feedback era personalizado e imediato, tratando o equívoco real.
  • Ele usava linguagem de mentalidade de crescimento no feedback, e recebia soluções pré-escritas no prompt para reduzir alucinações.

Em outras palavras, a pedagogia fez o trabalho pesado, e o modelo a executou em escala e sob demanda. Um chatbot genérico que simplesmente dá as respostas provavelmente produziria um resultado bem diferente. Essa distinção importa para quem lê isto como "a IA substitui o ensino" — o estudo aponta para algo mais estreito: uma explicação bem projetada e interativa agora escala.

Os limites

O que o estudo não mediu

As limitações são tão informativas quanto os resultados.

Os autores são claros sobre as bordas da descoberta. O experimento rodou em uma única área de conhecimento, ao longo de duas semanas, com alunos de graduação da Harvard. Isso deixa várias coisas sem teste:

  • Retenção no longo prazo. Uma janela de duas semanas não pode dizer se os alunos ainda retêm o conhecimento meses depois.
  • Pensamento de ordem superior. As tarefas ficaram nos níveis de "entender, aplicar, analisar" — não síntese aberta ou criação original.
  • Colaboração e habilidades socioemocionais. Não há dados sobre aprender com outros, discussão ou o lado humano de uma sala de aula.
  • Motivação duradoura. O maior engajamento foi medido dentro da sessão, não ao longo de um compromisso do tamanho de um curso.
  • Generalização. Um público de alunos altamente seletivo pode não se comportar como um público geral.

Nada disso enfraquece o resultado. Ele o emoldura. A parte que a IA fez melhor — explicação clara e interativa de um material bem definido — é uma camada específica do aprendizado. As camadas que o estudo não tocou são justamente as que historicamente dependeram de um humano.

O padrão

Por que isso ecoa o que os designers já estão vendo

Uma pesquisadora de learning design chega à mesma borda por outro caminho.

O resultado da Harvard se alinha a um argumento que Philippa Hardman, consultora de educação da OpenAI, fez no começo de 2025. O enquadramento dela não é sobre um único estudo — é sobre por que tanto aprendizado online está sendo entregue à IA, para começar.

O problema não é a capacidade da IA de concluir cursos online assíncronos, mas que os cursos online assíncronos entregam tão pouco valor aos nossos alunos que eles delegam a conclusão à IA. — Dr Philippa Hardman, março de 2025

O ponto dela é que o aprendizado passivo, de entrega de conteúdo, sempre teve pouco valor — a era da IA só expôs isso. Quando um curso é basicamente informação para assistir e ler, uma máquina absorve ou reproduz aquilo mais rápido do que uma pessoa consegue sentar e assistir. O que ela descreve como o trabalho que permanece não é "conteúdo melhor", mas projetar experiências que puxam o aluno para dentro:

[Os designers precisam] projetar experiências de aprendizado de um jeito que gere motivação intrínseca para aprender, o que por sua vez sustenta o engajamento e o aprendizado substantivo. — Dr Philippa Hardman, março de 2025

As duas fontes chegam à mesma linha por lados opostos. A Harvard mostra que a camada de explicação pode ser automatizada bem. Hardman explica por que essa camada nunca foi onde o valor duradouro estava.

A mudança

O que está virando commodity, e o que continua escasso

Lendo o estudo e o comentário lado a lado.

Junte os dois e uma linha aparece. A parte de um curso que apenas transmite e explica informação está virando commodity — um tutor de IA bem construído agora faz isso mais rápido, sob demanda e, no cenário da Harvard, com melhores resultados medidos. O que continua escasso é tudo o que o estudo não conseguiu medir.

Virando commodity
  • Explicação unidirecional de material definido
  • Conteúdo de assistir-ler-responder
  • Responder perguntas previsíveis
  • Entrega de informação no ritmo do aluno
Ainda escasso
  • Prática real e decisões aplicadas
  • Responsabilização e ritmo ao longo do tempo
  • Feedback sobre o trabalho real que as pessoas produzem
  • Um motivo para continuar voltando
A observação

Nenhuma das fontes argumenta que os cursos acabaram. Elas apontam para uma mudança mais estreita: a camada de explicação está sendo automatizada, e o valor de um curso está migrando para as partes que fazem uma pessoa agir, em vez das partes que apenas a informam.

Sobre esta análise

Preparado pela equipe da Kinescope

Kinescope · Análise de pesquisa para quem cria cursos