Por que a avaliação no ensino jurídico está em xeque diante da inteligência artificial e por que ajustes superficiais não resolverão
A avaliação acadêmica é, em qualquer área, instrumento delicado. No ensino jurídico, talvez ainda mais, porque dela depende não apenas a certificação individual de quem se forma, mas também a legitimidade pública de uma profissão que historicamente se apresentou ao país por meio da qualidade dos quadros que produz. Avaliar bem, no Direito, sempre exigiu equilíbrio difícil entre validar a apropriação técnica do conteúdo, verificar a capacidade analítica, examinar a postura ética em formação e estimular o desenvolvimento intelectual sustentado. A entrada da inteligência artificial generativa modificou esse equilíbrio em camadas que ainda mal começaram a ser examinadas.
O que muitas faculdades fizeram até aqui, diante da nova realidade, foi tentar preservar instrumentos avaliativos tradicionais com ajustes pontuais. Trabalhos escritos passaram a vir acompanhados de declarações sobre uso de inteligência artificial. Avaliações presenciais ganharam vigilância adicional. Ferramentas de detecção foram contratadas. Critérios de plágio foram estendidos. Cada uma dessas medidas tem mérito introdutório, mas o conjunto delas opera como atualização incremental de um sistema que, em sua estrutura, foi pensado para outro ambiente.
A pergunta que esse artigo coloca é por que tantas instituições de ensino jurídico continuam respondendo à inteligência artificial com ajustes superficiais em instrumentos avaliativos, sem reconhecer que a tecnologia introduziu situações que exigem reconstrução mais profunda do próprio conceito de avaliação. E o que está em jogo, no horizonte da formação jurídica nacional, dependendo de como essa reconstrução for ou não conduzida.
A percepção intuitiva é insuficiente
A leitura predominante entre lideranças acadêmicas sugere que a avaliação preserva sua função se conseguir, por meio de diversas estratégias técnicas, evitar que o aluno utilize inteligência artificial em momentos inadequados. Detecta-se, vigia-se, restringe-se. Esse foco no controle do uso indevido, embora necessário em algumas dimensões, opera em registro limitado.
O primeiro limite é prático. A capacidade institucional de detectar uso de inteligência artificial em trabalhos avaliativos é, e provavelmente continuará sendo, modesta. As ferramentas disponíveis produzem resultados que combinam falsos positivos e falsos negativos em proporções inaceitáveis para fundamentar decisões disciplinares sérias. À medida que a tecnologia evolui, a detecção se torna ainda mais difícil. Apostar a integridade do sistema avaliativo principalmente na detecção é construir o sistema sobre fundação que cederá.
O segundo limite é conceitual. A avaliação acadêmica não existe para impedir o uso de qualquer ferramenta auxiliar. Existe para verificar o que o aluno construiu intelectualmente. Quando a ferramenta auxiliar passa a ser tão poderosa que efetivamente substitui parte do trabalho intelectual, a função avaliativa precisa se reposicionar. Não é mais possível avaliar autoria pura em ambiente em que a autoria pura tornou-se impraticável. A reorganização exigida não é técnica. É conceitual.
O terceiro limite é formativo. Avaliação é, em si, momento de aprendizagem. Avaliações desenhadas para impedir o uso de inteligência artificial frequentemente se tornam exercícios artificiais que perdem valor formativo. Avaliações que se rendem ao uso indiscriminado se tornam validações de saídas externas que esvaziam a função formativa. O equilíbrio entre essas duas armadilhas exige reformulação metodológica que poucos espaços institucionais brasileiros têm capacidade de conduzir com profundidade.
Aspectos invisíveis e subestimados
Existe uma dimensão da avaliação no ensino jurídico que escapa às discussões iniciais. Trata-se da função sinalizadora da avaliação. Por meio do que se avalia, a instituição comunica ao aluno o que considera relevante. Quando a avaliação se concentra em produção textual extensa que pode ser produzida com auxílio de inteligência artificial, a instituição sinaliza, ainda que sem intenção, que esse tipo de produção é o que importa. Quando, ao contrário, a avaliação se concentra em competências que apenas a presença e o exercício direto verificam, a instituição sinaliza que essas competências constituem o núcleo da formação.
Essa função sinalizadora orienta, ao longo dos anos, a maneira como os alunos investem seu tempo, escolhem seus exercícios, constroem suas habilidades. Faculdades que não atualizaram suas avaliações continuam sinalizando para tipos de produção que a inteligência artificial agora executa. Alunos racionais ajustam-se ao sinal, delegando o que pode ser delegado. O resultado é formação que confirma o uso da ferramenta, em vez de construir competências que a excedem.
Outra dimensão pouco lembrada é a do tempo formativo. Avaliações tradicionais frequentemente exigiam exercício prolongado de leitura, escrita e reflexão. Quando esse exercício é parcialmente delegável, o tempo formativo encolhe sem que a instituição perceba. Alunos cumprem as avaliações em horas que antes não bastariam. O cumprimento formal acontece. A formação substantiva, que dependia do tempo, é parcialmente perdida.
Há também a dimensão da equidade. Em uma fase em que a familiaridade com inteligência artificial varia significativamente entre alunos, avaliações que tolerem o uso sem mediação produzem assimetria pesada. Alunos mais familiarizados conseguem produzir resultados quantitativamente superiores com investimento de tempo menor. Alunos menos familiarizados precisam investir mais para chegar a resultados similares. A equidade tradicional da avaliação é comprometida sem que a instituição construa mecanismos compensatórios.
Por fim, há a dimensão da relação entre avaliação e formação profissional. Os egressos das faculdades entrarão em mercado profissional que utiliza inteligência artificial intensivamente, mas que cobra do profissional capacidades específicas. Avaliações que não preparem para essa realidade produzem profissionais formalmente certificados, mas funcionalmente despreparados. O descompasso entre certificação e capacidade real, em médio prazo, afeta a credibilidade da instituição no mercado.
Riscos da abordagem incremental
Quando a avaliação no ensino jurídico é tratada apenas por ajustes pontuais, riscos específicos se acumulam. O primeiro é o risco da formação esvaziada. Alunos cumprem instrumentos avaliativos sem necessariamente desenvolver as competências que esses instrumentos pretendiam verificar. Saem com diploma, mas com formação cuja substância foi corroída sem que a instituição percebesse o processo.
O segundo é o risco da inconsistência institucional. Diferentes professores tomam diferentes decisões sobre o que aceitam e o que não aceitam, sobre como pontuam o uso de inteligência artificial, sobre como tratam casos suspeitos. A inconsistência gera contestação interna, questionamentos jurídicos e mina a autoridade pedagógica do conjunto avaliativo.
O terceiro é o risco da disputa pública. Casos individuais envolvendo avaliação, suspeita de uso indevido e sanção podem chegar à esfera pública, com cobertura midiática que expõe fragilidades institucionais. Faculdades sem narrativa pública consolidada sobre o tema sofrem desproporcionalmente nesses episódios.
O quarto é o risco competitivo. Em mercado universitário cada vez mais competitivo, faculdades que reorganizaram suas avaliações com maturidade conceitual ganham reputação que se converte em decisões concretas de mercado. Instituições incrementalistas encontram-se progressivamente em posição comparativa frágil.
O quinto é o risco regulatório. Órgãos avaliadores da educação superior começam a incluir o tema em seus parâmetros. Instituições despreparadas enfrentarão exigências formais sem que tenham construído as práticas correspondentes.
Critérios de uma reorganização avaliativa madura
Algumas características reaparecem em faculdades de Direito que conseguiram reorganizar a avaliação com profundidade real diante da inteligência artificial. A primeira é o reconhecimento institucional explícito de que o sistema avaliativo precisa ser repensado, não apenas atualizado. Esse reconhecimento desencadeia trabalho de fôlego que combina reflexão pedagógica, repactuação institucional, formação docente sustentada.
A segunda é a redistribuição das modalidades avaliativas. Mais peso em modalidades que verificam competências em ambiente presencial e direto, como avaliações orais qualificadas, exercícios em sala que exigem mobilização imediata de repertório, atividades que partem de material específico controlado pelo professor. Menos peso em modalidades em que o uso de inteligência artificial é dificilmente detectável e, simultaneamente, pouco formativo.
A terceira é a reformulação dos próprios instrumentos. Trabalhos escritos passam a ser estruturados em etapas que documentam a construção, com momentos presenciais de discussão sobre o que se está construindo, com revisões intermediárias que tornam mais difícil a delegação integral.
A quarta é a integração explícita do uso responsável da inteligência artificial ao processo formativo. Avaliações que ensinam a usar a ferramenta com critério, que pedem ao aluno demonstrar não apenas o resultado mas a reflexão sobre o processo, que avaliam a postura intelectual diante do auxílio tecnológico. Essa integração transforma a avaliação em momento formativo sobre o próprio uso ético da tecnologia.
A quinta é a formação docente sustentada sobre o tema. Não workshops isolados, mas processos formativos contínuos que apoiam os professores na reformulação de seus próprios instrumentos e que constroem cultura compartilhada entre o corpo docente.
Implicações competitivas e reputacionais
Em médio prazo, a maturidade institucional na reorganização da avaliação diante da inteligência artificial se consolidará como elemento distintivo no mercado universitário brasileiro. Faculdades que se anteciparem terão construído capital reputacional que será percebido por alunos qualificados, por professores reconhecidos, por mercado profissional, por autoridades avaliadoras.
Há também a dimensão da contribuição ao repertório nacional. As soluções avaliativas que se mostrarem efetivas serão estudadas, replicadas, adaptadas por outras instituições. Quem construir liderança neste tema deixará marca na história da educação jurídica brasileira em um momento de transformação significativa.
Em sentido inverso, instituições que demoram a fazer a reorganização encontrarão-se, em alguns anos, com sistemas avaliativos cuja credibilidade pública se erodiu silenciosamente. Recuperar credibilidade avaliativa é trabalho de muito maior fôlego do que teria sido construir a reorganização no momento adequado.
Reflexão final
Por que a avaliação no ensino jurídico está em xeque diante da inteligência artificial e por que ajustes superficiais não resolverão. Porque a tecnologia introduziu situações que escapam às categorias avaliativas tradicionais. Porque a estratégia da detecção isolada se mostra cada vez mais frágil. Porque a função sinalizadora da avaliação demanda redesenho que excede ajustes pontuais. Porque a equidade entre alunos exige tematização institucional consciente. Porque a preparação para o mercado profissional exige avaliações que cultivem competências que a inteligência artificial não substitui.
O tempo está construindo uma realidade em que essa reorganização se tornará inadiável. As próximas gerações de alunos chegarão com expectativas que tornarão insustentáveis abordagens incrementais. O mercado profissional ajustará suas avaliações sobre o que distingue boa formação jurídica. As autoridades reguladoras incluirão o tema com seriedade crescente. Faculdades que se ocuparem da reorganização agora estarão preparadas. As que demorarem encontrarão-se respondendo sob pressão, com desvantagens que poderiam ter sido evitadas.
A NeuralLex e o trabalho de Jamille Porto, ela mesma docente jurídica em exercício e fundadora de iniciativas voltadas à transformação do ensino jurídico diante da inteligência artificial, oferecem leitura especializada para que faculdades de Direito brasileiras conduzam, com tempo próprio e profundidade adequada, a reorganização avaliativa que essa nova fase histórica passou a exigir.