
PUBLICADO 07.05.2026 · ATUALIZADO 01.05.2026 · VERSÃO 1.0
Técnica de adaptação de modelo de IA pré-treinado que consiste em continuar treinamento sobre dataset específico, modificando parâmetros do modelo para otimizar desempenho em domínio, estilo ou tarefa particular. Diferencia-se de treinamento do zero (do scratch) — fine-tuning parte de modelo pré-treinado robusto e ajusta seletivamente. Diferencia-se de RAG (verbete autônomo, item 10) — fine-tuning modifica o modelo em si, enquanto RAG fornece contexto na inferência sem alterar parâmetros. Modalidades técnicas — (a) Full fine-tuning — atualiza todos os parâmetros (custoso); (b) Parameter-Efficient Fine-Tuning (PEFT) — modifica apenas subset; (c) LoRA (Low-Rank Adaptation) — adiciona camadas de adaptação de baixo posto, mais eficiente; (d) QLoRA — combina quantização com LoRA para hardware modesto; (e) Instruction tuning — específico para seguir instruções; (f) RLHF (Reinforcement Learning from Human Feedback) — alinhamento via preferências humanas. Casos de uso paradigmáticos — adaptação a domínios verticais (jurídico, médico, financeiro), customização de estilo organizacional, criação de modelos especializados a partir de modelos base abertos (Llama, Mistral).Definição
Fine-tuning é categoria técnica com implicações dogmáticas relevantes para responsabilidade, proteção de dados, e governança de IA.
(i) Pipeline técnico: fine-tuning típico envolve (a) modelo base — pré-treinado em corpus massivo (Llama 3, Mistral, GPT-3.5/4, Gemini); (b) dataset específico — exemplos do domínio (centenas a milhões); (c) infraestrutura computacional — GPUs (NVIDIA H100, A100); (d) hyperparameters — learning rate, batch size, épocas; (e) avaliação — benchmarks específicos do domínio; (f) deployment — disponibilização via API ou on-premises.
(ii) Fine-tuning para uso criminoso — preocupação: vetor de risco crescente. Modelos abertos (Llama, Mistral, Qwen) podem ser fine-tuned para remover safety guardrails — criação de "uncensored models" via datasets adversariais. Comunidade técnica documenta dezenas de modelos disponíveis em Hugging Face e correlatos. Aplicações criminosas potenciais — geração de desinformação personalizada, phishing em escala, CSAM sintético, instruções para fabricação de armas, código malicioso. Caso paradigmático — WormGPT (2023, posteriormente desativado) — variante de GPT-J fine-tuned para fraude.
(iii) Tipificação aplicável: zona em construção. Fine-tuning per se não é crime. Mas pode incidir em concurso quando (a) gera CSAM sintético — ECA arts. 240, 241; (b) instrumentaliza fraude em escala — art. 171 do CP; (c) opera em organização criminosa — Lei 12.850/2013; (d) viola direitos autorais em datasets sem autorização — Lei 9.610/1998; (e) dirige-se a menores manipulativamente — ECA Digital. Construção dogmática brasileira é incipiente.
(iv) Fine-tuning e LGPD — dados de treinamento: implicações estruturais. Datasets de fine-tuning frequentemente contêm dados pessoais — comunicações, documentos, conteúdo de redes sociais. Tratamento exige (a) base legal adequada sob LGPD; (b) finalidade específica; (c) limitação de retenção após treinamento; (d) direito de oposição dos titulares; (e) consideração sobre memorization — modelos podem reproduzir dados de treinamento literalmente em casos específicos. AI Act europeu (Regulamento UE 2024/1689) endereça em arts. 10 e 53.
(v) Fine-tuning forense — emergente: aplicação positiva. Modelos podem ser fine-tuned em bases jurídicas brasileiras específicas — jurisprudência STF/STJ, doutrina brasileira, processos anonimizados — para uso em (a) defesa técnica; (b) pesquisa acadêmica; (c) suporte a órgãos públicos. Resolução CNJ 615/2025 estabelece parâmetros para uso de IA pelo Judiciário, incluindo modelos fine-tuned.
(vi) Memorization e leakage: zona técnica preocupante. Pesquisa documenta que LLMs podem memorizar e reproduzir literalmente dados de treinamento em prompts específicos (Carlini et al., 2021, 2023). Fine-tuning sobre dados sensíveis cria risco específico — modelo pode vazar trechos de treinamento.
Mitigações incluem (a) differential privacy durante treinamento; (b) deduplicação de datasets; (c) adversarial training contra extração; (d) avaliação de memorization pré-deployment.
(vii) Fine-tuning vs. RAG — escolha arquitetural: trade-offs. Fine-tuning é preferível quando (a) necessidade de internalização profunda de domínio; (b) estilo organizacional consistente; (c) latência crítica; (d) disponibilidade offline. RAG é preferível quando (a) base de conhecimento atualiza frequentemente; (b) rastreabilidade essencial; (c) proteção de dados exige separação entre modelo e dados; (d) economia de recursos computacionais. Combinação fine-tuning + RAG é frequente em aplicações jurídicas de ponta.
(viii) Open weights vs. closed weights: tensão estrutural. Modelos com open weights (Llama, Mistral, Qwen, DeepSeek) permitem fine-tuning livre, com diferentes licenças sobre uso comercial. Closed weights (GPT, Claude, Gemini) só permitem fine-tuning via APIs do provedor, com políticas de uso restritivas. Debate regulatório sobre risco-benefício de open weights — argumentos pro (inovação, descentralização, transparência) vs. contra (uso criminoso, perda de controle, supply chain risk).
(ix) Direitos autorais em datasets: zona litigiosa. NYT v. OpenAI (2023-) e dezenas de ações análogas globalmente questionam uso de obras protegidas em datasets sem autorização. Decisões iniciais variadas — algumas aceitando uso transformativo (fair use no contexto americano), outras rejeitando. Implicações para fine-tuning são análogas. Brasil — Lei 9.610/1998 não tem doutrina consolidada de fair use, com regime mais restritivo.
(x) Implicações dogmáticas: fine-tuning é categoria técnica de relevância crescente em aplicações brasileiras, com implicações sobre (a) responsabilidade penal em casos de fine-tuning para uso criminoso; (b) proteção de dados sob LGPD em datasets sensíveis; (c) direitos autorais em uso de obras protegidas; (d) governança de IA em organizações com modelos próprios; (e) sigilo profissional em fine-tuning de bases sensíveis; (f) responsabilidade civil por falhas em modelos fine-tuned com prejuízo a terceiros. Categoria de fronteira regulatória contemporânea relevante.
No Brasil: LGPD — arts. 5º, 7º, 11, 16, 18, 20. Lei 9.610/1998 (direitos autorais). Lei 8.069/1990 (ECA — arts. 240, 241). Lei 15.211/2025 (ECA Digital). Marco Civil da Internet.
PL 2.338/2023 (Marco Legal da IA). Resolução CNJ 332/2020. Resolução CNJ 615/2025. Lei 8.906/1994 (Estatuto da OAB). Lei 12.850/2013. Internacional: AI Act (Regulamento UE 2024/1689) — arts. 10, 28, 53; GDPR — arts. 6, 9, 22; Copyright Directive (UE 2019/790). NIST AI Risk Management Framework. ISO/IEC 42001:2023.
Lei de Direitos Autorais — disciplina os direitos autorais e conexos no Brasil (Ementa oficial: "Altera, atualiza e consolida a legislação sobre direitos autorais e dá outras providências").
Estatuto da Criança e do Adolescente.
Estatuto da Criança e do Adolescente Digital — proteção de menores em ambiente digital.
Estabelece princípios, garantias, direitos e deveres para o uso da Internet no Brasil.
Marco Legal da Inteligência Artificial (em tramitação).
Estatuto da Advocacia e da OAB — disciplina o exercício profissional da advocacia (Ementa oficial: "Dispõe sobre o Estatuto da Advocacia e a Ordem dos Advogados do Brasil — OAB").
Define organização criminosa e dispõe sobre investigação e meios de obtenção de prova.
Regulamento de Inteligência Artificial da União Europeia.
General Data Protection Regulation — Regulamento Geral de Proteção de Dados da União Europeia.
Continue a leitura por conexão
LLM (Large Language Model)
INFRAESTRUTURAManual · Letra IIA generativa (inteligência artificial generativa)
INFRAESTRUTURAManual · Letra MModelo fundacional (foundation model)
REGULAçãOManual · Letra AAlinhamento de IA (alignment)
INFRAESTRUTURAManual · Letra GGuardrail (salvaguarda programática de IA)
REGULAçãOManual · Letra AAlucinação de IA
INFRAESTRUTURA
BIERRENBACH, Juliana. Fine-tuning. Arquivo Conceitual. TechCrime.Project. Bier.Tech, 7 maio 2026. Disponível em: https://firebrick-eel-641877.hostingersite.com/arquivo-conceitual/f/fine-tuning/. Acesso em: [data de acesso].Referência ABNT
Toda semana, leitura crítica do que importa em direito penal e tecnologia, com os verbetes em construção comentados pela autora.Novos verbetes chegam antes aos assinantes da TechCrime.Letter
Este site utiliza cookies e tecnologias de armazenamento para duas finalidades distintas: as estritamente necessárias ao funcionamento e à segurança das páginas, que independem de consentimento, e as de análise de navegação, que registram comportamento e identificadores e dependem da sua autorização. Você pode aceitar ou recusar estas últimas livremente: a recusa não restringe o acesso ao conteúdo editorial e pode ser revista a qualquer momento. Consulte a Política de Cookies para a descrição detalhada de cada categoria.