loader image

F

LETRA F·FAMÍLIA: INFRAESTRUTURA

Fine-tuning

PUBLICADO 07.05.2026 · ATUALIZADO 01.05.2026 · VERSÃO 1.0

01 · Verbum

Definição

Técnica de adaptação de modelo de IA pré-treinado que consiste em continuar treinamento sobre dataset específico, modificando parâmetros do modelo para otimizar desempenho em domínio, estilo ou tarefa particular. Diferencia-se de treinamento do zero (do scratch) — fine-tuning parte de modelo pré-treinado robusto e ajusta seletivamente.

Diferencia-se de RAG (verbete autônomo, item 10) — fine-tuning modifica o modelo em si, enquanto RAG fornece contexto na inferência sem alterar parâmetros. Modalidades técnicas — (a) Full fine-tuning — atualiza todos os parâmetros (custoso); (b) Parameter-Efficient Fine-Tuning (PEFT) — modifica apenas subset; (c) LoRA (Low-Rank Adaptation) — adiciona camadas de adaptação de baixo posto, mais eficiente; (d) QLoRA — combina quantização com LoRA para hardware modesto; (e) Instruction tuning — específico para seguir instruções; (f) RLHF (Reinforcement Learning from Human Feedback) — alinhamento via preferências humanas.

Casos de uso paradigmáticos — adaptação a domínios verticais (jurídico, médico, financeiro), customização de estilo organizacional, criação de modelos especializados a partir de modelos base abertos (Llama, Mistral).

02 · Verbum

Contexto

Fine-tuning é categoria técnica com implicações dogmáticas relevantes para responsabilidade, proteção de dados, e governança de IA.

(i) Pipeline técnico: fine-tuning típico envolve (a) modelo base — pré-treinado em corpus massivo (Llama 3, Mistral, GPT-3.5/4, Gemini); (b) dataset específico — exemplos do domínio (centenas a milhões); (c) infraestrutura computacional — GPUs (NVIDIA H100, A100); (d) hyperparameters — learning rate, batch size, épocas; (e) avaliação — benchmarks específicos do domínio; (f) deployment — disponibilização via API ou on-premises.

(ii) Fine-tuning para uso criminoso — preocupação: vetor de risco crescente. Modelos abertos (Llama, Mistral, Qwen) podem ser fine-tuned para remover safety guardrails — criação de "uncensored models" via datasets adversariais. Comunidade técnica documenta dezenas de modelos disponíveis em Hugging Face e correlatos. Aplicações criminosas potenciais — geração de desinformação personalizada, phishing em escala, CSAM sintético, instruções para fabricação de armas, código malicioso. Caso paradigmático — WormGPT (2023, posteriormente desativado) — variante de GPT-J fine-tuned para fraude.

(iii) Tipificação aplicável: zona em construção. Fine-tuning per se não é crime. Mas pode incidir em concurso quando (a) gera CSAM sintéticoECA arts. 240, 241; (b) instrumentaliza fraude em escala — art. 171 do CP; (c) opera em organização criminosa — Lei 12.850/2013; (d) viola direitos autorais em datasets sem autorização — Lei 9.610/1998; (e) dirige-se a menores manipulativamenteECA Digital. Construção dogmática brasileira é incipiente.

(iv) Fine-tuning e LGPD — dados de treinamento: implicações estruturais. Datasets de fine-tuning frequentemente contêm dados pessoais — comunicações, documentos, conteúdo de redes sociais. Tratamento exige (a) base legal adequada sob LGPD; (b) finalidade específica; (c) limitação de retenção após treinamento; (d) direito de oposição dos titulares; (e) consideração sobre memorization — modelos podem reproduzir dados de treinamento literalmente em casos específicos. AI Act europeu (Regulamento UE 2024/1689) endereça em arts. 10 e 53.

(v) Fine-tuning forense — emergente: aplicação positiva. Modelos podem ser fine-tuned em bases jurídicas brasileiras específicas — jurisprudência STF/STJ, doutrina brasileira, processos anonimizados — para uso em (a) defesa técnica; (b) pesquisa acadêmica; (c) suporte a órgãos públicos. Resolução CNJ 615/2025 estabelece parâmetros para uso de IA pelo Judiciário, incluindo modelos fine-tuned.

(vi) Memorization e leakage: zona técnica preocupante. Pesquisa documenta que LLMs podem memorizar e reproduzir literalmente dados de treinamento em prompts específicos (Carlini et al., 2021, 2023). Fine-tuning sobre dados sensíveis cria risco específico — modelo pode vazar trechos de treinamento.

Mitigações incluem (a) differential privacy durante treinamento; (b) deduplicação de datasets; (c) adversarial training contra extração; (d) avaliação de memorization pré-deployment.

(vii) Fine-tuning vs. RAG — escolha arquitetural: trade-offs. Fine-tuning é preferível quando (a) necessidade de internalização profunda de domínio; (b) estilo organizacional consistente; (c) latência crítica; (d) disponibilidade offline. RAG é preferível quando (a) base de conhecimento atualiza frequentemente; (b) rastreabilidade essencial; (c) proteção de dados exige separação entre modelo e dados; (d) economia de recursos computacionais. Combinação fine-tuning + RAG é frequente em aplicações jurídicas de ponta.

(viii) Open weights vs. closed weights: tensão estrutural. Modelos com open weights (Llama, Mistral, Qwen, DeepSeek) permitem fine-tuning livre, com diferentes licenças sobre uso comercial. Closed weights (GPT, Claude, Gemini) só permitem fine-tuning via APIs do provedor, com políticas de uso restritivas. Debate regulatório sobre risco-benefício de open weights — argumentos pro (inovação, descentralização, transparência) vs. contra (uso criminoso, perda de controle, supply chain risk).

(ix) Direitos autorais em datasets: zona litigiosa. NYT v. OpenAI (2023-) e dezenas de ações análogas globalmente questionam uso de obras protegidas em datasets sem autorização. Decisões iniciais variadas — algumas aceitando uso transformativo (fair use no contexto americano), outras rejeitando. Implicações para fine-tuning são análogas. Brasil — Lei 9.610/1998 não tem doutrina consolidada de fair use, com regime mais restritivo.

(x) Implicações dogmáticas: fine-tuning é categoria técnica de relevância crescente em aplicações brasileiras, com implicações sobre (a) responsabilidade penal em casos de fine-tuning para uso criminoso; (b) proteção de dados sob LGPD em datasets sensíveis; (c) direitos autorais em uso de obras protegidas; (d) governança de IA em organizações com modelos próprios; (e) sigilo profissional em fine-tuning de bases sensíveis; (f) responsabilidade civil por falhas em modelos fine-tuned com prejuízo a terceiros. Categoria de fronteira regulatória contemporânea relevante.

03 · Verbum

Legislação

No Brasil: LGPD — arts. 5º, 7º, 11, 16, 18, 20. Lei 9.610/1998 (direitos autorais). Lei 8.069/1990 (ECA — arts. 240, 241). Lei 15.211/2025 (ECA Digital). Marco Civil da Internet.

PL 2.338/2023 (Marco Legal da IA). Resolução CNJ 332/2020. Resolução CNJ 615/2025. Lei 8.906/1994 (Estatuto da OAB). Lei 12.850/2013. Internacional: AI Act (Regulamento UE 2024/1689) — arts. 10, 28, 53; GDPR — arts. 6, 9, 22; Copyright Directive (UE 2019/790). NIST AI Risk Management Framework. ISO/IEC 42001:2023.

  • LGPD

    Lei Geral de Proteção de Dados Pessoais.

    LEI 13.709/2018 · VIGÊNCIA INTEGRAL DESDE 18.09.2020
  • Lei 9.610/1998

    Lei de Direitos Autorais — disciplina os direitos autorais e conexos no Brasil (Ementa oficial: "Altera, atualiza e consolida a legislação sobre direitos autorais e dá outras providências").

    LEI 9.610/1998 · PUBLICAÇÃO EM 19.02.1998 · LEI DE DIREITOS AUTORAIS (LDA)
  • ECA — Estatuto da Criança e do Adolescente

    Estatuto da Criança e do Adolescente.

    LEI 8.069/1990 · CÓDIGO VIGENTE
  • ECA Digital

    Estatuto da Criança e do Adolescente Digital — proteção de menores em ambiente digital.

    LEI 15.211/2025 · VIGÊNCIA DESDE 2026
  • Marco Civil da Internet

    Estabelece princípios, garantias, direitos e deveres para o uso da Internet no Brasil.

    LEI 12.965/2014 · VIGÊNCIA DESDE 23.06.2014
  • PL 2.338/2023 (Marco Legal da IA)

    Marco Legal da Inteligência Artificial (em tramitação).

    PROJETO DE LEI · MARCO LEGAL DA IA
  • Lei 8.906/1994

    Estatuto da Advocacia e da OAB — disciplina o exercício profissional da advocacia (Ementa oficial: "Dispõe sobre o Estatuto da Advocacia e a Ordem dos Advogados do Brasil — OAB").

    LEI 8.906/1994 · PUBLICAÇÃO EM 04.07.1994 · ESTATUTO DA ADVOCACIA E DA OAB
  • Lei 12.850/2013

    Define organização criminosa e dispõe sobre investigação e meios de obtenção de prova.

    ORGANIZAÇÕES CRIMINOSAS · VIGÊNCIA DESDE 19.09.2013
  • AI Act

    Regulamento de Inteligência Artificial da União Europeia.

    REGULAMENTO UE 2024/1689 · VIGÊNCIA PROGRESSIVA DESDE 2024
  • GDPR

    General Data Protection Regulation — Regulamento Geral de Proteção de Dados da União Europeia.

    REGULAMENTO UE 2016/679 · VIGÊNCIA DESDE 25.05.2018
  • Norma ISO/IEC 42001:2023

    Sistema de gestão de inteligência artificial.

    ISO · 2023

Como citar este verbete

Referência ABNT

ABNT NBR 6023

BIERRENBACH, Juliana. Fine-tuning. Arquivo Conceitual. TechCrime.Project. Bier.Tech, 7 maio 2026. Disponível em: https://firebrick-eel-641877.hostingersite.com/arquivo-conceitual/f/fine-tuning/. Acesso em: [data de acesso].

Receber a Letter

Novos verbetes chegam antes aos assinantes da TechCrime.Letter

Toda semana, leitura crítica do que importa em direito penal e tecnologia, com os verbetes em construção comentados pela autora.

Conhecer a Letter