loader image

D

LETRA D·FAMÍLIA: INFRAESTRUTURA

Datasheet for datasets

PUBLICADO 07.05.2026 · ATUALIZADO 01.05.2026 · VERSÃO 1.0

01 · Verbum

Definição

Documento padronizado que descreve sistematicamente as características, a origem, a composição, os procedimentos de coleta, as motivações, os usos recomendados e as limitações de um dataset utilizado para treinar, validar ou testar sistemas de inteligência artificial.

O conceito foi proposto por Timnit Gebru e colaboradores em trabalho acadêmico de 2018 ("Datasheets for Datasets") como resposta à opacidade histórica dos datasets em machine learning, e tornou-se rapidamente referência internacional para transparência em IA. É análogo estrutural ao model card — enquanto o model card documenta o modelo, o datasheet documenta o conjunto de dados que o formou.

02 · Verbum

Contexto

O datasheet for datasets tem relevância jurídica crescente em razão do princípio de que a qualidade e os vieses de um dataset determinam diretamente o comportamento do modelo treinado. A ausência ou insuficiência do datasheet tem implicações práticas em múltiplas frentes.

(i) Dever de diligência do desenvolvedor: a omissão em documentar adequadamente datasets de treinamento, especialmente em sistemas de alto risco, pode caracterizar negligência em caso de falha do modelo.

(ii) Prova em processo penal: quando um sistema de IA produz resultado lesivo — por exemplo, reconhecimento facial com falso positivo que leva a prisão injusta, decisão automatizada discriminatória, ou moderação equivocada com consequências penais —, o datasheet é documento probatório de primeira linha para aferir se o dataset continha vieses previsíveis que deveriam ter sido corrigidos.

(iii) Direito à revisão de decisões automatizadas (art. 20 da LGPD): o exercício efetivo desse direito depende de compreensão sobre a origem dos dados que formaram o sistema — informação tipicamente encontrada no datasheet.

(iv) Auditoria regulatória: o AI Act europeu (art. 10) exige que datasets utilizados em sistemas de alto risco atendam a critérios de qualidade, relevância, representatividade e ausência de erros, obrigação cujo cumprimento somente pode ser verificado com documentação equivalente ao datasheet.

(v) Responsabilização distribuída: quando o dataset é fornecido por terceiros (data brokers, plataformas, pesquisadores), o datasheet documenta a cadeia de responsabilidade e permite identificar em que ponto da pipeline ocorreu eventual inadequação. O datasheet também é instrumento importante em casos de violação de direitos autorais por scraping massivo de obras protegidas para treinamento de modelos.

03 · Verbum

Legislação

PL 2.338/2023 (Marco Legal da IA). AI Act da União Europeia — Regulamento 2024/1689 (art. 10 — dados e governança de dados; art. 11 — documentação técnica). Art. 20 da LGPD. Norma ISO/IEC 42001:2023. Lei 9.610/1998 (direitos autorais — quando aplicável a obras no dataset).

  • PL 2.338/2023 (Marco Legal da IA)

    Marco Legal da Inteligência Artificial (em tramitação).

    PROJETO DE LEI · MARCO LEGAL DA IA
  • AI Act

    Regulamento de Inteligência Artificial da União Europeia.

    REGULAMENTO UE 2024/1689 · VIGÊNCIA PROGRESSIVA DESDE 2024
  • LGPD

    Lei Geral de Proteção de Dados Pessoais.

    LEI 13.709/2018 · VIGÊNCIA INTEGRAL DESDE 18.09.2020
  • Norma ISO/IEC 42001:2023

    Sistema de gestão de inteligência artificial.

    ISO · 2023
  • Lei 9.610/1998

    Lei de Direitos Autorais — disciplina os direitos autorais e conexos no Brasil (Ementa oficial: "Altera, atualiza e consolida a legislação sobre direitos autorais e dá outras providências").

    LEI 9.610/1998 · PUBLICAÇÃO EM 19.02.1998 · LEI DE DIREITOS AUTORAIS (LDA)

Como citar este verbete

Referência ABNT

ABNT NBR 6023

BIERRENBACH, Juliana. Datasheet for datasets. Arquivo Conceitual. TechCrime.Project. Bier.Tech, 7 maio 2026. Disponível em: https://firebrick-eel-641877.hostingersite.com/arquivo-conceitual/d/datasheet-for-datasets/. Acesso em: [data de acesso].

Receber a Letter

Novos verbetes chegam antes aos assinantes da TechCrime.Letter

Toda semana, leitura crítica do que importa em direito penal e tecnologia, com os verbetes em construção comentados pela autora.

Conhecer a Letter