
PUBLICADO 07.05.2026 · ATUALIZADO 01.05.2026 · VERSÃO 1.0
Documento padronizado que descreve sistematicamente as características, a origem, a composição, os procedimentos de coleta, as motivações, os usos recomendados e as limitações de um dataset utilizado para treinar, validar ou testar sistemas de inteligência artificial. O conceito foi proposto por Timnit Gebru e colaboradores em trabalho acadêmico de 2018 ("Datasheets for Datasets") como resposta à opacidade histórica dos datasets em machine learning, e tornou-se rapidamente referência internacional para transparência em IA. É análogo estrutural ao model card — enquanto o model card documenta o modelo, o datasheet documenta o conjunto de dados que o formou.Definição
O datasheet for datasets tem relevância jurídica crescente em razão do princípio de que a qualidade e os vieses de um dataset determinam diretamente o comportamento do modelo treinado. A ausência ou insuficiência do datasheet tem implicações práticas em múltiplas frentes.
(i) Dever de diligência do desenvolvedor: a omissão em documentar adequadamente datasets de treinamento, especialmente em sistemas de alto risco, pode caracterizar negligência em caso de falha do modelo.
(ii) Prova em processo penal: quando um sistema de IA produz resultado lesivo — por exemplo, reconhecimento facial com falso positivo que leva a prisão injusta, decisão automatizada discriminatória, ou moderação equivocada com consequências penais —, o datasheet é documento probatório de primeira linha para aferir se o dataset continha vieses previsíveis que deveriam ter sido corrigidos.
(iii) Direito à revisão de decisões automatizadas (art. 20 da LGPD): o exercício efetivo desse direito depende de compreensão sobre a origem dos dados que formaram o sistema — informação tipicamente encontrada no datasheet.
(iv) Auditoria regulatória: o AI Act europeu (art. 10) exige que datasets utilizados em sistemas de alto risco atendam a critérios de qualidade, relevância, representatividade e ausência de erros, obrigação cujo cumprimento somente pode ser verificado com documentação equivalente ao datasheet.
(v) Responsabilização distribuída: quando o dataset é fornecido por terceiros (data brokers, plataformas, pesquisadores), o datasheet documenta a cadeia de responsabilidade e permite identificar em que ponto da pipeline ocorreu eventual inadequação. O datasheet também é instrumento importante em casos de violação de direitos autorais por scraping massivo de obras protegidas para treinamento de modelos.
PL 2.338/2023 (Marco Legal da IA). AI Act da União Europeia — Regulamento 2024/1689 (art. 10 — dados e governança de dados; art. 11 — documentação técnica). Art. 20 da LGPD. Norma ISO/IEC 42001:2023. Lei 9.610/1998 (direitos autorais — quando aplicável a obras no dataset).
Marco Legal da Inteligência Artificial (em tramitação).
Regulamento de Inteligência Artificial da União Europeia.
Lei de Direitos Autorais — disciplina os direitos autorais e conexos no Brasil (Ementa oficial: "Altera, atualiza e consolida a legislação sobre direitos autorais e dá outras providências").
Continue a leitura por conexão
Model card (cartão de modelo de IA)
REGULAçãOManual · Letra DDataset
REGULAçãOManual · Letra DData labeling
REGULAçãOManual · Letra AAI Impact Assessment (AIA — avaliação de impacto de IA)
REGULAçãOManual · Letra AAI audit trail (trilha de auditoria de IA)
INFRAESTRUTURAManual · Letra GGovernança de IA
REGULAçãO
BIERRENBACH, Juliana. Datasheet for datasets. Arquivo Conceitual. TechCrime.Project. Bier.Tech, 7 maio 2026. Disponível em: https://firebrick-eel-641877.hostingersite.com/arquivo-conceitual/d/datasheet-for-datasets/. Acesso em: [data de acesso].Referência ABNT
Toda semana, leitura crítica do que importa em direito penal e tecnologia, com os verbetes em construção comentados pela autora.Novos verbetes chegam antes aos assinantes da TechCrime.Letter
Este site utiliza cookies e tecnologias de armazenamento para duas finalidades distintas: as estritamente necessárias ao funcionamento e à segurança das páginas, que independem de consentimento, e as de análise de navegação, que registram comportamento e identificadores e dependem da sua autorização. Você pode aceitar ou recusar estas últimas livremente: a recusa não restringe o acesso ao conteúdo editorial e pode ser revista a qualquer momento. Consulte a Política de Cookies para a descrição detalhada de cada categoria.