
PUBLICADO 07.05.2026 · ATUALIZADO 01.05.2026 · VERSÃO 1.0
Processo de rotulação manual ou semi-automatizada de dados brutos (imagens, textos, áudios, vídeos) para que possam ser utilizados no treinamento de modelos de inteligência artificial por aprendizado supervisionado. Os rótulos indicam ao sistema o que cada dado representa — por exemplo, marcar rostos em fotos, classificar textos como spam ou não-spam, identificar objetos em imagens.
O data labeling levanta questões éticas e penais quando envolve exposição de trabalhadores (frequentemente em países em desenvolvimento) a conteúdo traumático — moderadores e rotuladores expostos a material de violência extrema, CSAM e discurso de ódio podem sofrer danos psicológicos graves.
Quando o dataset rotulado contém vieses (raciais, de gênero, socioeconômicos), o modelo treinado reproduz e amplifica esses vieses em decisões automatizadas com impacto penal — policiamento preditivo discriminatório, reconhecimento facial com taxas de erro desproporcionais para determinados grupos.
PL 2.338/2023 (Marco Legal da IA — avaliação de impacto algorítmico). LGPD (tratamento de dados pessoais em datasets). Normas trabalhistas (proteção de trabalhadores expostos a conteúdo nocivo).
Marco Legal da Inteligência Artificial (em tramitação).
Continue a leitura por conexão
BIERRENBACH, Juliana. Data labeling. Arquivo Conceitual. TechCrime.Project. Bier.Tech, 7 maio 2026. Disponível em: https://firebrick-eel-641877.hostingersite.com/arquivo-conceitual/d/data-labeling/. Acesso em: [data de acesso].Referência ABNT
Toda semana, leitura crítica do que importa em direito penal e tecnologia, com os verbetes em construção comentados pela autora.Novos verbetes chegam antes aos assinantes da TechCrime.Letter