Marco Legal da IA precisa evitar que dados virem obstáculo à inovação
Um dos pontos mais sensíveis do PL de Inteligência Artificial, em discussão no Congresso Nacional, está no tratamento dado à mineração de textos e dados, ou Text and Data Mining (TDM).

Por Arthur Lourenço*
Na disputa global pela inteligência artificial, a pergunta deixou de ser apenas quem desenvolve o melhor algoritmo. A questão central passou a ser quem tem acesso a dados, segurança jurídica para usá-los e capacidade de transformar pesquisa em produto, serviço e produtividade.
A inovação raramente nasce separada da atividade econômica. Universidades desenvolvem projetos com empresas, startups surgem em incubadoras acadêmicas e centros de pesquisa recebem financiamento privado. Nesse ambiente, a divisão entre pesquisa não comercial e pesquisa orientada ao mercado é cada vez menos evidente, especialmente quando falamos de IA. Uma tecnologia que nasce em laboratório pode, em poucos meses, virar prova de conceito, produto, patente, startup ou solução incorporada por uma grande empresa. Sem parâmetros claros, o risco é estimular uma postura defensiva, com menos parcerias, menos experimentação e mais dificuldade para transformar conhecimento em aplicação concreta.
Esse debate está no centro do Marco Legal da Inteligência Artificial. O Projeto de Lei nº 2.338/2023 foi apresentado no Senado, aprovado pela Casa em dezembro de 2024 e hoje tramita na Câmara dos Deputados, onde aguarda parecer na Comissão Especial sobre Inteligência Artificial. A proposta busca estabelecer regras para o desenvolvimento, o fomento e o uso ético e responsável da IA no país, com o desafio de equilibrar proteção de direitos, segurança jurídica, inovação e competitividade.
Um dos pontos mais sensíveis do texto está no tratamento dado à mineração de textos e dados, ou Text and Data Mining (TDM). A mineração de textos e dados permite analisar grandes volumes de conteúdo para identificar padrões, extrair informações e treinar ou aperfeiçoar sistemas de inteligência artificial. No desenho atual, esse uso fica restrito a finalidades não comerciais e a determinados tipos de organizações, como instituições científicas, educacionais, museus, arquivos públicos e bibliotecas.
A limitação acende um alerta para atividades de pesquisa aplicada e desenvolvimento tecnológico que nascem em ambientes acadêmicos, mas podem evoluir para soluções de mercado. Proteger os direitos sobre esses conteúdos é importante. O problema está em criar uma zona cinzenta para empresas, universidades e centros de pesquisa que precisam usar grandes volumes de dados para desenvolver modelos de IA. Quando a regra não diferencia bem pesquisa acadêmica, prova de conceito, desenvolvimento aplicado e exploração comercial efetiva, a tendência é que bons projetos fiquem parados antes de chegar ao mercado.
O desafio, portanto, não é escolher entre proteção autoral e inovação. Essa oposição simplifica demais um problema que é econômico, tecnológico e regulatório. O ponto central é construir regras que permitam remuneração adequada, circulação regulada de dados e previsibilidade para quem investe em P&D. Isso exige critérios mais objetivos para diferenciar pesquisa, desenvolvimento e uso comercial, além de mecanismos viáveis de autorização, opt-out e licenciamento.
Dados são infraestrutura da inteligência artificial. Tratá-los com responsabilidade é indispensável. Transformá-los em pedágio excessivo para pesquisa aplicada, startups e novos negócios seria um erro estratégico para um país que ainda tenta ganhar escala em inovação.
Arthur Lourenço é advogado e Central Services Director da ClarkeModet Brasil

