Com SAS, Dataprev criou uma base analítica unificada com 673 milhões de registros
Com a pandemia de Covid-19, a Dataprev teve que rever a sua estratégia de TI para conduzir o processo de pagamento do auxílio emergencial para a população brasileira. A estatal de TI contratou o SAS por R$ 4.9 milhões para suportar a análise de diferentes bases de dados e aprimorar o mecanismo de identificação e prevenção de fraudes com o objetivo de evitar eventuais falhas de reconhecimento indevido na concessão do auxílio emergencial.
“Foi um tremendo desafio começar a processar um novo benefício social e em caráter emergencial. O auxílio emergencial foi o maior programa de transferência de renda do Brasil de todos os tempos e a Dataprev ficou com a responsabilidade de fazer o processamento, de identificar quais seriam as pessoas que teriam direito ao auxílio”, contou Gustavo Canuto, presidente da Dataprev, em conversa, durante o SAS Executive Connection, com Ricardo Saponara, líder de soluções de fraude e segurança inteligente para América Latina no SAS.
Além do curto período de tempo para desenvolver uma solução, a equipe de Canuto precisou lidar com desafios como identificação dos cenários e das regras específicas para cada um dos cenários, saber onde buscar os dados necessários para fazer os cruzamentos, sabendo que eles viriam de diferentes fontes, origens e cada um com um layout específico e com uma taxa de atualização diferente; e garantir a proteção de dados e da segurança da informação. “Houve a necessidade de ferramenta de data analytics moderna que pudesse fazer estes batimentos rapidamente”, disse Canuto.
Uma das dificuldades para fazer o processamento deveu-se ao fato de que as bases eram de diferentes origens, culminando em qualidade diferente dos dados, o que afetaria a qualidade dos resultados. Era preciso uniformizar os dados. A solução adotada foi a criação de uma base analítica para agregar e consolidar informações oriundas de várias bases espalhadas no governo em uma única base dentro da empresa. Com essa uniformização, o desafio era garantir que resultados estavam corretos e dentro das regras especificadas pelo Ministério da Cidadania. “Neste sentido, tivemos de criar amostras estatísticas de um volume gigantesco de dados para que o Ministério da Cidadania pudesse homologar”, detalhou o presidente da Dataprev, acrescentando que, uma vez tendo a homologação concluída, teria de enviar os dados para as instituições financeiras em formato que os bancos estivessem aptos a recebê-los e a processá-los.
Durante o processo, foi desenvolvido também mecanismos para os cidadãos fazerem consultas para saber a situação em que se encontrava o pedido deles. “Isso foi desenvolvido durante o processamento e fizemos a parte de contestação, para quando o usuário não estivesse satisfeito e pudesse contestar”, disse. Outro ponto de atenção foi a criação de mecanismo para identificar padrões e evitar fraudes externas, a fim de que pessoas não se passassem por outras tentando obter o auxílio.
Como tudo foi possível
O primeiro passo foi formar a base analítica consolidando 22 bases de dados diferentes oriunda de ministérios e órgãos públicos com 673 milhões de registros, que precisavam ser cruzados com a base de informação das pessoas, os CPFs — esses últimos que somam 256 milhões de registros. “A formação da base analítica foi o primeiro desafio e foi feita com ferramenta do SAS, que permitiu fazer os cruzamentos rapidamente”, contou Gustavo Canuto, presidente da Dataprev.
“Com a base analítica formada, começamos a receber os cadastros. Mais de 151 milhões de cadastros no período do auxílio emergencial foram confrontados com a base analítica e, frente algumas regras que foram definidas, conseguimos identificar quais eram as pessoas que tinham ou não direito ao benefício”, detalhou Canuto. “No fim, alcançamos mais de 118 milhões pessoas com auxílio emergencial, em um programa que superou os R$ 235 bilhões.” Todo o motor de desenvolvimento foi baseado em ferramenta SAS.
Ao fazer um balanço, Canuto contou que das 118 milhões de pessoas alcançadas pelo auxílio, 11,9 milhões foram apenas nos seis primeiros dias. “O sistema foi desenhado e implantado em apenas seis dias da publicação da lei. Essa velocidade de desenvolvimento, de desenho de arquitetura, foi um diferencial. Processamos 151 milhões de pedidos, sendo que 99% deles ocorrendo nos primeiros três meses.”
Para prevenir fraudes, o sistema identificava padrões e assim conseguia apontar as solicitações indevidas. A tecnologia para combater fraude foi essencial, principalmente, em se tratando de volume de dados tão grande. “A gente não consegue fazer avaliação registro a registro, tem de usar ferramentas de análise, tentar perceber padrões naquele conjunto de dados que levassem à possibilidade, que indicasse caminho que pudesse ser fraude. Nesse sentido, a ferramenta de data analytics foi essencial”, apontou Canuto.
Houve também um esforço conjunto e parceria entre diversos órgãos públicos, bancos, Caixa Econômica Federal, Ministério da Cidadania, Ministério da Justiça, Conselho Nacional de Justiça (CNJ) e outros poderes. O estado, apontou o presidente da Dataprev, se uniu para fazer com que programa fosse executado e para evitar que o dinheiro chegasse que quem estava tentando fraudar o Estado.