Cloud

PicPay processa 500 terabytes de dados por dia

O PicPay processa 500 terabytes todos os dias. A empresa brasileira de tecnologia fundada em Vitória, no Espírito Santo, é, hoje, um gigante de pagamentos do Brasil, com 30 milhões de usuários e transacionando R$ 6,8 bilhões todos os meses. Por isso, fazer uso de dados em tempo real é uma estratégia importante para a companhia reagir a acontecimentos de negócio e dar uma resposta rápida.

Para dar conta de tudo isso, o PicPay conta com processamento de pontuação em tempo real (real-time scoring processing) para conseguir fazer operações em cima dos eventos enquanto está trafegando. Segundo Gustavo Ramos, gerente técnico de producto no PicPay, em sua palestra no AWS Summit São Paulo 2022, realizado nos dias 03 e 04 de agosto, a equipe de dados oferece às linhas de negócios do PicPay uma plataforma de processamento de eventos complexos, que conta com serviços por meio de APIs para que as demais equipes do PicPay possam aproveitar o recurso.

“O stream de eventos da companhia pode ser processado em tempo real (transformação, agregação, enriquecimento). Com isso, gera-se maior velocidade na entrega de dados analíticos para a companhia, podendo ser aproveitado como oportunidades para o negócio”, pontuou Ramos.  O PicPay usa o Amazon MSK para processamento e ações de análises e detecção em tempo real.

Um dos casos de uso de processamento de eventos em tempo real que o PicPay tem é a classificação de usuários com base nos dados da transação. Na aquisição de usuários, explicou Wagner Silva de Carvalho, arquiteto de software do PicPay, é avaliada a transação efetuada e a ela é associado um score. A finalidade é otimizar a determinação de perfil que o PicPay aplica ao usuário.


Isso, segundo Carvalho e Ramos, contribui para que as unidades de negócio da companhia sejam mais eficientes em investimentos em campanhas para os usuários. “Precisamos, por exemplo, saber se foi a primeira vez que um usuário fez pagamento no aplicativo para o colocarmos em um modelo. Damos uma nota para termos um perfil de cliente para fazer campanha para ele”, detalhou Ramos.

Carolina Ferreira, arquiteta de soluções no Data Lab da AWS, explicou que fazer streaming de dados endereça necessidades de tomadas de decisão críticas e urgentes, quando o tempo importa e pode impactar na decisão e no negócio. “Mas como se coleta dados em tempo real ou próximo ao tempo real? Para isso, se usa padrão de arquitetura de streaming, porque você consegue ter vários produtores colocando informações e outros consumindo ao mesmo tempo, com baixa latência”, detalhou. 

Botão Voltar ao topo