Nubank suporta Black Friday com reserva de capacidade de nuvem da AWS
O Nubank, banco digital criado em 2013 e atualmente com mais de 60 milhões de clientes, desde 2021 tem realizado o processamento das transações realizadas durante a Black Friday utilizando as instâncias Spot do serviço EC2 (AWS Elastic Compute Cloud). O modelo, que prevê a realização do processamento utilizando o tempo ocioso da capacidade de reserva da nuvem AWS, pode trazer reduções significativas de preço, mas exige planejamento por conta de sua volatilidade.
O gerente de engenharia de TI do Nubank, Vitor Puente, explicou durante o AWS Summit 2022, que acontece nos dias 03 e 04 de agosto, em São Paulo, que o modelo vinha sendo testado pela instituição desde 2019. “Até 2020, tínhamos uma preparação tradicional, com predição, análise das mudanças de um ano para o outro e a aquisição de reservas de capacidade para atender à demanda”, lembra.
No ano passado, depois de dois anos de testes de uso do Spot, o Nubank decidiu rodar o processamento da Black Friday sem reservar capacidade. Com isso, todo o processamento das transações registradas na data foi 70% realizado em instâncias Spot e o restante com processamento sob demanda. “Foi a Black Friday mais eficiente de nossa história em relação a custos, que foram duas vezes menores que em outras Black Fridays”, revela.
Para fazer uso do modelo, o banco contou com uma equipe de monitoramento e mecanismos de fall-back, que garantiriam o retorno da operação em caso de queda das instâncias. Anderson Sant’ana, gerente do time de Cloud Efficiency do Nubank, lembra que a jornada trouxe desafios técnicos, como enfrentar a volatilidade das instâncias. “Para isso, temos que ter fall-back para aumentar disponibilidade e garantir a estabilidade do ambiente. Também é preciso diversificar seu pool, garantindo a disponibilidade de máquinas, e seguir utilizando boas práticas”, explica.
Sant’ana registra que também foi fundamental o trabalho de definição do tipo de aplicações que rodariam em Spot: não poderiam ser serviços sensíveis à latência e, muito menos, serviços que tivessem necessidades específicas, como bancos de dados. Depois de definir os serviços, eles foram divididos de acordo com sua adequação à volatilidade dos spots. “De um lado, colocamos os workloads que decidimos rodar em Spot com automação para subir máquinas on demand em caso de necessidade. De outro, serviços que só utilizam máquinas on demand”, diz Sant’ana.
O que são instâncias Spot
O gerente de negócios para a área de Flexible Compute da AWS, Juan Mestre, explica que o serviço EC2 foi lançado em 2006 com apenas uma instância. “De lá para cá, evoluímos e incrementamos o número de instâncias, que hoje são mais de 475”, ressalta, lembrando que o objetivo é oferecer todas as opções possíveis para todas as cargas de trabalho.
Para isso, a AWS oferece hoje três opções de contratação. A primeira, mais tradicional, com instâncias sob demanda, com pagamento somente pelo tempo de uso. “Vem daí o conceito de elasticidade, que funciona bem para cargas de trabalho que não precisam de recursos permanentes”, explica.
A segunda é a instância reservada, que se parece mais com o mundo do datacenter. Nesse modelo, o cliente assume o compromisso de uso de um a três anos, reservando uma máquina exclusiva nesse período. Paga-se pelo tempo, usando ou não, com desconto em um modelo indicado para cargas estáveis.
A terceira opção são as instâncias Spot, que saem da capacidade de reserva da AWS. “Geralmente esta capacidade está ociosa e é oferecida aos clientes com descontos que chegam a 90%. Serve para cargas de trabalho flexíveis. “É essa capacidade ociosa que entregamos como opção de ser instância Spot. Os descontos, em média, giram entre 60% e 70%, podendo chegar a 90%. Se há muita capacidade de reserva, a tendência é que o preço seja mais baixo”, diz.
A grande diferença está no fato de essas instâncias poderem sofrer eventos de interrupção. Como se trata de capacidade de reserva, pode ser que ela seja requerida por um cliente on-demand. “Quando há essa probabilidade, nós enviamos um aviso, permitindo ao operador trocar de máquina ou salvar os dados”, explica, acrescentando que 95% das instâncias Spot lançadas nos últimos três meses não foram interrompidas.