Segurança

Microsoft apaga base de dados com 10 milhões de fotos usadas para treinar reconhecimento facial

A Microsoft apagou uma base de dados com 10 milhões de fotos de 100 mil pessoas de todo o mundo que estaria sendo utilizada para treinar sistemas de reconhecimento facial. Trata-se da MS Celeb, desenvolvida em 2016 para ser um repositório de imagens de celebridades, mas esse é um conceito que se mostrou flexível. 

Segundo o pesquisador americano radicado em Berlim Adam Harvey, um dos responsáveis pelo projeto Megapixels, celebridades para essa base de dados podem ser “jornalistas, artistas, músicos, ativistas, criadores de políticas, escritores e acadêmicos”.  Ele também alerta que apesar do movimento da Microsoft, parte do material ainda pode ser acessado pelo Github.

Na prática o MS Celeb é a terceira base de dados de fotografias retiradas da internet – ou quase – a partir da divulgação de suas existências no Megapixels. Primeiro foram a ‘Brainwash’,  de um café na cidade de San Francisco, e a Duke MTMC [de Multi-Target, Multi-Camera], o sistema de câmeras de vigilância da Univesidade de Duke, em Durham, ambas nos Estados Unidos. 

O projeto Megapixels se propõe a investigar as implicações éticas e os efeitos sobre a privacidade individual de bancos de dados utilizados por sistemas de reconhecimento facial e como tudo isso alimenta o uso crescente de tecnologias de vigilância com uso de dados biométricos. 

As informações da Megapixels sobre a MS Celeb foram primeiro divulgadas pelo jornal britânico Financial Times e ganharam o mundo. Não por menos, a Microsoft tirou a página do ar, sem alarde. Assim como outras bases de dados – algumas identificadas pelo projeto, mas ainda ativas – esses repositórios alimentam sistemas de aprendizado de máquina em reconhecimento facial e foram usadas, pelo menos, por duas empresas SenseTime e Megvii. 


Botão Voltar ao topo