Internet

Novo estudo identifica internautas só com metadados e 96,7% de acerto

Um novo estudo, feito por alunos e professores da University College of London e do Instituto Alan Turing, demonstrou como é possível identificar internautas somente por meio dos metadados de mensagens em redes sociais. Com a combinação desse tipo de informações e três algoritmos diferentes, o estudo indica ser possível fazer a identificação com 96,7% dos casos.

O estudo ‘Você é seus metadados: Identificação e ofuscação de usuários de redes Sociais usando informações de metadados’ se valeu de 5 milhões de contas do Twitter para demonstrar que os metadados carregam muito mais informações do que se poderia imaginar – mas ressalta de que embora tenha sido o estudo de caso, “os métodos propostos são de ampla aplicabilidade”. Mesmo com o uso de técnicas de ofuscação de dados, o sucesso na identificação somente com os metadados alcançou 95% de precisão.

Como indica o estudo, para além dos textos das mensagens efetivamente, cada tuíte contém cerca de 144 campos de metadados, com informações como o número de postagens ou visualizações, hashtags, URLs, além de usuários diretamente mencionados. A partir delas, os pesquisadores criaram uma combinação de 14 campos de dados. E os aplicaram em três conhecidos algoritmos de machine learning (Multinomial Logistic Regression, MLR; Random Forest, RF; e K-Nearest Neighbors, KNN).

Outros estudos nessa linha já demonstraram que que o conteúdo de uma mensagem postada em rede social é capaz de revelar idade, gênero, orientação política, ou mesmo o estado de ânimo de grupos ou indivíduos. Análise de imagens podem apontar onde uma foto foi tirada, onde vive o fotógrafo ou mesmo o status de um relacionamento. “Argumentamos que as informações comportamentais contidas nos metadados são tão informativas quanto essas”, sustentam os autores.


Botão Voltar ao topo