Cloud

AWS investe em data lake para extrair informações não-estruturadas na saúde

Na última década, a transformação digital provocou mudanças profundas na área de saúde, com organizações capturando grandes volumes de informações de pacientes. Contudo, conforme apontou Guy Eldredge, gerente principal de produto na AWS, na palestra de lançamento do Amazon HealthLake no AWS re:Invent 2020, os dados costumam ser desestruturados e difíceis de extrair, com informações presas em anotações clínicas, reclamações de seguros, conversas gravadas e muito mais.

Nesse sentido, modelos pré-construídos de aprendizado de máquina conseguem analisar e entender as relações nos dados, identificar tendências e fazer previsões. “Esse novo serviço permite que os clientes da área de saúde e ciências biológicas agreguem todas as suas informações de saúde díspares em vários silos e formatos em um data lake centralizado da AWS”, detalhou.

Segundo explicou, a Amazon facilita a importação dos dados e o armazenamento de dados tanto estruturados como não-estruturados, como notas clínicas e resultados de laboratório. Em seguida, usando modelos de aprendizado de máquina, há a normalização das informações por dados-chave, receitas médicas e eventos como procedimentos, medicamentos e diagnósticos — todas as informações vão sendo acrescidas e os dados sendo indexados para que se possa pesquisar e analisar de forma rápida e fácil todas as informações de saúde.

Eldredge lembrou que, na última década, o setor de saúde e ciências da vida passou por uma enorme transformação digital em saúde, com a digitalização do registro de saúde. “No entanto, hoje, os modelos clínicos mais amplamente usados, por exemplo, para prever o risco de doenças cardíacas, são construídos a partir de recursos altamente disponíveis, mas simples, com menos de 30 pontos de dados, sendo que o registro médico tem pelo menos 200 mil a 300 mil pontos de dados disponíveis para cada paciente, incluindo as anotações médicas”, pontuou.

Os dados médicos são altamente contextuais e chegam em diferentes formatos, como resultados de laboratório ou prescrições e anotações médicas. Os dados geralmente são armazenados em sistemas locais e legados. Os dados precisam ser extraídos e transformados antes que possam ser pesquisados e analisados. Como exemplo, Eldredge  explicou que pode levar semanas ou meses para examinar os registros de saúde individuais, identificar e extrair manualmente as principais informações clínicas.  “O Amazon HealthLake irá extrair os dados como quais medicamentos foram usados e identificar relações, como dosagem, período, resultados relacionados. Também adicionará conceitos como temporalidade. Por exemplo, essa é a pressão sanguínea tirada em 1º de janeiro”, explicou.


 

Botão Voltar ao topo