
Vem de Portugal o primeiro grande modelo de linguagem (LLM, na sigla em inglês) em português, em que pese a previsão de um LLM feito do lado de cá do Atlântico pelo Plano Brasileiro de Inteligência Artificial. Segundo o governo português, está disponível uma versão beta de AMALIA – Assistente Multimodal Automático de Linguagem com Inteligência Artificial.
O anúncio foi feito pelo Gabinete da Ministra da Juventude e Modernização, Margarida Balseiro Lopes, que lidera o projeto em parceria com o Ministério da Educação, Ciência e Inovação do país. Esse projeto, que recebeu um investimento de 5,5 milhões de euros (cerca de R$ 35 milhões) e foi anunciado em novembro do ano passado, durante o Web Summit 2024, em Lisboa.
Com duração prevista de 18 meses, a iniciativa mirou no desenvolvimento de um modelo de inteligência artificial adaptado ao português europeu e em disponibilizá-lo em código aberto para uso público e privado.
No Brasil, vale lembrar que o PBIA prevê o desenvolvimento de uma IA generativa brasileira. O plano, lançado ainda em julho de 2024, prevê investimento de R$ 1,1 bilhão para criar e aprimorar uma base de dados nacionais para treinamento de IA e tinha como meta é a construção de um modelo de LLM robusto para português em 12 meses. Oito meses depois, a iniciativa ainda aguarda medidas do governo federal.
Já em Portugal, a versão beta do Amália já é capaz de processar e responder a instruções em texto, embora ainda não possua conhecimento especializado. Esta fase inicial servirá como base para o treinamento das próximas etapas: a versão base e a versão multimodal, que integrará diferentes formatos de dados.
Nesta etapa, o acesso ao modelo ficará restrito a pesquisadores dos centros de investigação do consórcio responsável pelo desenvolvimento, que inclui instituições como a Universidade Nova de Lisboa, o Instituto Superior Técnico, a Universidade de Coimbra, a Universidade do Porto e a Universidade do Minho, além de centros como NOVA LINCS, INESC-ID e INESC-TEC.
A Agência para a Modernização Administrativa (AMA) será responsável pela gestão e disseminação do modelo, enquanto a Fundação para a Ciência e Tecnologia (FCT) coordenará o treinamento e a infraestrutura necessária para hospedar o LLM.
“O Amália representa um passo crucial para a soberania digital de Portugal, garantindo que a língua portuguesa tenha representação robusta no cenário global de IA”, afirmou Margarida Balseiro Lopes.
O modelo, que será gratuito e de código aberto, pretende servir tanto a administração pública quanto empresas e academia, reduzindo a dependência de ferramentas estrangeiras. A próxima fase de desenvolvimento incluirá a incorporação de dados especializados, ampliando sua aplicação em setores como saúde, direito e educação.
Além das universidades já mencionadas, participam do projeto investigadores da Universidade da Beira Interior, Universidade de Évora e centros como CISUC e ALGORITMI, consolidando uma rede nacional de expertise em IA e processamento de linguagem natural.