O que são os LAMs (Large Action Models)?
Durante a última década, o mundo se impressionou com a capacidade dos LLMs (Large Language Models) de entender e gerar texto. Eles escrevem poemas, resumem livros e criam códigos. No entanto, existe uma limitação fundamental: eles vivem “presos” na caixa de texto. Eles dizem o que fazer, mas não fazem por você.
É aqui que entram os LAMs (Large Action Models), e iremos agora nos aprofundar um pouco mais neste assunto. Boa leitura!
Do “Dizer” ao “Fazer”
Enquanto um modelo de linguagem é treinado em textos para prever a próxima palavra, um LAM é treinado em interfaces de usuário e ações. O objetivo dele não é conversar, mas sim operar softwares, aplicativos e sites da mesma forma que um humano faria.
Imagine pedir para uma IA: “Reserve uma mesa no restaurante X para as 20h e chame um Uber para me levar lá”
- Um LLM apenas responderia com um roteiro do que você deve fazer ou geraria um texto simulando a reserva.
- Um LAM navegaria no aplicativo de reservas, clicaria nos botões, preencheria seus dados, abriria o app de transporte e agendaria a corrida.

Mas como funciona um LAM?
Diferente das automações tradicionais (APIs) que precisam que os sistemas “conversem” entre si via código, os LAMs são projetados para entender a interface visual. Eles “veem” botões, caixas de texto e menus, aprendendo a estrutura de aplicativos (seja de delivery, planilhas ou sistemas corporativos) para executar tarefas complexas sem necessidade de integração técnica profunda.
O Impacto no Futuro do Trabalho
A chegada dos LAMs sinaliza a transição dos “Chatbots” para os “Agentes Autônomos”. No mundo corporativo e administrativo, isso significa que em breve não apenas pediremos para a IA “escrever um e-mail”, mas para “enviar o e-mail, atualizar o CRM e agendar o follow-up na agenda”.
Em resumo, se os LLMs nos deram um cérebro digital capaz de pensar, os LAMs estão dando a esse cérebro, mãos digitais capazes de trabalhar.
