A história dos Agentes Conversacionais
Por: Marcelo Boarin
Um agente conversacional é qualquer sistema computacional que mantêm um diálogo em linguagem natural (NLP) com um humano.
Agentes conversacionais são conhecidos como Chatbots, Voicebots, Videobots, Assistentes Virtuais, Assistentes Conversacionais, IVAs (Interactive Virtual Assistent), IVR (Interactive Voice Response) Conversacional, AVIs (Augmented Voice Intelligence ou Advanced Virtual Intelligence).
Fornecedores de tecnologia criam nomes para identificar seus produtos ou para associar um canal de atendimento, para algo que buscamos a muito tempo, um diálogo fluente com as máquinas através de uma linguagem natural (Agentes Conversacionais).
Para entender sobre a evolução dos agentes conversacionais, apresentamos uma analogia com os períodos da história.
a) Pré–História
Na década de 50, Alan Turing lançou um artigo, intitulado “Computing Machinery and Intelligence” (Máquinas de Computação e Inteligência), que é um dos precursores do tema agente conversacional.
Nesse artigo Alan Turing propôs um teste para avaliar a capacidade de um computador de simular um comportamento humano.
Essa avaliação ficou conhecida como Teste de Turing.
Na década de 60 o desenho animado “Os Jetsons” trouxe os agentes conversacionais para o imaginário popular, através do R.U.D.I. supercomputador atômico utilizado por George Jetson.
R.U.D.I. é um acrônimo para Referential Universal Differential Indexer (Indexador Diferencial Universal Referencial) e possuía uma personalidade humana e era membro da Society for Preventing Cruelty to Humans (Sociedade para a Prevenção da Crueldade contra os Humanos).
Nos episódios dos anos 1980, R.U.D.I. ganhou um monitor com tela plana e um avatar verde, que tinha uma voz trêmula com uma personalidade nervosa e sobrecarregada.
Obs.: Os Jetsons apresentaram previsões que se concretizaram no século 21 (Robôs limpadores, Esteiras Rolantes, Assistente Pessoal, TVs de Tela Plana e Chamadas de Vídeo …).
b) Idade Antiga (Baseado em Regras & Heurística – Texto)
Na década de 60 saímos da ficção para a realidade, com o primeiro agente conversacional, ELIZA.Joseph Weizenbaum criou ELIZA no MIT (Massachusetts Institute of Technology), para explorar a comunicação entre humanos e máquinas. ELIZA simulava uma conversa usando uma metodologia de correspondência e substituição de padrões que dava aos usuários uma ilusão de compreensão.
Weizenbaum, pretendia que o programa fosse um método para explorar a comunicação entre humanos e máquinas, mas ficou surpreso por presenciar muitas pessoas, inclusive sua secretária, atribuindo sentimentos humanos ao programa de computador.
O script mais famoso do ELIZA foi o DOCTOR, que simulava um psicoterapeuta, que usava as palavras dos usuários (Paciente) e através de regras, dava um retorno. Eliza é considerada a mãe de todos os agentes conversacionais.
Na década de 90 foi lançado o A.L.I.C.E., que significa “Linguística Artificial em Entidade Computacional na Internet” e que desenvolvia uma conversa com um humano, aplicando algumas regras de correspondência de padrões heurísticos.
Apesar de não ter passado no teste de Turing, o A.L.I.C.E. ganhou várias competições, como o prêmio Loebner (Premiação de programas considerados pelos jurados como os mais semelhantes aos humanos).
A.L.I.C.E. é baseado em código aberto e faz parte do projeto Pandora, sendo modificado por centenas de desenvolvedores do mundo todo.
c) Idade Média (IA & Assistentes Virtuais – Texto/Voz)
Nos anos 2000 a IBM desenvolveu o Watson, baseado em Inteligência Artificial, destinado a responder perguntas abertas feitas por humanos.
Watson foi concebido para competir no programa de televisão Jeopardy!, que atualmente é exibido pela CBS Television Distribuition.
Em 2011 o Watson ganhou de dois especialistas respondendo perguntas de conhecimento geral, no programa Jeopardy!.
Uma série de tecnologias tiveram avanços significativos* além da maturidade de tecnologias estruturantes (Machine Learning, Cloud Computer, 4G / 5G, IoT…) , permitir que grandes players de tecnologia lançassem seus assistentes virtuais**.
(*)
Compreensão da Linguagem Natural (NLU) e Processamento (NLP), incluindo, compreensão contextual, identificação de intenção, resolução de ambiguidade, interações multimodais
Os agentes conversacionais dessa etapa passaram a ser mais serviçais que nossos amigos.
(**)
Siri – 2010
A Siri é uma assistente virtual disponível para dispositivos da Apple, como iPhone, Mac, Macbook, iPad e Apple Watch, que usa linguagem natural (NLP) e inteligência artificial.
A Siri pode responder perguntas, executar ações solicitadas pelos usuários, fazer recomendações, entre outras funções e vem passando por constantes melhorias para contemplar novas funcionalidades e para tornar a experiência mais “humana”.
A Siri foi a inspiração para a maioria dos assistentes virtuais inteligentes que vieram depois.
Google Assistente – 2012
O Google Assistente é um assistente virtual desenvolvido para Android e IOS que, a exemplo da Siri, também usa linguagem natural para responder perguntas dos usuários e realizar ações por eles solicitadas.
Entre os diferenciais da interface está a capacidade de prever necessidades dos usuários de acordo com seus hábitos de navegação, entre outras informações que são armazenadas de acordo com o seu uso no dia a dia.
Alexa – 2014
Com a popularidade dos assistentes virtuais da Apple e da Google, a Amazon também lançou seu próprio assistente, para facilitar o dia a dia dos usuários de seus produtos.
A Alexa é programada para atender por comandos de voz e executar diversas ações, como tocar músicas, configurar alarmes, fazer listas de tarefas e muito mais.
Obs.: Os assistentes virtuais também passaram a incorporar o controle de sistemas e aparelhos inteligentes que estejam conectadas a eles e a grande diferença desse período é que passaram a receber comandos e perguntas por voz.
No filme “Jornada nas Estrelas IV: A Volta para Casa, eles voltam no tempo e retornam a Terra em 1986. Numa das cenas, vemos a dificuldade de utilizarem o teclado.
d) Idade Moderna (IA Generativa – Texto/Voz)
Com o lançamento do ChatGPT (novembro/2022) todos passaram a correr para incorporar a Inteligência Artificial Generativa aos agentes conversacionais.
O nome “ChatGPT” combina “Chat”, referindo-se à sua funcionalidade de bater papo e “GPT”, que significa Generative Pre-trained Transformer (Transformador Pré-Treinado Generativo), um tipo de modelo de linguagem de grande escala (Large Language Model, LLM*)
(*) Modelos de linguagem de grande escala (LLMs) são modelos de linguagem compostos por uma rede neural com muitos parâmetros. São treinados com grandes quantidades de textos não rotulado usando aprendizado de máquina não supervisionado.
Um ponto importante desse período e que os grandes players buscaram apresentar ao mercado que suas IA Generativa são a bala de prata para todos os problemas.
Gostaria de informar que teremos que orquestrar modelos mistos de Inteligências Artificiais (Generativas e Não), sendo que pelo menos teremos os seguintes padrões para essa avaliação:
- Conversão e Interação Humana;
- Reconhecimento;
- Decisões Preditivas e Analíticas;
- Hiperpersonalisação;
- Padrões e Anomalias;
- Sistemas Autônomos;
- Sistema Orientado a Metas.
e) Idade Contemporânea (IA Generativa & Pessoa Digital – Vídeo)
Você conheceu um pouco sobre a história dos agentes conversacionais, mas ainda estamos engatinhando em função do que está vindo pela frente.
Recentemente os avatares interativos passaram a ter a aparência e o comportamento humano, transformando o diálogo em algo mais natural, autêntico e empático, resultando em um relacionamento mais pessoal com os usuários, aumentado a satisfação e gerando confiança na interação.O avatar interativo que melhor representa essa categoria é a Pessoa Digital.
As expressões faciais e a postura da Pessoa Digital influenciam como o usuário se sente e o torna confortável em se relacionar, pelo nível de confiança gerado.
A Pessoa Digital permite:
- Personalização da aparência, o tom e até mesmo a personalidade, dando vida à marca da sua empresa.
- Interações que não seguem nenhum script, sendo completamente autônomos e interativos, permitindo interações únicas, relevantes e 1:1 com o cliente.
- Ser agnóstico a Modelos de linguagem de grande escala (LLMs), para interações significativas que atendam aos objetivos de negócios.
- Ser agnóstica a solução Omnichannel / Atendimento utilizada pela empresa, permitindo a continuidade do atendimento por todos os canais utilizados no relacionamento com os clientes.
As Pessoas Virtuais vão permitir retornarmos no tempo e considerarmos os agentes conversacionais como nossos amigos, para esses nos ajudarem com várias tarefas*.
(*)
- Consultor Financeiro
- Estilo de Vida / Bons Hábitos
- Alimentação
- Condicionamento Físico
- Melhorar o sono
- Evitar drogas (Tabaco, Álcool …)
- Saúde Mental (Meditação, Agradecimento …)
- Relacionamento Inter Geracional
- Aprender e Praticar um novo idioma
- Consultor para viagens e entretenimento
- Consultor para tarefas específicas (Casa, Apresentações …)
Mas se você acha que essa história acabou …
Prepare se para a Holografia (3D) e a Telepatia.