A frase “sistemas agenticos” (ou “fluxos de trabalho agenticos”) apareceu mais de algumas vezes na Feira Mundial de Engenheiros de IA da semana passada, realizada em São Francisco. Os agentes de IA foram o foco de duas startups líderes em engenharia de IA: LangChain e LlamaIndex, cada uma das quais ofereceu sua própria versão da tecnologia em apresentações.
O termo “agente” no cenário de IA refere-se a um software automatizado que usa grandes modelos de linguagem (LLMs) para diversas tarefas. Mas quando participei do primeiro evento AI Engineer em outubro passado, quando era conhecido como AI Engineer Summit, senti que os agentes de IA eram o aspecto mais badalado – e menos convincente – desse evento. A AutoGPT era a startup de agentes mais quente da época (e patrocinadora principal do evento de outubro), mas sua apresentação me deixou altamente cético.
LangChain
Na Feira Mundial, o AutoGPT não apareceu entre os patrocinadores, mas foi mencionado por Harrison Chase, fundador e CEO da LangChain. Em uma apresentação rápida sobre o tema agentes, Chase começou jogando água fria na campanha publicitária dos agentes para 2023.
“Para mim, o AutoGPT representa o auge do entusiasmo entre os agentes”, disse ele ao público da Feira Mundial. “E, na verdade, acho que, alguns meses depois disso, houve uma pequena queda no interesse, à medida que as pessoas perceberam que a arquitetura genérica do agente não era confiável o suficiente para construir sistemas para envio à produção”.
A história dos agentes segundo LangChain
Ele mencionou a API Assistants da OpenAI como um ponto de viragem para os agentes. Então, no início deste ano, LangChain lançou LangGraph, que Chase descreveu como “construído especificamente para agentes”. Ele observou que o LangGraph foi projetado para ser “altamente controlável e de baixo nível”.
“As empresas que enviavam agentes para a produção estavam construindo arquiteturas cognitivas personalizadas, codificando pequenas diferenças em como queriam que seus agentes se comportassem”, explicou ele. Mas isso não era algo que os sistemas de “agentes genéricos” pudessem oferecer.
Outra crítica que fiz aos agentes em outubro foi que eles pareciam querer tirar os humanos da equação – o que considerei arrogante. Chase adotou um tom muito mais modesto e até listou “humano no circuito” como uma das características definidoras do LangGraph.
LangGraph “vem com uma camada de persistência integrada”, disse ele, “que permite muitos padrões de interação ‘humanos no circuito’ muito legais”.
Detalhes do LangGraph
Chase anunciou no palco que estava lançando “a primeira versão estável do LangGraph” – versão 0.1 de acordo com um gráfico – que, segundo ele, reafirmou seu “compromisso em construir uma arquitetura de agente que permita construir as arquiteturas cognitivas personalizadas necessárias para trazendo agentes para a produção.”
Ele então voltou para a API OpenAI Assistants, que ele disse ser uma boa plataforma para agentes, embora tivesse algumas falhas. “Ele veio com um estado específico que esperava que seu aplicativo tivesse, uma lista de mensagens, e era um pouco rígido e não permitia que você fizesse outras coisas facilmente além disso”, disse ele.
API OpenAI Assistants (de acordo com LangChain)
Isso levou a LangChain a desenvolver um produto SaaS para LangGraph, simplesmente chamado de LangGraph Cloud. Ele oferece “implantação com 1 clique, servidores escalonáveis e filas de tarefas e monitoramento integrado” para agentes.
Ele acrescentou que outro benefício do LangGraph Cloud é que “ele não está vinculado ao OpenAI e suporta qualquer arquitetura cognitiva que você possa construir com LangGraph”.
LhamaIndex
Outra abordagem para agentes de IA foi oferecida pelo criador do LlamaIndex, Jerry Liu, em uma apresentação separada na Feira Mundial. Ele apresentou os agentes como o sucessor natural do RAG (Retrieval-Augmented Generation), que tem sido – até agora – o método mais comum de integração de um LLM pré-treinado com uma fonte de dados externa.
“Se você acompanha nosso Twitter há mais ou menos um ano, basicamente falamos sobre RAG provavelmente 75% do tempo”, disse ele, acrescentando que se tornou comum “não apenas fazer uma pesquisa de consulta única, mas na verdade, armazene seu histórico de conversas ao longo do tempo.
Mas este ano, continuou Lio, “muitas pessoas estão entusiasmadas com a construção de fluxos de trabalho de agentes que possam não apenas sintetizar informações, mas também executar ações e interagir com vários serviços para basicamente devolver o que você precisa”.
A mudança de RAG Q&A para “fluxos de trabalho de agentes”
A LlamaIndex decidiu sabiamente transformar os agentes de IA em algo menos sinistro para as empresas: eles os chamam de “assistentes de conhecimento”.
A RAG “foi apenas o começo” de seu objetivo de criar assistentes de conhecimento, disse Liu. Ele caracterizou o RAG como “um sistema de busca glorificado além de alguns métodos de recuperação que existem há décadas”.
Liu continuou explicando um conjunto bastante complexo de opções para usuários do LlamaIndex, mas a essência geral era que os usuários podem construir agentes mais avançados com técnicas que vão além do RAG. Os usuários podem até construir “um solucionador geral de tarefas multiagentes”, disse ele, “onde você vai além das capacidades de um único agente em direção à orquestração multiagentes”.
De agentes simples a avançados
Tendo aparentemente cunhado “assistentes de conhecimento” para facilitar às empresas a compreensão do conceito de agentes de IA, Liu tentou então explicar o conceito de “RAG agente”, o que complicou novamente as coisas.
“Você não está apenas alimentando diretamente a consulta em um banco de dados vetorial”, disse Lui sobre o RAG agente, “no final, tudo é apenas um LLM interagindo com um conjunto de serviços de dados como ferramentas, certo?”
Hum, certo.
Desde que tudo funcione, Liu disse que esse processo resulta em agentes mais avançados – como “sistemas de controle de qualidade personalizados”, agentes que podem manter o estado do usuário ao longo do tempo e agentes que são capazes de pesquisar informações de fontes de dados estruturadas e não estruturadas.
Para finalizar, Liu anunciou um novo recurso do LlamaIndex, chamado (você adivinhou): Llama Agents. “Vemos isso como um ingrediente-chave para ajudá-lo a construir algo de nível de produção – um assistente de conhecimento de nível de produção – especialmente, você sabe, à medida que o mundo se torna mais agente com o tempo”, disse Liu.
Prévia dos Agentes Llama
Mundo Agente
Harrison Chase começou sua apresentação com uma aparente zombaria da sensação do agente de IA do ano passado, AutoGPT. Mas é claro que resta saber se as soluções fornecidas pela LangChain e LlamaIndex se saem melhor.
A solução LangChain tem um slogan complicado (“arquiteturas cognitivas personalizadas”), mas parece mais simples do que o LlamaIndex, que tem um slogan simples (“assistentes de conhecimento”), mas um fluxo de trabalho complicado. Mas volte daqui a um ano para ver se algum deles funciona na natureza.
YOUTUBE.COM/THENEWSTACK
A tecnologia avança rápido, não perca um episódio. Inscreva-se em nosso canal no YouTube para transmitir todos os nossos podcasts, entrevistas, demonstrações e muito mais.
SE INSCREVER
Richard MacManus é editor sênior da The New Stack e escreve sobre tendências de desenvolvimento de aplicativos e web. Anteriormente, ele fundou o ReadWriteWeb em 2003 e o transformou em um dos sites de notícias de tecnologia mais influentes do mundo. Desde cedo…
Este site utiliza cookies para melhorar sua experiência de navegação. Ao continuar, você concorda com o uso de cookies. Para mais informações, consulte nossa Política de Privacidade.
Funcional
Sempre ativo
O armazenamento ou acesso técnico é estritamente necessário para a finalidade legítima de permitir a utilização de um serviço específico explicitamente solicitado pelo assinante ou utilizador, ou com a finalidade exclusiva de efetuar a transmissão de uma comunicação através de uma rede de comunicações eletrónicas.
Preferências
O armazenamento ou acesso técnico é necessário para o propósito legítimo de armazenar preferências que não são solicitadas pelo assinante ou usuário.
Estatísticas
O armazenamento ou acesso técnico que é usado exclusivamente para fins estatísticos.O armazenamento técnico ou acesso que é usado exclusivamente para fins estatísticos anônimos. Sem uma intimação, conformidade voluntária por parte de seu provedor de serviços de Internet ou registros adicionais de terceiros, as informações armazenadas ou recuperadas apenas para esse fim geralmente não podem ser usadas para identificá-lo.
Marketing
O armazenamento ou acesso técnico é necessário para criar perfis de usuário para enviar publicidade ou para rastrear o usuário em um site ou em vários sites para fins de marketing semelhantes.