Vamos ser agentes: agentes LangChain e LlamaIndex Talk AI

Capcom revela data de lançamento de Dead Rising Deluxe Remaster em 18 de setembro

2 de julho de 2024

A empresa de banco de dados vetorial Qdrant deseja que o RAG seja mais econômico

2 de julho de 2024

Publicado por Douglas S. em 2 de julho de 2024

Categorias

Data Science

LangChain

Na Feira Mundial, o AutoGPT não apareceu entre os patrocinadores, mas foi mencionado por Harrison Chase, fundador e CEO da LangChain. Em uma apresentação rápida sobre o tema agentes, Chase começou jogando água fria na campanha publicitária dos agentes para 2023.

“Para mim, o AutoGPT representa o auge do entusiasmo entre os agentes”, disse ele ao público da Feira Mundial. “E, na verdade, acho que, alguns meses depois disso, houve uma pequena queda no interesse, à medida que as pessoas perceberam que a arquitetura genérica do agente não era confiável o suficiente para construir sistemas para envio à produção”.

A história dos agentes segundo LangChain

Ele mencionou a API Assistants da OpenAI como um ponto de viragem para os agentes. Então, no início deste ano, LangChain lançou LangGraph, que Chase descreveu como “construído especificamente para agentes”. Ele observou que o LangGraph foi projetado para ser “altamente controlável e de baixo nível”.

“As empresas que enviavam agentes para a produção estavam construindo arquiteturas cognitivas personalizadas, codificando pequenas diferenças em como queriam que seus agentes se comportassem”, explicou ele. Mas isso não era algo que os sistemas de “agentes genéricos” pudessem oferecer.

Outra crítica que fiz aos agentes em outubro foi que eles pareciam querer tirar os humanos da equação – o que considerei arrogante. Chase adotou um tom muito mais modesto e até listou “humano no circuito” como uma das características definidoras do LangGraph.

LangGraph “vem com uma camada de persistência integrada”, disse ele, “que permite muitos padrões de interação ‘humanos no circuito’ muito legais”.

Detalhes do LangGraph

Chase anunciou no palco que estava lançando “a primeira versão estável do LangGraph” – versão 0.1 de acordo com um gráfico – que, segundo ele, reafirmou seu “compromisso em construir uma arquitetura de agente que permita construir as arquiteturas cognitivas personalizadas necessárias para trazendo agentes para a produção.”

Ele então voltou para a API OpenAI Assistants, que ele disse ser uma boa plataforma para agentes, embora tivesse algumas falhas. “Ele veio com um estado específico que esperava que seu aplicativo tivesse, uma lista de mensagens, e era um pouco rígido e não permitia que você fizesse outras coisas facilmente além disso”, disse ele.

API OpenAI Assistants (de acordo com LangChain)

Isso levou a LangChain a desenvolver um produto SaaS para LangGraph, simplesmente chamado de LangGraph Cloud. Ele oferece “implantação com 1 clique, servidores escalonáveis e filas de tarefas e monitoramento integrado” para agentes.

Ele acrescentou que outro benefício do LangGraph Cloud é que “ele não está vinculado ao OpenAI e suporta qualquer arquitetura cognitiva que você possa construir com LangGraph”.

LhamaIndex

Outra abordagem para agentes de IA foi oferecida pelo criador do LlamaIndex, Jerry Liu, em uma apresentação separada na Feira Mundial. Ele apresentou os agentes como o sucessor natural do RAG (Retrieval-Augmented Generation), que tem sido – até agora – o método mais comum de integração de um LLM pré-treinado com uma fonte de dados externa.

“Se você acompanha nosso Twitter há mais ou menos um ano, basicamente falamos sobre RAG provavelmente 75% do tempo”, disse ele, acrescentando que se tornou comum “não apenas fazer uma pesquisa de consulta única, mas na verdade, armazene seu histórico de conversas ao longo do tempo.

Mas este ano, continuou Lio, “muitas pessoas estão entusiasmadas com a construção de fluxos de trabalho de agentes que possam não apenas sintetizar informações, mas também executar ações e interagir com vários serviços para basicamente devolver o que você precisa”.

A mudança de RAG Q&A para “fluxos de trabalho de agentes”

A LlamaIndex decidiu sabiamente transformar os agentes de IA em algo menos sinistro para as empresas: eles os chamam de “assistentes de conhecimento”.

A RAG “foi apenas o começo” de seu objetivo de criar assistentes de conhecimento, disse Liu. Ele caracterizou o RAG como “um sistema de busca glorificado além de alguns métodos de recuperação que existem há décadas”.

Liu continuou explicando um conjunto bastante complexo de opções para usuários do LlamaIndex, mas a essência geral era que os usuários podem construir agentes mais avançados com técnicas que vão além do RAG. Os usuários podem até construir “um solucionador geral de tarefas multiagentes”, disse ele, “onde você vai além das capacidades de um único agente em direção à orquestração multiagentes”.

De agentes simples a avançados

Tendo aparentemente cunhado “assistentes de conhecimento” para facilitar às empresas a compreensão do conceito de agentes de IA, Liu tentou então explicar o conceito de “RAG agente”, o que complicou novamente as coisas.

“Você não está apenas alimentando diretamente a consulta em um banco de dados vetorial”, disse Lui sobre o RAG agente, “no final, tudo é apenas um LLM interagindo com um conjunto de serviços de dados como ferramentas, certo?”

Hum, certo.

Desde que tudo funcione, Liu disse que esse processo resulta em agentes mais avançados – como “sistemas de controle de qualidade personalizados”, agentes que podem manter o estado do usuário ao longo do tempo e agentes que são capazes de pesquisar informações de fontes de dados estruturadas e não estruturadas.

Para finalizar, Liu anunciou um novo recurso do LlamaIndex, chamado (você adivinhou): Llama Agents. “Vemos isso como um ingrediente-chave para ajudá-lo a construir algo de nível de produção – um assistente de conhecimento de nível de produção – especialmente, você sabe, à medida que o mundo se torna mais agente com o tempo”, disse Liu.

Prévia dos Agentes Llama

Mundo Agente

Harrison Chase começou sua apresentação com uma aparente zombaria da sensação do agente de IA do ano passado, AutoGPT. Mas é claro que resta saber se as soluções fornecidas pela LangChain e LlamaIndex se saem melhor.

A solução LangChain tem um slogan complicado (“arquiteturas cognitivas personalizadas”), mas parece mais simples do que o LlamaIndex, que tem um slogan simples (“assistentes de conhecimento”), mas um fluxo de trabalho complicado. Mas volte daqui a um ano para ver se algum deles funciona na natureza.

Richard MacManus é editor sênior da The New Stack e escreve sobre tendências de desenvolvimento de aplicativos e web. Anteriormente, ele fundou o ReadWriteWeb em 2003 e o transformou em um dos sites de notícias de tecnologia mais influentes do mundo. Desde cedo…