SEATTLE — Traga recursos de IA e vetores generativos para o que os clientes já usam. Essa é a história da Amazon Web Services com PG Vector, uma ferramenta de código aberto que traz pesquisa de similaridade vetorial para o Postgres.
“Portanto, pense nas extensões como plug-ins”, disse Sirish Chandrasekaran, gerente geral de serviços de banco de dados relacional da Amazon, neste episódio On the Road de The New Stack Makers gravado no Open Source Summit North America.
“Você pode trazer sua extensão e alterar significativamente os recursos do Postgres. Esse é um dos pontos fortes do Postgres. Então, o que o PG Vector faz é permitir armazenar tipos de vetores no Postgres e também fazer outra coisa: pesquisa por similaridade.
Com a IA generativa, ele acrescentou: “Você não está procurando resultados exatos, certo? Não é isso que um (modelo de linguagem grande) faz. Mas você está procurando um conhecimento que esteja próximo. E o conceito de busca por similaridade, ou vizinho mais próximo aproximado, é o que o PG Vector faz muito bem.”
Uma mensagem para o desenvolvedor ‘Fantástico’
Chandrasekaran deu crédito a Andrew Kane, a quem chamou de “este desenvolvedor fantástico” para PG Vector: “Ele está nisso há alguns anos. E fomos o primeiro fornecedor de nuvem a fazer parceria com ele e oferecê-lo. Sempre foi de código aberto. Mas oferecemos isso em Aurora e RDS no início do ano passado.”
PG Vector originalmente tinha um esquema de indexação chamado IVFFlat. É baseado em listas de links e funciona bem para construir índices rapidamente, disse Chandrasekaran.
Mas o rendimento da consulta não funciona tão bem quando se busca taxas mais altas de recall, como a porcentagem dos resultados que você espera e acaba obtendo, disse Chandrasekaran.
Com Kane, a AWS começou a trabalhar no Hierarchical Navigable Small World (HNSW), que oferece uma abordagem baseada em gráficos em comparação com o IVFFlat, que a PG Vector usou. De acordo com a página PG Vector GitHub, HNSW tem melhor desempenho de consulta do que IVFFlat em termos de compensação de recuperação de velocidade, mas tempos de construção mais lentos e usa mais memória.
“Uma grande parte do trabalho tem sido fazer com que o HNSW tenha o mesmo desempenho que o IVFFlat”, disse Chandrasekaran. “É um espaço em rápida evolução. Portanto, há muita coisa que não sabemos. E, portanto, estamos apenas atentos ao que os clientes estão pedindo.
“É uma questão de escala e desempenho, as coisas comuns que você pergunta e procura em um banco de dados. Mas no contexto dos vetores. a abordagem baseada em gráficos é o que você vê que os clientes gostam.”
As vantagens dos gráficos
Os gráficos tornam mais fácil para os clientes procurarem os vizinhos mais próximos, um pilar da IA generativa. A ideia é encontrar pontos semelhantes a uma consulta, mapear os pontos e calcular as distâncias, o que os tecnólogos dizem ser uma abordagem mais fácil do que algoritmos complexos de aprendizado de máquina.
Adicionar gráficos cria a oportunidade para algoritmos de vizinho mais próximo baseados em gráficos, uma abordagem mais recente que mostra resultados promissores.
Mesmo assim, há muito que ainda precisamos aprender.
“Aprendemos muito com nossos clientes”, disse Chandrasekaran. “Essa tem sido uma das nossas qualidades definidoras. E a taxa de inovação que temos visto no espaço da IA generativa, francamente, pela minha experiência, lembra-me o boom das pontocom, como no final dos anos 90. O novo mundo de possibilidades da Internet é infinito… e por isso nosso objetivo é permanecer humilde, ágil, ouvir nossos clientes e continuar inovando à medida que eles nos pedem para fazer mais.”
YOUTUBE.COM/THENEWSTACK
A tecnologia avança rápido, não perca um episódio. Inscreva-se em nosso canal no YouTube para transmitir todos os nossos podcasts, entrevistas, demonstrações e muito mais.
SE INSCREVER
Alex Williams é o fundador e editor da The New Stack. Ele é um jornalista de tecnologia de longa data que trabalhou no TechCrunch, SiliconAngle e no que hoje é conhecido como ReadWrite. Alex é jornalista desde o final dos anos 1980, começando no…
Este site utiliza cookies para melhorar sua experiência de navegação. Ao continuar, você concorda com o uso de cookies. Para mais informações, consulte nossa Política de Privacidade.
Funcional
Sempre ativo
O armazenamento ou acesso técnico é estritamente necessário para a finalidade legítima de permitir a utilização de um serviço específico explicitamente solicitado pelo assinante ou utilizador, ou com a finalidade exclusiva de efetuar a transmissão de uma comunicação através de uma rede de comunicações eletrónicas.
Preferências
O armazenamento ou acesso técnico é necessário para o propósito legítimo de armazenar preferências que não são solicitadas pelo assinante ou usuário.
Estatísticas
O armazenamento ou acesso técnico que é usado exclusivamente para fins estatísticos.O armazenamento técnico ou acesso que é usado exclusivamente para fins estatísticos anônimos. Sem uma intimação, conformidade voluntária por parte de seu provedor de serviços de Internet ou registros adicionais de terceiros, as informações armazenadas ou recuperadas apenas para esse fim geralmente não podem ser usadas para identificá-lo.
Marketing
O armazenamento ou acesso técnico é necessário para criar perfis de usuário para enviar publicidade ou para rastrear o usuário em um site ou em vários sites para fins de marketing semelhantes.