Postgres agora também é um banco de dados vetorial

BASIC aos 60: Como esta linguagem mais simples impactou a programação

9 de maio de 2024

Capacidade de composição para Jamstack: detalhamento dos termos de front-end

10 de maio de 2024

Publicado por Douglas S. em 10 de maio de 2024

Categorias

Data Science

Uma mensagem para o desenvolvedor ‘Fantástico’

Chandrasekaran deu crédito a Andrew Kane, a quem chamou de “este desenvolvedor fantástico” para PG Vector: “Ele está nisso há alguns anos. E fomos o primeiro fornecedor de nuvem a fazer parceria com ele e oferecê-lo. Sempre foi de código aberto. Mas oferecemos isso em Aurora e RDS no início do ano passado.”

PG Vector originalmente tinha um esquema de indexação chamado IVFFlat. É baseado em listas de links e funciona bem para construir índices rapidamente, disse Chandrasekaran.

Mas o rendimento da consulta não funciona tão bem quando se busca taxas mais altas de recall, como a porcentagem dos resultados que você espera e acaba obtendo, disse Chandrasekaran.

Com Kane, a AWS começou a trabalhar no Hierarchical Navigable Small World (HNSW), que oferece uma abordagem baseada em gráficos em comparação com o IVFFlat, que a PG Vector usou. De acordo com a página PG Vector GitHub, HNSW tem melhor desempenho de consulta do que IVFFlat em termos de compensação de recuperação de velocidade, mas tempos de construção mais lentos e usa mais memória.

“Uma grande parte do trabalho tem sido fazer com que o HNSW tenha o mesmo desempenho que o IVFFlat”, disse Chandrasekaran. “É um espaço em rápida evolução. Portanto, há muita coisa que não sabemos. E, portanto, estamos apenas atentos ao que os clientes estão pedindo.

“É uma questão de escala e desempenho, as coisas comuns que você pergunta e procura em um banco de dados. Mas no contexto dos vetores. a abordagem baseada em gráficos é o que você vê que os clientes gostam.”

As vantagens dos gráficos

Os gráficos tornam mais fácil para os clientes procurarem os vizinhos mais próximos, um pilar da IA generativa. A ideia é encontrar pontos semelhantes a uma consulta, mapear os pontos e calcular as distâncias, o que os tecnólogos dizem ser uma abordagem mais fácil do que algoritmos complexos de aprendizado de máquina.

Adicionar gráficos cria a oportunidade para algoritmos de vizinho mais próximo baseados em gráficos, uma abordagem mais recente que mostra resultados promissores.

Mesmo assim, há muito que ainda precisamos aprender.

“Aprendemos muito com nossos clientes”, disse Chandrasekaran. “Essa tem sido uma das nossas qualidades definidoras. E a taxa de inovação que temos visto no espaço da IA generativa, francamente, pela minha experiência, lembra-me o boom das pontocom, como no final dos anos 90. O novo mundo de possibilidades da Internet é infinito… e por isso nosso objetivo é permanecer humilde, ágil, ouvir nossos clientes e continuar inovando à medida que eles nos pedem para fazer mais.”

Alex Williams é o fundador e editor da The New Stack. Ele é um jornalista de tecnologia de longa data que trabalhou no TechCrunch, SiliconAngle e no que hoje é conhecido como ReadWrite. Alex é jornalista desde o final dos anos 1980, começando no…