Endor Labs levanta US$ 70 milhões para facilitar a segurança de aplicativos e otimizar a produtividade do desenvolvedor
16 de janeiro de 2024Esta semana em dados: fossos de dados, IA generativa e como superar seus pares
16 de janeiro de 2024Os bancos de dados vetoriais, um tipo relativamente novo de banco de dados que pode armazenar e consultar dados não estruturados, como imagens, texto e vídeo, estão ganhando popularidade entre desenvolvedores e empresas que desejam construir aplicativos generativos de IA, como chatbots, sistemas de recomendação e criação de conteúdo.
Um dos principais fornecedores de tecnologia de banco de dados vetorial é a Pinecone, uma startup fundada em 2019 que arrecadou US$ 138 milhões e está avaliada em US$ 750 milhões. A empresa disse na quinta-feira que tem “muito mais de 100.000 usuários gratuitos e mais de 4.000 clientes pagantes”, refletindo uma explosão de adoção por desenvolvedores de pequenas empresas, bem como por empresas que, segundo Pinecone, estão experimentando loucamente novos aplicativos.
Por outro lado, a empresa disse que em dezembro tinha menos de milhares de usuários gratuitos e menos de 300 clientes pagantes.
A Pinecone realizou uma conferência de usuários na quinta-feira em São Francisco, onde apresentou algumas de suas histórias de sucesso e anunciou uma parceria com o Microsoft Azure para acelerar aplicativos generativos de IA para clientes do Azure.
>>Siga toda a nossa cobertura do VentureBeat Transform 2023<<
Bob Wiederhold, presidente e COO da Pinecone, disse em sua palestra que a IA generativa é uma nova plataforma que eclipsou a plataforma da Internet e que os bancos de dados vetoriais são uma parte fundamental da solução para habilitá-la. Ele disse que a plataforma generativa de IA será ainda maior que a Internet e “terá os mesmos e provavelmente impactos ainda maiores no mundo”.
Bancos de dados vetoriais: um tipo distinto de banco de dados para a era da IA generativa
Wiederhold explicou que os bancos de dados vetoriais permitem que os desenvolvedores acessem informações específicas de domínio que não estão disponíveis na Internet ou em bancos de dados tradicionais, e atualizem-nas em tempo real. Dessa forma, eles podem fornecer melhor contexto e precisão para modelos generativos de IA, como ChatGPT ou GPT-4, que geralmente são treinados em dados desatualizados ou incompletos extraídos da web.
Os bancos de dados vetoriais permitem que você faça pesquisas semânticas, que é uma forma de converter qualquer tipo de dados em vetores que permitem fazer pesquisas por “vizinho mais próximo”. Você pode usar essas informações para enriquecer a janela de contexto dos prompts. Dessa forma, “você terá muito menos alucinações e permitirá que essas fantásticas tecnologias de chatbot respondam às suas perguntas corretamente, com mais frequência”, disse Wiederhold.
Os comentários de Wiederhold vieram depois de ele falar na quarta-feira no VB Transform, onde explicou aos executivos corporativos como a IA generativa está mudando a natureza do banco de dados e por que pelo menos 30 concorrentes de bancos de dados vetoriais surgiram para atender o mercado. Veja sua entrevista abaixo.
Wiederhold disse que grandes modelos de linguagem (LLMs) e bancos de dados vetoriais são as duas tecnologias principais para IA generativa.
Sempre que surgem novos tipos de dados e padrões de acesso, assumindo que o mercado é suficientemente grande, forma-se um novo subconjunto do mercado de bases de dados, disse ele. Isso aconteceu com bancos de dados relacionais e bancos de dados não SQL, e está acontecendo com bancos de dados vetoriais, disse ele. Os vetores são uma forma muito diferente de representar dados, e a busca pelo vizinho mais próximo é uma forma muito diferente de acessar os dados, disse ele.
Ele explicou que os bancos de dados vetoriais têm uma maneira mais eficiente de particionar dados com base nesse novo paradigma e, portanto, estão preenchendo uma lacuna que outros bancos de dados, como bancos de dados relacionais e sem SQL, não conseguem preencher.
Ele acrescentou que a Pinecone construiu sua tecnologia do zero, sem comprometer o desempenho, a escalabilidade ou o custo. Ele disse que somente construindo do zero você poderá ter a menor latência, as maiores velocidades de ingestão e o menor custo de implementação de casos de uso.
Ele também disse que os provedores de banco de dados vencedores serão aqueles que construíram os melhores serviços gerenciados para a nuvem, e que a Pinecone também entregou lá.
No entanto, Wiederhold também reconheceu na quinta-feira que o mercado de IA generativa está passando por um ciclo de hype e que em breve atingirá um “vale da realidade” à medida que os desenvolvedores deixarem de criar protótipos de aplicativos que não têm capacidade de entrar em produção. Ele disse que isso é bom para a indústria, pois separará os aplicativos reais e impactantes, prontos para produção, da “fluff” de aplicativos prototipados que atualmente constituem a maior parte da experimentação.
Sinais de arrefecimento para IA generativa e perspectivas para bancos de dados vetoriais
Os sinais de redução gradual, disse ele, incluem um declínio em junho no número relatado de usuários do ChatGPT, mas também as próprias tendências de adoção de usuários da Pinecone, que mostraram uma interrupção de uma recuperação “incrível” de dezembro a abril. “Em maio e junho, a situação voltou a ser algo mais razoável”, disse ele.
Wiederhold respondeu a perguntas no VB Transform sobre o tamanho do mercado de bancos de dados vetoriais. Ele disse que é um mercado muito grande ou mesmo enorme, mas que ainda não está claro se será um mercado de US$ 10 bilhões ou de US$ 100 bilhões. Ele disse que essa questão será resolvida à medida que as melhores práticas forem definidas nos próximos dois ou três anos.
Ele disse que há muita experimentação em andamento com diferentes maneiras de usar tecnologias generativas de IA, e que uma grande questão surgiu de uma tendência de janelas de contexto maiores para prompts de LLM. Se os desenvolvedores pudessem colocar mais dados, talvez até mesmo todo o banco de dados, diretamente em uma janela de contexto, então um banco de dados vetorial não seria necessário para pesquisar dados.
Mas ele disse que é improvável que isso aconteça. Ele fez uma analogia com os humanos que, quando inundados de informações, não conseguem encontrar respostas melhores. A informação é mais útil quando é razoavelmente pequena para que possa ser internalizada, disse ele. “E acho que o mesmo acontece com a janela de contexto em termos de colocar grandes quantidades de informações nela.” Ele citou um estudo da Universidade de Stanford divulgado esta semana que analisou a tecnologia existente de chatbot e descobriu que quantidades menores de informações na janela de contexto produziam melhores resultados. (Atualização: VentureBeat solicitou uma referência específica ao artigo e a Pinecone a forneceu aqui).
Além disso, ele disse que algumas grandes empresas estão experimentando treinar seus próprios modelos de base, e outras estão ajustando os modelos de base existentes, e ambas as abordagens podem contornar a necessidade de recorrer a bancos de dados de vetores. Mas ambas as abordagens exigem muita experiência e são caras. “Há um número limitado de empresas que serão capazes de assumir isso.”
Separadamente, no VB Transform na quarta-feira, esta questão sobre a construção de modelos ou simplesmente pegar carona no GPT-4 com bancos de dados vetoriais foi uma questão chave para os executivos durante os dois dias de sessões. Naveen Rao, CEO da MosaicML, que ajuda empresas a construir seus próprios grandes modelos de linguagem, também falou no evento e reconheceu que um número limitado de empresas tem escala para pagar US$ 200.000 pela construção de modelos e também tem experiência em dados, preparação e outros infra-estrutura necessária para alavancar esses modelos. Ele disse que sua empresa tem 50 clientes, mas que precisou ser seletiva para atingir esse número. Esse número aumentará nos próximos dois ou três anos, à medida que essas empresas limparem e organizarem seus dados, disse ele. Essa promessa, em parte, é o motivo pelo qual a Databricks anunciou na semana passada que irá adquirir a MosaicML por US$ 1,3 bilhão.
A missão da VentureBeat é ser uma praça digital para os tomadores de decisões técnicas obterem conhecimento sobre tecnologia empresarial transformadora e realizarem transações. Conheça nossos Briefings.