Descompactando o backdoor XZ e suas lições para código aberto
5 de abril de 2024Exclusivo: a startup de governança de dados Euno emerge da furtividade para gerenciar a lógica de negócios em escala
5 de abril de 2024Junte-se a nós em Atlanta no dia 10 de abril e explore o cenário da força de trabalho de segurança. Exploraremos a visão, os benefícios e os casos de uso da IA para equipes de segurança. Solicite um convite aqui.
Databricks, uma empresa de software empresarial em rápido crescimento, anunciou hoje o lançamento do DBRX, um novo modelo de inteligência artificial de código aberto que a empresa afirma estabelecer um novo padrão para eficiência e desempenho de IA de código aberto.
O modelo, que contém 132 bilhões de parâmetros, supera as principais alternativas de código aberto, como Llama 2-70B e Mixtral, nos principais benchmarks que medem a compreensão da linguagem, a capacidade de programação e as habilidades matemáticas.
Embora não corresponda ao poder bruto do GPT-4 da OpenAI, os executivos da empresa apresentaram o DBRX como uma alternativa significativamente mais capaz ao GPT-3.5 por uma pequena fração do custo.
“Estamos entusiasmados em compartilhar o DBRX com o mundo e impulsionar a indústria em direção a uma IA de código aberto mais poderosa e eficiente”, disse Ali Ghodsi, CEO da Databricks, em um evento para a imprensa na segunda-feira. “Embora modelos básicos como o GPT-4 sejam ótimas ferramentas de uso geral, o negócio da Databricks está construindo modelos personalizados para cada cliente que entende profundamente seus dados proprietários. DBRX mostra que podemos cumprir isso.”
Evento VB
O AI Impact Tour – Atlanta
Solicitar um convite
Arquitetura inovadora de “mistura de especialistas”
Uma inovação importante, de acordo com os pesquisadores da Databricks por trás do DBRX, é a arquitetura de “mistura de especialistas” do modelo. Ao contrário dos modelos concorrentes que utilizam todos os seus parâmetros para gerar cada palavra, o DBRX contém 16 submodelos especializados e seleciona dinamicamente os quatro mais relevantes para cada token. Isto permite alto desempenho com apenas 36 bilhões de parâmetros ativos a qualquer momento, permitindo uma operação mais rápida e barata.
A equipe Mosaic, uma unidade de pesquisa adquirida pela Databricks no ano passado, desenvolveu esta abordagem com base em seu trabalho anterior no Mega-MoE. “A equipe da Mosaic melhorou muito ao longo dos anos para treinar a IA básica com mais eficiência”, disse Ghodsi. “Podemos construir esses modelos de IA realmente bons rapidamente – o DBRX levou cerca de dois meses e custou cerca de US$ 10 milhões.”
Promovendo a estratégia de IA empresarial da Databricks
Ao abrir o código-fonte do DBRX, a Databricks pretende se estabelecer como líder em pesquisas de ponta em IA e impulsionar uma adoção mais ampla de sua nova arquitetura. No entanto, o lançamento também apoia o negócio principal da empresa de construir e hospedar modelos de IA personalizados treinados em conjuntos de dados privados dos clientes.
Muitos clientes do Databricks hoje contam com modelos como GPT-3.5 da OpenAI e de outros fornecedores. Mas hospedar dados corporativos confidenciais com terceiros levanta preocupações de segurança e conformidade. “Nossos clientes confiam em nós para lidar com dados regulamentados em jurisdições internacionais”, disse Ghodsi. “Eles já têm seus dados no Databricks. Com os recursos de modelo personalizado do DBRX e do Mosaic, eles podem obter os benefícios da IA avançada e, ao mesmo tempo, manter os dados seguros.”
Afirmando uma reivindicação em meio à crescente concorrência
O lançamento ocorre no momento em que a Databricks enfrenta uma concorrência crescente em seus principais negócios de dados e plataformas de IA. Snowflake, a gigante do armazenamento de dados, lançou recentemente um serviço nativo de IA Cortex que duplica algumas funcionalidades do Databricks. Enquanto isso, os provedores de nuvem tradicionais, como Amazon, Microsoft e Google, estão correndo para adicionar recursos generativos de IA em suas pilhas.
Mas ao reivindicar pesquisas de código aberto de última geração com o DBRX, a Databricks espera se posicionar como líder em IA e atrair talentos em ciência de dados. A medida também capitaliza a crescente resistência aos modelos de IA comercializados por grandes empresas de tecnologia, que são vistos por alguns como “caixas pretas”.
No entanto, o verdadeiro teste do impacto do DBRX estará na sua adoção e no valor que ele cria para os clientes da Databricks. À medida que as empresas procuram cada vez mais aproveitar o poder da IA, mantendo ao mesmo tempo o controlo sobre os seus dados proprietários, a Databricks aposta que a sua combinação única de investigação de ponta e plataforma de nível empresarial irá diferenciá-la.
Com o DBRX, a empresa lançou o desafio, desafiando tanto grandes rivais de tecnologia quanto de código aberto a igualar sua inovação. As guerras de IA estão esquentando e a Databricks está deixando claro que pretende ser um player importante.