![Featued image for: IBM Purchases HashiCorp for Multicloud IT Automation](https://optimuscloud.com.br/wp-content/uploads/2024/04/1714056244_IBM-compra-HashiCorp-para-automacao-de-TI-multicloud-150x150.jpg)
IBM compra HashiCorp para automação de TI multicloud
25 de abril de 2024![Prevenindo o aumento do escopo: guia para gerenciar equipes terceirizadas](https://optimuscloud.com.br/wp-content/uploads/2024/04/1714062125_Prevenindo-o-aumento-do-escopo-guia-para-gerenciar-equipes-terceirizadas-150x150.jpg)
Prevenindo o aumento do escopo: guia para gerenciar equipes terceirizadas
25 de abril de 2024Se você está lendo isto, há quase 100% de probabilidade de você ter experimentado um aplicativo de IA e estar trabalhando em um emprego onde já experimentou aplicativos de IA. Do GitHub Copilot ao Microsoft Office Copilot, ao ChatGPT e outros, a IA mudou na velocidade da luz de “Chegaremos lá algum dia” para “Qual é a sua estratégia de IA?”
Como resultado, as organizações estão adotando rapidamente a IA – criando experiências aprimoradas para o usuário final, custos operacionais reduzidos e vantagens competitivas. Estão surgindo novas classes de aplicativos, construídas em torno de processos e fluxos de trabalho de IA. Como a maioria dos novos aplicativos e serviços, os serviços de IA, como os oferecidos pela OpenAI ou por vários provedores de nuvem, são entregues e consumidos via API.
Os gateways de IA são sistemas desenvolvidos especificamente para gerenciar, proteger e observar o fluxo crescente do tráfego de IA e a demanda de aplicativos. Como tal, estão rapidamente se tornando uma importante categoria de produtos. Então, o que é um gateway de IA? E você ainda precisa de um?
O que é um gateway de IA: uma definição rápida
Um gateway de IA é um dispositivo ou solução especializada projetada para gerenciar e agilizar as interações entre aplicativos e modelos de IA, especialmente no contexto de grandes modelos de linguagem (LLMs) e outros serviços de IA. O gateway atua como um ponto central de controle para o tráfego de IA, fornecendo uma interface unificada para aplicativos acessarem vários back-ends e modelos de IA. Um gateway de IA também permite que as equipes de operações e segurança gerenciem áreas críticas como segurança, governança, observabilidade e gerenciamento de custos.
A maioria dos gateways de IA cobre os seguintes conjuntos de funcionalidades:
Segurança e Conformidade
A segurança da IA é fundamental e está em jogo. Os aplicativos de IA podem ser usados para processar dados de clientes ou outras formas de informações de identificação pessoal e são frequentemente expostos a dados proprietários valiosos da empresa. Cada vez mais, bots de IA de terceiros tentam treinar dados expostos publicamente sem solicitar autorização.
O gateway lida com autenticação e confiança zero, servindo como gatekeeper para serviços de IA e acesso à API.
Contra estes e outros riscos, os gateways de IA estão a tornar-se uma espécie de novo tipo de firewall. Os gateways de IA gerenciam as credenciais de segurança tanto para consumidores quanto para provedores de serviços de IA.
O gateway lida com autenticação e confiança zero, servindo como gatekeeper para serviços de IA e acesso à API. Ele também fornece uma camada de autorização para garantir que apenas usuários aprovados possam acessar serviços específicos ou que os serviços sejam aprovados para serem consumidos de acordo com políticas definidas. As políticas podem restringir o uso com base na localização geográfica, unidade de negócios, função, fornecedor de infraestrutura ou tipo de infraestrutura.
Para gerenciamento específico de prompts de IA, os gateways de IA podem implementar segurança imediata, validação e geração de modelos. Isso simplifica o gerenciamento imediato ao consolidar recursos em um único plano de controle que pode ser gerenciado sem a necessidade de atualizações em ambientes de desenvolvimento locais ou em diferentes sistemas de modelo ou aplicativos de IA. Isso é essencial para o uso responsável e compatível da IA, pois evita que os desenvolvedores criem integrações de IA em torno de tópicos restritos ou definam o contexto errado nos prompts.
Além disso, os gateways de IA são usados como equivalentes a um firewall ou sistema digital de proteção contra perdas para dados de IA. Um gateway de IA completo pode evitar envenenamento e roubo de modelos e outras ameaças emergentes à segurança cibernética aos sistemas de IA.
Balanceamento de carga e gerenciamento centralizado de consumo
Você pode precisar de um balanceador de carga de IA, mesmo que ainda não tenha um. Os aplicativos de IA podem consumir muitos dados e depender da computação. Não gerenciar o fluxo de aplicativos de IA pode significar que GPUs muito caras ficam ociosas enquanto esperam que uma parte upstream de seu pipeline com poucos recursos conclua um trabalho. Para ofertas voltadas ao consumidor, a latência em aplicativos de IA é fatal – quanto mais você faz alguém esperar por uma resposta do chatbot, maior é a probabilidade de ele ter deslizado para a esquerda ou para a direita.
Depois há a questão do consumo. A maioria das organizações hoje está usando várias ofertas de modelo como serviço de IA. Geralmente, eles são entregues por meio de seu provedor de nuvem ou outro serviço de terceiros. Os gateways de IA fornecem uma plataforma centralizada para gerenciar o consumo de IA entre diferentes equipes e aplicações dentro de uma organização. Esta centralização é crucial para manter o controlo sobre o tráfego de IA e garantir que a IA é utilizada de forma compatível e responsável.
Os gateways de IA fornecem uma plataforma centralizada para gerenciar o consumo de IA em diferentes equipes e aplicações.
Ao oferecer um plano de controle e balanceador de carga unificados, os gateways de IA permitem que as organizações gerenciem todo o consumo de IA e coleta de observabilidade. Na IA, o consumo é diferente porque é medido em tokens e não em transações ou volume de dados.
No entanto, a medição simples de tokens é imprecisa: alguns tipos de consultas requerem mais tokens para executar um trabalho e o número de tokens necessários para o mesmo prompt pode variar ao longo do tempo. Em outras palavras, imagine se seu aplicativo padrão retornasse uma quantidade variável de dados para a mesma solicitação. Isto é fundamental para a nuance da IA – o consumo pode ser mais difícil de prever e controlar.
Simplificando fluxos de trabalho do desenvolvedor
Os desenvolvedores e as equipes de operações de plataforma enfrentam hoje uma variedade estonteante de integrações de IA e APIs para escolher. Os provedores de nuvem podem agilizar o consumo por meio de suas APIs, mas o gateway de IA foi projetado para permitir fácil curadoria de APIs de IA e um único ponto de gerenciamento para integrações.
Os gateways de IA oferecem suporte a vários serviços de IA e fornecem uma interface API única que os desenvolvedores podem usar para acessar qualquer modelo de IA que precisarem. Um endpoint pode permitir que os desenvolvedores acessem os vários modelos oferecidos pelo OpenAI, mas também todos os milhares de modelos e ferramentas de código aberto mais ajustados e hospedados no Hugging Face. Os gateways de IA podem automatizar a integração de equipes que precisam de acesso a serviços de IA.
Sim, a expansão da IA é uma coisa, e você não quer que seus desenvolvedores mexam com isso.
Este endpoint de API uniforme agiliza o fluxo de trabalho de desenvolvimento e acelera o processo de integração. Isso, por sua vez, permite que os desenvolvedores se concentrem na construção de aplicativos de IA, em vez de gerenciar integrações complexas.
Assim como os desenvolvedores desejam uma paleta de estruturas e módulos de código aberto para escolher no desenvolvimento de software, os desenvolvedores de IA desejam cada vez mais uma ampla seleção de modelos e serviços de IA que lhes permita personalizar aplicativos de forma mais rápida e adequada. Sim, a expansão da IA é uma coisa, e você não quer que seus desenvolvedores mexam com isso.
Otimização de Custos, Monitoramento e Observabilidade
Os gateways de IA permitem que as organizações aprendam com o uso de IA para gerenciar e reduzir custos. O gateway pode fornecer insights sobre as cotas consumidas para cada modelo, permitindo a alocação eficiente de recursos e o controle de custos. Essa transparência permite que os usuários gerenciem o uso de recursos de IA de maneira eficaz, garantindo a utilização ideal e evitando desperdícios (como pagar por GPUs ociosas).
Gateways de IA mais avançados podem direcionar os tipos certos de trabalhos de computação de IA para a infraestrutura mais econômica, aplicando contexto a cada trabalho. Por exemplo, os trabalhos mais críticos que exigem escala e rendimento massivos podem ser direcionados para clusters de GPU de maior capacidade, enquanto trabalhos de inferência mais simples podem ser direcionados para GPUs mais próximas do usuário final, mas menos poderosas.
O outro lado da moeda da otimização é a observabilidade e o monitoramento. Os gateways de IA gerenciam a observabilidade da IA em um só lugar e podem até enviar dados para coletores de log/métricas de terceiros. Isso torna mais fácil capturar todo o tráfego de IA gerado para garantir ainda mais a conformidade dos dados e identificar quaisquer anomalias no uso. Parte disso se sobrepõe à segurança, mas grande parte é específica da IA porque os padrões de consumo da IA são diferentes e as anomalias que sinalizam problemas também são diferentes.
Por exemplo, a inferência de IA em um aplicativo em produção pode parecer semelhante ao tráfego normal de aplicativos, mas o treinamento e o ajuste do modelo de IA pareceriam extremamente intermitentes, com fluxos massivos e trabalhos de computação dependentes que exigem monitoramento rigoroso para garantir que as GPUs não sejam desperdiçadas esperando de forma ineficiente. pipeline de dados.
Trazendo ordem ao oeste selvagem da IA
Para tornar as coisas um pouco mais confusas, muitos produtos pontuais concentram-se em um ou dois dos problemas que gateways de IA mais abrangentes procuram resolver. Alguns fornecedores também estão envolvendo gateways de API com algumas funcionalidades específicas de IA e os denominando gateways de IA.
Existem projetos de código aberto que oferecem alguns dos recursos discutidos acima. Inúmeras plataformas e serviços de operações de aprendizado de máquina criam endpoints de API unificados para consumo de IA por equipes de desenvolvimento, por exemplo.
Grampear vários produtos diferentes para obter todas as funcionalidades acabará se tornando um incômodo intransponível e custará mais caro. Assim como o gerenciamento de APIs se tornou centralizado em gateways de API, o gerenciamento de IA também demonstrará preconceito em relação a gateways de IA abrangentes.
Os melhores fornecerão uma maneira eficaz de domar o “Velho Oeste” da IA para todos que tocam esse novo e poderoso paradigma tecnológico. Os melhores gateways de IA facilitarão o caminho para a adoção da IA pelas empresas e tornarão a implantação desta nova e poderosa tecnologia mais rotineira, segura e econômica em qualquer escala.
A postagem O que é um gateway de IA e você ainda precisa de um? apareceu primeiro em The New Stack.