Como criar um aplicativo GUI Python com PyQt5
5 de junho de 2024Plataformas de aplicativos nativos da nuvem: novas pesquisas mostram lutas e esperança
5 de junho de 2024A nova novidade na infraestrutura de IA é o gateway de IA. Esses sistemas estão emergindo como um buffer crítico, uma camada de segurança e balanceamento de carga entre aplicativos de IA e usuários externos, bem como equipes internas de modelagem de IA. A urgência de gateways de IA é clara.
À medida que grandes modelos de linguagem (LLMs), algoritmos avançados de visão computacional e outras técnicas de aprendizado de máquina se tornam partes integrantes dos aplicativos, os desafios de sua integração e gerenciamento se intensificam. Os gateways de IA fornecem uma solução inovadora para essas complexidades, fornecendo um ponto de controle centralizado para cargas de trabalho de IA.
Para tornar as coisas ainda mais confusas, muitos provedores de gateway de IA não se autodenominam gateways de IA. Eles podem se descrever como um portal de desenvolvedor de IA, firewall de IA, segurança de IA ou balanceamento de carga de IA – todos contendo elementos de gateways de IA.
Não é de surpreender que os gateways de IA sejam frequentemente comparados aos gateways de API. O gerenciamento de APIs é uma parte crítica dos gateways de IA, que quase sempre são projetados para interagir com provedores externos de IA, como grandes nuvens ou OpenAI. (na verdade, algumas empresas que afirmam ter ofertas de gateway de IA são, na verdade, construídas em gateways de API e adicionam apenas alguns plug-ins ajustados para IA).
No entanto, é fundamental compreender as diferenças entre gateways de API e gateways de IA para projetar adequadamente a infraestrutura de aplicativos de IA que possa lidar com os requisitos de design e implantação de aplicativos modernos.
O papel ainda necessário dos gateways de API
Os gateways de API atuam como intermediários entre clientes e serviços de back-end. Eles permitem que desenvolvedores de aplicativos, equipes de segurança e equipes de DevOps ou Platform Ops reduzam as complexidades de gerenciamento e implantação de APIs na frente dos aplicativos. Os gateways de API também atuam como camadas de segurança e balanceamento de carga para proteger as APIs de uma organização e para proteger uma organização contra atores mal-intencionados que procuram explorar APIs externas que a organização consome.
As principais funções dos gateways de API incluem:
- Governança: Definir e aplicar um conjunto de políticas, padrões e processos para gerenciar, monitorar e controlar o uso, desenvolvimento e manutenção de APIs.
- Solicitar roteamento: direcionamento inteligente de solicitações para serviços apropriados, garantindo que os dados cheguem ao modelo de IA correto para processamento.
- Autenticação e autorização: Imposição de controles de acesso rígidos por meio de mecanismos como chaves de API, OAuth e JSON Web Tokens (JWTs).
- Melhoria de performance: Otimizando tempos de resposta e uso de recursos por meio de limitação de taxa (evitando o uso excessivo) e armazenamento em cache (armazenando respostas usadas com frequência).
- Monitoramento e registro: Oferece insights detalhados sobre o uso da API, taxas de erros e integridade geral do sistema, que são cruciais para solução de problemas e otimização.
- Monetização: Fornecer controles de monetização e gerenciamento de produtos e serviços baseados em API e determinar quem deve ser cobrado e quanto pelo consumo de produtos e recursos de produtos entregues via API.
Sistemas de IA precisam de gateways especializados
A maioria das organizações hoje consome resultados de IA por meio de uma API de terceiros, seja da OpenAI, Hugging Face ou de um dos hiperescaladores de nuvem. As empresas que realmente criam, ajustam e hospedam seus próprios modelos também os consomem por meio de APIs internas. A função fundamental do gateway de IA é facilitar que desenvolvedores de aplicativos, engenheiros de dados de IA e equipes operacionais acessem e conectem rapidamente APIs de IA a seus aplicativos. Isso funciona de maneira semelhante aos gateways de API.
Dito isto, existem diferenças críticas entre os gateways de API e de IA. Por exemplo, os requisitos computacionais das aplicações de IA são muito diferentes dos requisitos computacionais das aplicações tradicionais. É necessário hardware diferente. Treinar modelos de IA, ajustar modelos de IA, adicionar dados especializados adicionais a eles e consultar modelos de IA, cada um pode ter um requisito diferente de desempenho, latência ou largura de banda.
O paralelismo inerente ao aprendizado profundo ou aos requisitos de inferência de resposta em tempo real pode exigir diferentes maneiras de distribuir as cargas de trabalho de IA. Medir quanto um sistema de IA está consumindo também pode exigir uma compreensão especializada de tokens e da eficiência do modelo.
Espera-se também que os gateways de IA monitorem os prompts de entrada em busca de sinais de abuso, como injeção imediata ou roubo de modelo. Resumindo, embora os gateways de API sejam indispensáveis para aplicações tradicionais, eles podem ser insuficientes ao lidar com padrões e requisitos de tráfego específicos de IA, como:
- Otimização de custos: O uso do modelo de IA pode gerar despesas significativas. Os gateways de IA fornecem métricas detalhadas e ferramentas de rastreamento de custos, permitindo decisões informadas de gerenciamento de custos.
- Diversidade de modelos: Os aplicativos de IA geralmente usam vários modelos de diferentes fornecedores, cada um com sua própria interface e protocolos. Os gateways de IA oferecem um ponto de interação unificado, simplificando o desenvolvimento.
- Versionamento e implantação de modelo: Os modelos de IA evoluem rapidamente. Os gateways de IA simplificam atualizações, reversões e testes A/B de diferentes versões de modelos.
- Considerações de segurança: Os modelos de IA, devido à sua natureza potencialmente sensível, exigem protocolos de segurança especializados. Os gateways de IA suportam autorização refinada, validação de entrada e criptografia adaptada às cargas de trabalho de IA.
- Observabilidade: O monitoramento de métricas padrão da API é insuficiente para IA. Os gateways de IA rastreiam métricas específicas do modelo, como tempo de inferência, detecção de viés, uso de token e desvio de conceito, fornecendo os insights necessários para manutenção proativa.
- Balanceamento de carga: O balanceamento de carga de IA é mais complicado do que o balanceamento de carga tradicional porque a IA tem uma variedade maior de trabalhos de computação — inferência e treinamento, internos e externos, com muitas permutações. As GPUs usadas para computação de IA são extremamente caras, portanto, é fundamental garantir que os pipelines de programação paralela estejam bem balanceados e sincronizados.
Perguntas a serem feitas antes de comprar ou implantar um AI Gateway
Abandonar uma nova tecnologia em detrimento de outra nova tecnologia sempre apresenta riscos e desafios. Algumas organizações simplesmente optaram por evitar o problema usando apenas um único serviço de IA e gerenciando essa API de serviço único. No entanto, fazer isso arrisca o aprisionamento da IA e também prejudica as equipes que podem querer funcionalidades personalizadas em seus serviços de IA. Antes de decidir testar um gateway de IA, considere o seguinte:
- Suporte abrangente ao modelo: O gateway lida facilmente com diversos modelos de IA de vários fornecedores, tanto internos quanto externos?
- Segurança e governança avançadas: Quão robustos são os protocolos de segurança projetados especificamente para modelos de IA? Ele pode impor controles de acesso refinados e detectar possíveis abusos ou uso indevido?
- Gestão e otimização de custos: O gateway de IA fornece ferramentas granulares de uso e rastreamento de custos, bem como técnicas de otimização para controlar despesas?
- Observabilidade aprofundada: A plataforma rastreia métricas críticas de integridade do modelo de IA, como tempo de inferência, precisão, desvio e tendência para permitir o gerenciamento proativo?
- Facilidade de integração e escalabilidade: O gateway foi projetado para se integrar perfeitamente aos seus fluxos de trabalho de desenvolvimento e implantação existentes? Ele pode ser dimensionado para lidar com cargas de trabalho crescentes de IA?
API e gateways de IA coexistirão
Para ser claro, os gateways de IA são participantes relativamente novos e provavelmente evoluirão consideravelmente no curto prazo. Eles também não são pó mágico de IA que deve ser aplicado em todas as instâncias. Alguns aplicativos de IA funcionarão perfeitamente bem com gateways de API tradicionais.
Por exemplo, se um aplicativo consome muito da API OpenAI e não está envolvido em ajustes extensivos ou treinamento adicional, seu aplicativo poderá ter requisitos muito semelhantes aos dos aplicativos tradicionais. Nesse caso, pagar um pouco mais por um gateway de IA e adicionar complexidade operacional adicional pode ser um exagero.
Na realidade, os padrões de implementação para aplicações de IA podem muito bem conter gateways de API e de IA porque os dois casos de uso muitas vezes coexistirão e até se complementarão.
Já estamos vendo a funcionalidade de gateway de IA adicionada aos produtos de gateway de API existentes. Também vemos equipes de IA implantando proxies reversos e controladores de entrada NGINX para fornecer governança, balanceamento de carga e entrega de aplicativos de IA (treinamento e inferência).
No futuro, os gateways de IA virão em vários formatos e tamanhos, dentro dos produtos de gateway de API existentes e como kits independentes. Na realidade, o gateway de IA é a evolução lógica do gateway de API para a nova era da IA, assim como os gateways de API evoluíram a partir de proxies reversos.
Saber a diferença entre esses dois tipos de gateways esclarece por que ambos são necessários e como devem ser usados, mesmo que vivam lado a lado como aplicativos ou microsserviços relacionados ou dependentes.
O post Gateways de IA vs. Gateways de API: Qual é a diferença? apareceu primeiro em The New Stack.