Testando arquiteturas orientadas a eventos com OpenTelemetry

Gemma: Google assume pequenos modelos abertos Llama 2 e Mistral

21 de fevereiro de 2024

Modelos Pulumi para pilhas GenAI: Pinecone, LangChain First

21 de fevereiro de 2024

Publicado por Douglas S. em 21 de fevereiro de 2024

Categorias

Desafios no teste de fluxos de trabalho orientados a eventos com fila

Adicionar uma fila como Kafka ao seu ambiente envolve configurações complexas com vários corretores, produtores e consumidores. Tentar replicar um ambiente com uma fila para teste envolve uma grande quantidade de aumento operacional, com considerações como segurança, replicação, particionamento e manutenção de uma réplica atualizada. A complexidade aumenta ao tentar consumir mensagens com serviços em diversas linguagens e estruturas, tornando os testes isolados de ponta a ponta uma tarefa exigente.

Observe que para esses vários modelos e no exemplo a seguir, “inquilino” tem um significado específico.

Por “locatário”, queremos dizer um desenvolvedor ou equipe que precisa executar um cenário de teste isoladamente. Se duas equipes estiverem trabalhando juntas e colaborando em uma versão, elas poderão ser um único locatário. Mas geralmente, isso significará uma equipe que deseja testar algumas mudanças sem que essas mudanças afetem mais ninguém.

Estratégias para testar fluxos de trabalho orientados a eventos

Ao usar uma fila grande e complexa com muitos editores e assinantes, dois métodos são a solução mais comum para criar um ambiente de teste. Com infraestrutura isolada, todo o cluster é copiado com todos os serviços, editores e assinantes relacionados para cada locatário. Com tópicos isolados, a fila é configurada para usar um canal especial para editores e assinantes de teste. Ambas as abordagens têm suas desvantagens, incluindo custos de manutenção e configuração, e a precisão final (às vezes duvidosa) desses novos ambientes de teste para produção. Por enquanto, consideraremos uma solução que ofereça uma solução altamente escalável para vários locatários, com um ambiente que se assemelhe muito à produção.

Mensagens isoladas usando uma fila compartilhada

Em vez de replicar componentes que não deveriam ser alterados por um locatário, podemos nos concentrar nas partes do cluster que queremos isolar: as mensagens que passam entre os serviços. Com o isolamento de mensagens, podemos compartilhar todos os recursos necessários e até permitir que nossos serviços em teste se comuniquem com a versão “baseline” de outros serviços.

Isso começa estabelecendo um ambiente de linha de base compartilhado com segurança entre os locatários, usando roteamento dinâmico para solicitações e mensagens, adicionando propagação de contexto via OpenTelemetry. Esta abordagem minimiza a configuração da infraestrutura, as despesas operacionais e os custos, ao mesmo tempo que garante ambientes atualizados através da integração contínua. Também não há aumento para incluir um inquilino de teste adicional.

Implementando testes baseados em isolamento de mensagens

Neste modelo, cada locatário recebe um ID exclusivo, com mapeamentos para versões de serviço específicas. Para a maioria dos serviços, qualquer inquilino espera interagir com uma versão de base, com apenas alguns serviços selecionados sincronizados com uma versão mais recente. Esses serviços modificados podem se comunicar entre si ou com outros serviços no cluster normalmente.

Os IDs de locatário são usados para roteamento em comunicações síncronas (HTTP, gRPC) e assíncronas (enfileiradas). Ou seja, tanto as mensagens de e para serviços individuais quanto as mensagens que entram e saem da fila precisarão de instruções de roteamento especializadas. Um dos métodos para conseguir isso é usar uma malha de serviço.

Há suporte em qualquer sistema de filas para adicionar cabeçalhos arbitrários para afetar o roteamento. No Apache Kafka, os produtores incluem IDs de locatário nos cabeçalhos das mensagens e os consumidores usam esses IDs para processamento seletivo de mensagens. Esta configuração requer a modificação dos consumidores Kafka e o aproveitamento do OpenTelemetry para propagação de contexto. O processo é bastante semelhante ao usar o RabbitMQ, que também pode incorporar cada mensagem com um ID de locatário.

Arquitetura Operacional

A implementação do isolamento de mensagens para testes e experimentação baseados em isolamento de solicitações possui alguns componentes necessários.

OpenTelemetry para propagação de contexto: Use OpenTelemetry para propagação de ID de locatário entre serviços e sua fila, garantindo roteamento de mensagens coerente. Para instrumentar produtores e consumidores do Kafka para propagar o contexto por meio do Kafka, você pode consultar o exemplo concreto fornecido na documentação do OpenTelemetry. Este exemplo mostra como você pode propagar o tenantID dos editores por meio do Kafka para os consumidores. Também há suporte para propagação de contexto para RabbitMQ, e existe suporte semelhante para serviços de enfileiramento em nuvem pública no Google Cloud e AWS.
Consumo seletivo de mensagens: Implemente lógica em consumidores de fila para filtragem de mensagens com base em IDs de locatários, com cada consumidor operando em seu próprio grupo.
Malha de serviço ou outros sistemas de roteamento: Para que os locatários configurem seu cluster para enviar apenas mensagens de teste aos seus sistemas, enquanto roteiam todas as outras solicitações normalmente, configure uma malha de serviço ou seu equivalente para rotear o tráfego com base em cabeçalhos de solicitação.

Neste exemplo, um locatário pode criar novas versões de serviços (B” e C”) e adicioná-los como produtores e consumidores sem interferir no processo de teste de outras equipes.

Uma convenção de nomenclatura simples para esses novos grupos de consumidores seria os grupos de consumidores originais do serviço com “-(nome da sandbox)” anexado.

Fluxos com escopo sem solicitação

Alguma consideração deve ser dada ao implementar este sistema para fluxos que não começam com uma única solicitação. Se, por exemplo, um cron job estiver lendo linhas de uma tabela, processando-as e publicando cada uma delas como uma mensagem em sua fila, você precisará emitir um ID de locatário à medida que cada linha for lida, exigindo que você projete o sistema de acordo com seus objetivos. . Uma vez que haja clareza sobre como as versões de referência e “em teste” dos consumidores particionarão as mensagens originadas do banco de dados, o sistema precisará ser projetado adequadamente.

Conclusão

A abordagem de isolamento de mensagens oferece uma solução escalonável e econômica para testar fluxos de trabalho assíncronos baseados em Kafka. Reduz a necessidade de infraestrutura extensa, mantendo alto isolamento e flexibilidade. Este método, extensível a outras filas de mensagens, é uma escolha estratégica para aplicações assíncronas modernas.

A continuação deste artigo abordará os detalhes da implementação do isolamento de mensagens com um fluxo de trabalho assíncrono usando Signadot.

Para obter mais informações e conselhos detalhados de implementação sobre testes com filas internas, participe da discussão no canal Slack da comunidade da Signadot.

Anirudh Ramanathan é CTO da Signadot, onde se concentra no desenvolvimento nativo da nuvem. Antes disso, ele trabalhou no Google com foco em controladores principais e extensibilidade do Kubernetes. Ele também é committer do projeto Apache Spark com foco em…

Douglas S.

Comments are closed.

Testando arquiteturas orientadas a eventos com OpenTelemetry

Gemma: Google assume pequenos modelos abertos Llama 2 e Mistral

Modelos Pulumi para pilhas GenAI: Pinecone, LangChain First

Gemma: Google assume pequenos modelos abertos Llama 2 e Mistral

Modelos Pulumi para pilhas GenAI: Pinecone, LangChain First

Desafios no teste de fluxos de trabalho orientados a eventos com fila

Estratégias para testar fluxos de trabalho orientados a eventos

Mensagens isoladas usando uma fila compartilhada

Implementando testes baseados em isolamento de mensagens

Arquitetura Operacional

Fluxos com escopo sem solicitação

Conclusão

Douglas S.

Postagens relacionadas

Usando SPLADE para gerar embeddings esparsos aprendidos

Flow-IPC melhora a comunicação entre processos para desenvolvedores C++

Melhorando a qualidade dos dados: anomalias e monitoramento automatizado