Apache Flink: retrospectiva de 2023 e vislumbre do futuro

Nylas, criador da ferramenta de desenvolvimento, fala sobre os 4 pilares das APIs modernas

13 de fevereiro de 2024

IBM e Anaconda parceira para incorporar Python em IA empresarial

13 de fevereiro de 2024

Publicado por Douglas S. em 13 de fevereiro de 2024

Categorias

Estatísticas do Projeto: A pulsação de uma comunidade próspera

Os números costumam contar a história, e as estatísticas de Flink não são exceção. A comunidade testemunhou um aumento na vitalidade, com novos committers e membros do PMC juntando-se às fileiras. A jornada de observação das estrelas no GitHub atingiu um grande marco, ultrapassando a marca de 20.000 em abril.

Digno de nota é o anúncio de que o Apache Flink recebeu o SIGMOD Systems Award 2023 por seu impacto significativo, afirmando que “o Apache Flink expandiu enormemente o uso de processamento de dados de fluxo”. (SIGMOD é a maior conferência de pesquisa de banco de dados do mundo.)

O Prêmio SIGMOD Systems serve como destaque, reconhecendo as contribuições da Flink e o trabalho dos mais de 1.400 colaboradores, solidificando seu status como líder na área de processamento de dados.

Fluxo contínuo de novos recursos do Flink

A comunidade Flink tem sido um foco de atividade no último ano, produzindo um fluxo contínuo de lançamentos.

O Flink 1.17, lançado em março, viu a conclusão de 7 FLIPs (Flink Improvement Proposals) e mais de 600 edições. O igualmente impressionante Flink 1.18, lançado em outubro, completou 18 FLIPs e mais de 700 edições.

Juntos, esses dois lançamentos trouxeram muitos novos recursos e melhorias interessantes para a comunidade, incluindo melhorias no recurso de checkpoint incremental do Flink, uma ampla gama de novos recursos e melhorias nas melhorias SQL do Flink (por exemplo, consultas pontuais e consultas em nível de operador). configurabilidade de estado TTL), melhor elasticidade nativa da nuvem, aprimorando o agendador adaptativo do Flink, suporte para Java 17 e muito mais.

A comunidade Flink também entregou quatro versões do Operador Kubernetes (1.4, 1.5, 1.6, 1.7), gerando melhorias significativas, incluindo suporte para escalonamento automático, a capacidade de escalar o pipeline com base na carga de dados recebida e na utilização do fluxo de dados, gerenciamento de reversão mais robusto em caso de cenários de falha, manuseio mais flexível de pontos de salvamento e muito mais.

Além disso, os subprojetos ML 2.2.0 e StateFun 3.3.0 do Flink registraram progresso significativo. A API Table Store foi elevada para seu próprio projeto de nível superior, Apache Paimon, e vários conectores foram extraídos em projetos separados com controle de versão separado.

A ascensão de Flink nas guerras de streaming cria uma competição acirrada no mercado

À medida que a Flink solidifica a sua posição como vencedora nas guerras contínuas, o panorama da indústria está a passar por uma transformação subtil.

Os principais intervenientes reconhecem que o streaming de dados está a tornar-se uma mercadoria e o processamento de fluxos é onde a diferenciação acontecerá.

Como resultado, está a emergir um ecossistema competitivo de entidades que oferecem o Flink como serviço. Essas plataformas gerenciadas – incluindo aquelas oferecidas pela Confluent (que adquiriu a Immerok), Decodable, DeltaStream e Ververica, entre outras – oferecem ajuda às organizações a operacionalizar o Flink para escalabilidade, segurança e experiência do desenvolvedor. É claro que os serviços de nuvem em hiperescala foram rápidos em jogar seu chapéu no ringue: AWS, Microsoft Azure e Google Cloud Platform agora também oferecem serviços Flink.

Crônicas de sucesso e adoção

Os principais eventos do setor são um ótimo lugar para testemunhar a evolução do mercado. A lista de palestrantes no Current 2023 e no Flink Forward 2023 mostra um retrato do sucesso do Flink e da ampla adoção por gigantes da indústria como Alibaba, Apple, Bloomberg, BMW, Cisco, Deliveroo, DoorDash, IBM, Even, LinkedIn, Lyft, NASA, Netflix, Stripe, Uber e Warner Bros. Descoberta. Essas organizações e muitas outras estão se aproximando do microfone, ansiosas para compartilhar como o Flink não é apenas uma ferramenta, mas uma parte integrante das operações comerciais.

O que vem pela frente em 2024

Vamos concluir com uma espiada na bola de cristal, pois tenho certeza de que 2024 terá muitos desenvolvimentos interessantes reservados para Flink. Os eventos previstos que mais me entusiasmam são estes:

FLIP-319: A integração com o suporte do Kafka para a participação adequada do 2PC é uma alta prioridade. Com base no trabalho de Kafka para apoiar transações de commit de duas fases (KIP-939), este FLIP visa melhorar o coletor Flink Kafka em relação a garantias exatamente uma vez (sem mais perda de dados em caso de tempo limite de transação Kafka) e manutenção. (Atualmente, o coletor depende da reflexão Java para ajustar algumas partes do tratamento de transações no cliente Kafka.)
O Flink 2.0 está oficialmente no roteiro. Novos recursos incluirão:
1. Back-end de estado desagregado
2. Remoção de APIs obsoletas: DataSet, Estado Consultável, Opções de Configuração, API REST
3. Java 17 por padrão
4. Compatibilidade de estado para trabalhos SQL
A equipe por trás do Flink CDC (Change Data Capture) propõe movê-lo para a Apache Foundation. Isso tornaria um projeto altamente popular, de terceiros, relacionado ao Flink, parte do projeto Apache Flink propriamente dito, promovendo a colaboração e o crescimento da comunidade.
O Kafka Summit London ’24, com uma faixa dedicada “Current”, mostrará a importância contínua do processamento de stream.

Ansiosa por mais um ano de progresso

Alguns podem dizer que o Flink, depois de ter sido criado há quase uma década, teve um início lento. Mas poucos diriam que Flink está agora atingindo o seu ritmo. 2023 foi repleto de progresso e um inegável impulso.

Com desenvolvimentos emocionantes em torno do Flink, mas também do processamento de fluxo em geral, temos pela frente um ótimo momento para se juntar à comunidade e contribuir com seus talentos especiais para as inovações, colaborações e triunfos que revolucionarão o cenário do processamento de dados.

David Fabritius é um profissional de marketing de TI especializado em treinamento e preparação, gerenciamento de produtos, software empresarial e relações com parceiros. David é gerente sênior de marketing da Decodable, cuja missão é tornar o processamento de fluxo tão fácil que todas as organizações possam com sucesso…

Douglas S.

Comments are closed.

Apache Flink: retrospectiva de 2023 e vislumbre do futuro

Nylas, criador da ferramenta de desenvolvimento, fala sobre os 4 pilares das APIs modernas

IBM e Anaconda parceira para incorporar Python em IA empresarial

Nylas, criador da ferramenta de desenvolvimento, fala sobre os 4 pilares das APIs modernas

IBM e Anaconda parceira para incorporar Python em IA empresarial

Estatísticas do Projeto: A pulsação de uma comunidade próspera

Fluxo contínuo de novos recursos do Flink

A ascensão de Flink nas guerras de streaming cria uma competição acirrada no mercado

Crônicas de sucesso e adoção

O que vem pela frente em 2024

Ansiosa por mais um ano de progresso

Douglas S.

Postagens relacionadas

Usando SPLADE para gerar embeddings esparsos aprendidos

Flow-IPC melhora a comunicação entre processos para desenvolvedores C++

Melhorando a qualidade dos dados: anomalias e monitoramento automatizado