introduction Ă  Kafka Streams et ksqldb

🧩 Partie 1 – Vision simpliste

Qu’est-ce qu’un flux de données (data stream) ?

Imagine que tu regardes les messages WhatsApp qui arrivent dans une conversation de groupe. Tu ne les lis pas tous d’un coup à la fin de la journée, tu les vois en temps réel, un par un, dès qu’ils arrivent.

Un flux de données, c’est pareil : ce sont des événements qui arrivent continuellement, comme :

Une commande passée sur Amazon

Une température mesurée par un capteur

Une position GPS envoyée par une voiture

đź’ˇ Que fait Kafka Streams ?

Kafka Streams, c’est un programme qui peut lire ces flux en direct, les transformer, les filtrer, ou les compter, et envoyer les résultats ailleurs.

Il agit comme un robot intelligent qui regarde passer les événements et dit :

"Tiens voici 3 commandes en une minute ! Je compte et j’envoie le total."

💬 Et ksqlDB, c’est quoi ?

ksqlDB, c’est comme du SQL (le langage des bases de données), mais pour les flux de données en direct. Au lieu d’écrire du code, tu écris des requêtes comme :

SELECT ville, COUNT(*) FROM commandes
WINDOW TUMBLING (SIZE 1 MINUTE)
GROUP BY ville
EMIT CHANGES;

➡️ Et ça te donne un tableau en direct, qui se met à jour toutes les minutes !

📦 Résumé imageable :

ÉlémentMétaphoreRôle
KafkaTapis roulantTransporte les messages
Kafka StreamsOuvrier du tapisLit, transforme, compte
ksqlDBTableau Excel en directAffiche ce qui se passe, en temps réel