introduction Ă Kafka Streams et ksqldb
🧩 Partie 1 – Vision simpliste
Qu’est-ce qu’un flux de données (data stream) ?
Imagine que tu regardes les messages WhatsApp qui arrivent dans une conversation de groupe. Tu ne les lis pas tous d’un coup à la fin de la journée, tu les vois en temps réel, un par un, dès qu’ils arrivent.
Un flux de données, c’est pareil : ce sont des événements qui arrivent continuellement, comme :
Une commande passée sur Amazon
Une température mesurée par un capteur
Une position GPS envoyée par une voiture
đź’ˇ Que fait Kafka Streams ?
Kafka Streams, c’est un programme qui peut lire ces flux en direct, les transformer, les filtrer, ou les compter, et envoyer les résultats ailleurs.
Il agit comme un robot intelligent qui regarde passer les événements et dit :
"Tiens voici 3 commandes en une minute ! Je compte et j’envoie le total."
💬 Et ksqlDB, c’est quoi ?
ksqlDB, c’est comme du SQL (le langage des bases de données), mais pour les flux de données en direct. Au lieu d’écrire du code, tu écris des requêtes comme :
SELECT ville, COUNT(*) FROM commandes
WINDOW TUMBLING (SIZE 1 MINUTE)
GROUP BY ville
EMIT CHANGES;➡️ Et ça te donne un tableau en direct, qui se met à jour toutes les minutes !
📦 Résumé imageable :
| Élément | Métaphore | Rôle |
|---|---|---|
| Kafka | Tapis roulant | Transporte les messages |
| Kafka Streams | Ouvrier du tapis | Lit, transforme, compte |
| ksqlDB | Tableau Excel en direct | Affiche ce qui se passe, en temps réel |