RAG Explorer — by Carlin Mankoto

Pipeline RAG embarqué dans un Cloudflare Worker. Les embeddings sémantiques sont générés par Workers AI (bge-small-en-v1.5) et la similarité cosinus est calculée à l'edge. La base de connaissances couvre 15 documents (PM, PO/Agile, AI Product), découpés en chunks de 300 mots avec overlap de 50.

15 documents dans la base

PM RICE MoSCoW OKR Kano HEART North Star JTBD Discovery Roadmap PO / Agile INVEST Story Mapping Sprint Ceremonies Déf. of Done AI RAG & LLM AI Product Strategy

Question PM

Posez une question sur un framework PM

Comment prioriser avec RICE ? Comment utiliser le modèle Kano ? C'est quoi une North Star Metric ? Comment construire mes OKRs trimestriels ? Comment faire un Story Mapping ? Différence entre RAG et fine-tuning ? C'est quoi une Definition of Done ? Comment mesurer l'expérience avec HEART ?

Pipeline RAG — Résultats

Planner — Classification d'intent

Analyse la requête et détermine si le retriever doit s'activer

pm_workflow

Confidence : —

—

Retriever — Chunks sémantiques

Top-3 passages les plus proches par similarité cosinus

Synthesis — Réponse augmentée

Le LLM génère une réponse ancrée dans les chunks récupérés