Démonstration d'un pipeline RAG complet : embedding sémantique, retrieval vectoriel et génération augmentée sur une base de connaissances PM.
Pipeline RAG embarqué dans un Cloudflare Worker. Les embeddings sémantiques sont générés par Workers AI (bge-small-en-v1.5) et la similarité cosinus est calculée à l'edge. La base de connaissances couvre 15 documents (PM, PO/Agile, AI Product), découpés en chunks de 300 mots avec overlap de 50.