AI Lab — RAG Glassbox & Diff Explorer

Le premier outil vous montre comment une réponse d’IA s’appuie vraiment sur votre PDF, étape par étape. Le second compare votre texte ou prompt avec une version améliorée par l’IA, et vous laisse tester les deux. C’est pensé pour expliquer à des collègues / apprenants ce qui se passe “sous le capot”.

Route API :
Par défaut, on passe par votre fonction Vercel /api/llm (clé côté serveur). Si vous saisissez une clé perso, l’appel est fait avec votre clé (jamais stockée).
1) RAG Glassbox = montrer le pipeline “je pose une question sur un PDF → l’IA répond en se basant sur des passages précis”.
2) Diff Explorer = montrer “ce que change une bonne consigne / un bon prompt” et si ça donne vraiment une meilleure sortie.
1) RAG Glassbox — “Explique-moi ta réponse”
2) Code & Prompt Diff Explorer

Document & Question

RAG = Retrieval Augmented Generation : avant de faire répondre l’IA, on va d’abord récupérer les bons morceaux du document. Ici, on vous montre ces morceaux.

📄
PDF
✂️
Découpage
🤖
Réponse
Le système lit le PDF, le découpe, trouve les passages pertinents, et les envoie à l'IA.

Timeline détaillée (RAG)

C’est le “film” de ce que fait l’outil : si c’est lent, vous saurez où.

Passages sélectionnés

Ce sont les morceaux du PDF que l’outil juge les plus pertinents pour votre question. Chaque bloc a un score : plus il est haut, plus c’est supposé être utile.


Infos (comment lire)

Chunks retenus : liste des blocs envoyés au modèle.
Jauge : estimation très simple “est-ce que la réponse réutilise bien le vocabulaire des blocs ?”.
Pas scientifique : c’est une aide visuelle pour expliquer le principe d’“ancrage” dans le document.

Réponse du modèle

Le modèle doit répondre uniquement avec les sources envoyées. Les références [1], [2] renvoient aux passages du panneau gauche.

Code & Prompt Diff Explorer (avec test réel)

Objectif : montrer que “écrire mieux la demande” peut produire une meilleure sortie. Étapes : (1) vous collez votre prompt, (2) l’IA le réécrit, (3) on teste les 2 sur le même modèle et on affiche les sorties côte à côte.

1. Prompt / texte d’origine

Mettez ici la version “comme l’utilisateur l’aurait écrite”.

2. Ce que vous voulez en mieux

Prompt amélioré (IA)

Vous pouvez retoucher cette version avant de la tester.

Diff texte (ce qui a changé)

vert = ajouté, rouge barré = enlevé. Ça sert à expliquer “ce que l’IA a rajouté”.

3. Tester les deux sur le même modèle

On envoie deux requêtes à votre API : l’une avec le prompt original, l’autre avec le prompt amélioré. Avec gpt-5 ça peut prendre 20–40 s ×2 → regardez la timeline ci-dessous pour savoir où ça en est.

Sortie avec prompt original

Sortie avec prompt amélioré

Voir la timeline du test
Remarque : cette version appelle un endpoint texte. Pour produire des images, il faudra un endpoint image séparé.