"D'avoir de meilleures données d'entraînement, plus pertinentes, ça reste le nerf de la guerre, même avec les plus gros modèles."
Le D.E.V. de la semaine est Guillaume Laforge, Developer Advocate AI chez Google. Dans cet épisode, Guillaume revient sur l'évolution du RAG, loin d'être enterré malgré l'agrandissement des fenêtres de contexte des LLM. Il partage pourquoi, même avec un million de tokens, les besoins des entreprises dépassent largement les capacités actuelles des modèles. On parle de découpage sémantique, de context engineering et des nouveaux défis liés à la hiérarchisation des données. Enfin, Guillaume détaille comment, face à la multiplication des données et la chasse à la pertinence, la qualité prime sur la quantité. Un tour d'horizon pragmatique et technique du futur des architectures RAG.
Chapitrages
00:00:53 : Introduction Inspirante
00:01:59 : Présentation de Guillaume
00:03:44 : Évolution du RAG
00:05:13 : Importance du Chunking
00:10:26 : Techniques de Tokenisation
00:13:09 : Avantages de Notion
00:16:18 : Modèles d'Embedding Multilingues
00:18:03 : Recommandations de Modèles
00:19:47 : Pertinence des Questions
00:23:42 : Approche des Questions Générées
00:30:18 : Hybridation des Contextes
00:32:17 : Émergence du Contexte Engineering
00:35:07 : Coûts de l'Inférence
00:38:51 : Qualité des Données
00:40:40 : Recommandations et Clôture
Liens évoqués pendant l'émission
Glaforge.dev: Site de Guillaume avec tous ses articles autour du RAG
Distribué par Audiomeans. Visitez audiomeans.fr/politique-de-confidentialite pour plus d'informations.