Sources
- Hugging Face Blog
Faites-la vôtre
Inspiré par cette histoire ? Transformez l’idée en votre propre création par IA en quelques secondes — gratuit pour commencer, sans carte bancaire.
Commencer gratuitement
Inspiré par cette histoire ? Transformez l’idée en votre propre création par IA en quelques secondes — gratuit pour commencer, sans carte bancaire.
Commencer gratuitementHugging Face a publié un guide complet pour exécuter Transformers.js dans les extensions Chrome, ce qui signifie que les modèles d'IA peuvent désormais tourner entièrement dans le navigateur — localement, en toute confidentialité, et sans le moindre appel API.
L'article de blog de Hugging Face présente pas à pas une extension Chrome complète et fonctionnelle qui charge un modèle Transformers.js dans un service worker — le script d'arrière-plan persistant que les extensions Chrome utilisent pour la logique inter-onglets. Le modèle se charge une seule fois, reste en mémoire et répond aux messages de n'importe quel onglet ou popup sans recharger les poids à chaque fois. Cette architecture est importante : les précédentes démos d'IA dans le navigateur rechargaient souvent le modèle à chaque interaction de page, les rendant frustrantement lentes en pratique.
Le guide s'adresse aux développeurs plutôt qu'aux utilisateurs finaux, mais le résultat concret est un modèle de référence que tout créateur techniquement averti peut suivre pour déployer son propre outil IA natif du navigateur.
La plupart des outils IA utilisés par les créateurs aujourd'hui dépendent du cloud : vous envoyez un prompt, un serveur distant exécute le modèle, vous récupérez un résultat. Ce modèle fonctionne bien jusqu'à ce que le fournisseur modifie ses tarifs, tombe en panne ou décide de restreindre certaines catégories de contenu. L'inférence locale contourne tout cela.
Exécuter un modèle dans une extension Chrome signifie que les poids résident sur la machine de l'utilisateur. L'inférence ne quitte jamais le navigateur. Pour les créateurs qui travaillent avec des concepts de personnages, des images de référence ou des bibliothèques de prompts qu'ils préfèrent ne pas envoyer à un serveur tiers, c'est une amélioration significative en matière de confidentialité.
Cela signifie également un coût marginal nul par inférence. Une fois l'extension installée et le modèle mis en cache, chaque suggestion de prompt, chaque étiquette de style, chaque appel de classification d'image est gratuit — définitivement.
L'architecture est bien adaptée aux outils d'assistance légers plutôt qu'à la génération d'images complète (le matériel des navigateurs n'est pas encore à la hauteur pour des modèles à l'échelle de Stable Diffusion à grande vitesse). Les cas d'usage réalistes à court terme incluent :
Aucun de ces outils ne nécessite un GPU puissant. Les modèles de vision-langage et de texte plus petits du catalogue Hugging Face fonctionnent correctement sur WebGPU dans un navigateur moderne. Les créateurs à l'aise avec JavaScript — ou prêts à utiliser un modèle de codage IA open source pour générer le code de base — peuvent avoir un prototype fonctionnel en une après-midi.
L'API WebGPU de Chrome, désormais stable dans Chrome 113 et versions ultérieures, est ce qui rend tout cela pratique. Elle donne au JavaScript du navigateur un accès direct au calcul GPU, que Transformers.js utilise pour accélérer les opérations matricielles. Le résultat est une inférence mesurément plus rapide que le mode de repli WebAssembly uniquement — suffisamment rapide pour une assistance de prompt en temps réel, même sur du matériel grand public de milieu de gamme.
L'inférence IA dans le navigateur reste contrainte par rapport à une station de travail GPU dédiée, mais pour la catégorie des modèles d'assistance légers qui aident les créateurs à travailler plus vite sur des plateformes comme le générateur de Charmloop, le plafond de performance est suffisamment élevé pour faire la différence.
L'étape logique suivante est que la communauté publie de vraies extensions construites sur ce modèle. Le Hugging Face Hub héberge déjà des milliers de petits modèles de vision et de langage compatibles avec Transformers.js. À mesure que la prise en charge de WebGPU s'étend à Firefox et Safari — les deux ont des implémentations en cours — la portée des outils IA natifs du navigateur s'élargira davantage. Les créateurs qui apprennent à construire avec cette stack dès maintenant auront une longueur d'avance significative sur une catégorie d'outils qui n'existe pas encore.