Bronnen
- Hugging Face Blog
Maak ’m van jou
Geïnspireerd door dit verhaal? Maak van het idee in seconden je eigen AI-kunst — gratis beginnen, geen kaart nodig.
Gratis aan de slag
Geïnspireerd door dit verhaal? Maak van het idee in seconden je eigen AI-kunst — gratis beginnen, geen kaart nodig.
Gratis aan de slagHugging Face heeft een uitgebreide handleiding gepubliceerd voor het uitvoeren van Transformers.js binnen Chrome-extensies, wat betekent dat AI-modellen nu volledig in de browser kunnen draaien — lokaal, privé en zonder ook maar één API-aanroep.
De blogpost van Hugging Face doorloopt een complete, werkende Chrome-extensie die een Transformers.js-model laadt binnen een service worker — het persistente achtergrondscript dat Chrome-extensies gebruiken voor logica over tabbladen heen. Het model laadt eenmalig, blijft in het geheugen aanwezig en reageert op berichten van elk tabblad of elke popup zonder de gewichten elke keer opnieuw te laden. Die architectuur is belangrijk: eerdere browser-gebaseerde AI-demo's laadden het model vaak opnieuw bij elke paginainteractie, waardoor ze in de praktijk frustrerend traag waren.
De handleiding richt zich op ontwikkelaars in plaats van eindgebruikers, maar het praktische resultaat is een blauwdruk die elke technisch onderlegde creator kan volgen om zijn eigen browser-native AI-tool te bouwen.
De meeste AI-tools die creators vandaag gebruiken zijn cloudafhankelijk: je stuurt een prompt, een externe server voert het model uit, je krijgt een resultaat terug. Dat model werkt prima totdat de aanbieder de prijzen wijzigt, uitvalt of besluit bepaalde inhoudscategorieën te beperken. Lokale inferentie omzeilt dit alles.
Een model uitvoeren binnen een Chrome-extensie betekent dat de gewichten op de machine van de gebruiker staan. De inferentie verlaat de browser nooit. Voor creators die werken met karakterconcepten, referentieafbeeldingen of promptbibliotheken die ze liever niet naar een externe server sturen, is dat een betekenisvolle privacyverbetering.
Het betekent ook nul marginale kosten per inferentie. Zodra de extensie is geïnstalleerd en het model is gecached, is elke promptsuggestie, elke stijltag, elke afbeeldingsclassificatieaanroep gratis — permanent.
De architectuur is goed geschikt voor lichtgewicht ondersteunende tools in plaats van volledige afbeeldingsgeneratie (browserhardware is er nog niet klaar voor bij Stable Diffusion-schaalmodellen op snelheid). Realistische gebruiksscenario's op korte termijn zijn onder meer:
Geen van deze vereist een krachtige GPU. Kleinere visie-taal- en tekstmodellen uit de Hugging Face-catalogus draaien adequaat op WebGPU in een moderne browser. Creators die vertrouwd zijn met JavaScript — of bereid zijn een open-source AI-codeermodel te gebruiken om de boilerplate te scaffolden — kunnen in een middag een werkend prototype hebben.
Chrome's WebGPU API, nu stabiel in Chrome 113 en later, is wat dit praktisch maakt. Het geeft browser-JavaScript directe toegang tot GPU-rekenkracht, die Transformers.js gebruikt om matrixbewerkingen te versnellen. Het resultaat is inferentie die meetbaar sneller is dan de WebAssembly-only fallback — snel genoeg voor realtime promptondersteuning, zelfs op consumentenhardware in het middensegment.
Browser-gebaseerde AI-inferentie is nog steeds beperkt vergeleken met een dedicated GPU-werkstation, maar voor de categorie kleine, ondersteunende modellen die creators helpen sneller te werken op platforms zoals Charmloop's generator, is het prestatieniveau hoog genoeg om er toe te doen.
De logische volgende stap is dat de community daadwerkelijke extensies bouwt op basis van dit patroon. De Hugging Face Hub herbergt al duizenden kleine visie- en taalmodellen die compatibel zijn met Transformers.js. Naarmate WebGPU-ondersteuning zich uitbreidt naar Firefox en Safari — beide hebben implementaties in uitvoering — zal het bereik van browser-native AI-tools verder toenemen. Creators die nu leren bouwen met deze stack, krijgen een aanzienlijke voorsprong op een categorie tools die nog niet bestaat.