Description
La démo Stable Diffusion WebGPU est une application basée sur le web qui permet aux utilisateurs de générer des images en utilisant le framework create-react-app. Pour accéder à l'application, les utilisateurs doivent avoir JavaScript activé et utiliser la dernière version de Chrome, ce qui nécessite d'activer les drapeaux "Experimental WebAssembly" et "Experimental WebAssembly JavaScript Promise Integration (JSPI)". L'application effectue une série d'étapes d'inférence pour générer une image, chaque étape prenant environ 1 minute plus environ 10 secondes pour que le décodeur VAE génère l'image. Il est à noter que le fait d'avoir les outils de développement ouverts peut ralentir le processus d'environ 2 fois. Le modèle UNET, responsable de la génération d'images, ne fonctionne que sur le CPU en raison de meilleures performances et de résultats plus précis par rapport au GPU. Pour des résultats acceptables, le nombre minimum d'étapes recommandé est de 20 ; cependant, à des fins de démonstration, 3 étapes suffiraient. Les fichiers du modèle sont mis en cache, éliminant ainsi le besoin de téléchargements répétés. L'application offre une interface conviviale avec des options pour charger le modèle, exécuter le processus de génération d'image et visualiser le résultat. Pour résoudre des problèmes spécifiques, une section FAQ est disponible, offrant des conseils de dépannage. Malgré son exécution sur un GPU, la mise en œuvre de webgpu dans onnxruntime en est encore à ses débuts, ce qui entraîne l'incomplétude de certaines opérations. Cela conduit à un transfert continu des données entre le CPU et le GPU, impactant les performances. Le multi-threading n'est actuellement pas pris en charge, et des limitations dans WebAssembly empêchent la création de mémoire 64 bits avec SharedArrayBuffer. Le développeur prévoit de résoudre ces problèmes grâce aux changements de spécifications proposés et aux correctifs du moteur. Le code source de la démo Stable Diffusion WebGPU est disponible sur GitHub, permettant aux utilisateurs de l'exécuter localement. De plus, une version corrigée d'onnxruntime est fournie, permettant l'utilisation de grands modèles de langage avec transformers.js, bien que sa fiabilité dans tous les scénarios ne soit pas garantie. Le développeur prévoit également de soumettre une demande de fusion au référentiel d'onnxruntime.
Partagez Sur :

Stable Diffusion Webgpu

À partir de 9,99 $/mois
Partagez Sur :
Découvre des outils d'I.A similaires :

TheDream

Pas de tarification
Aucun outil similaire disponible.














