Fooocus AI a essayé la génération d'images AI n'a jamais été aussi facile!

Vous le savez sûrement: vous entendez parler de tous ces générateurs d'images IA cool, vous voulez essayer, et puis..?

Ensuite, vous passez trois heures à installer la bonne version de Python, à rechercher des messages d'erreur sauvages sur Google et peut-être même à abandonner frustré. C'était la première fois que j'essayais la diffusion stable.

Mais à un moment donné, je suis au-dessus Fooocus AI J'ai trébuché, et franchement, j'aurais aimé le découvrir plus tôt. Il n’a pas fallu cinq minutes entre le téléchargement et la première image générée. Pas de blague. Et les résultats? Tout aussi bien que les outils plus compliqués, mais sans toute la frustration.

Laissez-moi vous montrer pourquoi je n'utilise plus que Fooocus et pourquoi cela pourrait être intéressant pour vous aussi.

Qu'est-ce que Fooocus?

Ok, bref, Fooocus est essentiellement un logiciel de génération d’images IA basé sur le même modèle SDXL que tous les autres outils – Automatic1111, ComfyUI et comme ils s’appellent tous. La différence? Les développeurs se sont demandés: «Et si nous allions simplement simplifier …?»

Ils se sont vraiment assis et ont dit: «Trois clics maximum du téléchargement à la première image». Et vous savez quoi? Ils ont réussi. Pas de tutoriels à l'heure, pas d'acrobaties en ligne de commande, il suffit de démarrer et de commencer.

C'est un peu comme Midjourney, sauf qu'il fonctionne sur votre propre ordinateur et qu'il est totalement gratuit. Et par rapport aux autres outils SDXL, Fooocus fait tout le travail technique ennuyeux que vous devez faire vous-même.

Installation: cela n’a jamais été aussi simple

Normalement, j’écrirais maintenant un roman sur les exigences du système, mais honnêtement, si vous avez acheté un PC semi-actuel avec une carte graphique Nvidia au cours des deux dernières années, c’est probablement en cours d’exécution. Même avec seulement 4 Go de VRAM, cela fonctionne grâce à la magie de Microsoft (Virtual Swap). Je l’ai testé sur mon ancienne GTX 1660 Ti – fonctionne parfaitement.

C’est comme ça que ça se passe

Attention, je vais vous montrer l'installation maintenant, et vous ne croirez pas à quel point c'est simple:

Accéder à GitHub lllyasviel/Fooocus (Mais attention, de faux sites web apparaissent parfois sur Google – allez directement sur GitHub). Téléchargez la dernière version, c'est la version 2.5. C'est un fichier ZIP, donc 2-3 Go de taille.

Décompressez-les quelque part – je l’ai simplement jeté dans un dossier «KI-Kram» sur le disque dur. Ensuite, allez dans le dossier et double-cliquez sur run.bat. C’était sérieux.

Au premier démarrage, le programme télécharge automatiquement tous les modèles dont il a besoin. Cela prend quelques minutes en fonction de l'Internet. Prenez un café et quand vous reviendrez, tout sera prêt. Le navigateur s'ouvre automatiquement avec l'interface Fooocus, généralement sous localhost:7865.

J’ai ici une capture d’écran … ach ne, vous pouvez vous imaginer: en haut, il y a une grande zone de texte, en bas, un bouton «Generate». Il n’en faut pas plus pour l’instant.

Sérieusement, c'était toute l'installation

Au début, je ne pensais pas que ça pouvait être aussi simple. J'ai attendu 20 minutes pour que quelque chose de compliqué arrive. Mais non, c'est tout. Pas d'installation Python, pas d'environnements virtuels, pas d'enfer de dépendances. Double-cliquez et c'est fait.

En comparaison, lorsque j'ai installé Automatic1111 l'année dernière, j'ai passé deux soirées assis. D'abord installé Python dans la bonne version, puis cloné Git, puis essayé toutes les versions Torch parce que quelque chose n'a pas fonctionné tout le temps. Pour ComfyUI, c’était encore pire: j’ai fini par l’abandonner et je suis resté sur l’A1111.

Et puis Fooocus arrive et fait de tout le drame un processus de cinq minutes. Pourquoi les autres ne l'ont-ils pas fait depuis longtemps?

Mon premier test: «Wow, c’était rapide»

Ok, donc la chose est en cours. La première fois que j’ai fait le test classique, j’ai tapé «a cat sitting on a windowsill» et j’ai cliqué sur Generate. Pas d'autres réglages, juste l'invite.

15 secondes plus tard, j'avais une photo. Ce n'est pas une image de merde, c'est une image qui a l'air d'avoir passé des heures dans les décors. Le chat avait l’air réaliste, la fourrure avait des détails, l’éclairage était parfait, tout allait bien.

J'ai d'abord pensé que c'était de la chance, alors j'ai essayé à nouveau. «An elderly wizard in a mystical forest» est à nouveau un exemple générique. Encore 15 secondes, encore un gros résultat. La barbe avait des cheveux individuels, la robe avait des rides et des textures, à l'arrière-plan il y avait des lucioles que je n'avais pas explicitement mentionnées.

La différence avec d'autres outils: automatique vs. artisanal

Cela devient intéressant car c'est là que Fooocus se démarque vraiment de la concurrence. Laissez-moi vous montrer ce qui se passe habituellement lorsque vous travaillez avec SDXL:

La voie normale (avec Automatic1111 ou ComfyUI)

Imaginez que vous vouliez générer une image. Voici ce que vous devez normalement faire:

Il faut d'abord trouver les bons modèles. Cela signifie que vous allez sur des sites comme Hugging Face ou Civitai, recherchez le modèle de base SDXL (il existe différentes versions – laquelle était la meilleure ?), téléchargez-le. C'est souvent 6-7 Go par modèle.

Ensuite, vous avez besoin du modèle de raffinage. C'est un modèle supplémentaire qui améliore les détails. Encore 6 Go de téléchargement. Attendez, où est-ce que ça va aller? Ah oui, dans le dossier des modèles, mais dans quels sous-dossiers? Était-ce checkpoints ou models/Stable-diffusion?

Ensuite, vous devez encore voir si vous avez besoin d'un EAU (aucune idée de ce que c'est, mais soi-disant important). Il faut aussi le mettre dans le bon dossier. Si vous l'oubliez, vos photos ont l'air bizarres.

Une fois que vous avez tout au bon endroit, commencez à générer. Mais arrêtez-vous: vous devez d’abord choisir le bon modèle dans l’interface graphique. Activer le raffineur. Ensuite, définissez à quelle étape le raffineur doit commencer. Ensuite, choisissez la méthode d'échantillonnage. Ensuite, réglez les steps. À propos de Guidance Scale …

Vous voyez, c'est du travail. Et si vous ne savez pas exactement ce que vous faites, les résultats sont souvent meh. J'ai passé des heures à tourner autour de tous ces paramètres.

La Voie du Fooocus

Lancer le programme. Entrez rapidement. Cliquez sur Generate. C'est prêt.

Vraiment, c'est tout. Mais que se passe-t-il en arrière-plan? En effet, Fooocus fait exactement ce que je viens de décrire, automatiquement et correctement:

Gestion des modèles: Au premier démarrage, Fooocus télécharge automatiquement les meilleurs modèles SDXL. Pas n'importe qui, mais vraiment ceux qui fonctionnent bien. Ils se retrouvent automatiquement dans le bon dossier. Vous n'avez pas à vous en occuper.

Intégration de raffineur: Ici, c'est techniquement passionnant, même si vous n'avez pas besoin de voir tout cela. Fooocus a une astuce: ils utilisent le raffineur dans le même échantillonneur que le modèle de base. Au début, cela ressemble à un discours de nerd, mais l’effet est réel: les images semblent plus cohérentes, car le raffineur peut s’appuyer sur les informations du modèle de base. Avec A1111 et ComfyUI, ils fonctionnent dans des échantillonneurs séparés, ce qui n'a pas cet avantage.

Mais savez-vous ce qu'il y a de mieux? Vous n'avez pas besoin de tout savoir. Ça marche, c'est tout.

Optimisation rapide: C'est ma fonctionnalité préférée. Fooocus a un modèle GPT-2 en interne (je ne sais pas pourquoi ils prennent GPT-2, mais peu importe) qui étend et améliore automatiquement vos invites.

Vous écrivez «a cat» – Fooocus en fait en interne quelque chose comme «a photorealistic cat with detailed für texture, professional photography, high quality, sharp focus, natural lighting, depth of field». Vous n'avez pas besoin de l'écrire vous-même. Le système fait cela pour vous, sur la base de ce qui fonctionne bien d'après l'expérience.

Avec d'autres outils, vous devez tout mettre vous-même dans l'invite. J’avais autrefois d’énormes fichiers texte contenant de «bonnes invites», que j’ai ensuite toujours copiés et adaptés. Avec Fooocus? Plus besoin.

La surface: simple, mais pas stupide

Lorsque vous ouvrez Fooocus pour la première fois, vous pensez peut-être: «Hm, ça a l'air plutôt vide …». C'est vrai aussi. En haut, il y a une grande zone de texte pour votre invite, y compris une autre pour l'invite négative (c'est-à-dire des choses qui ne doivent PAS être dans l'image), puis il y a quelques paramètres de base.

Vous pouvez choisir le rapport d'aspect (1:1 pour Instagram, 16:9 pour les vignettes YouTube, etc.), définir le nombre d'images à générer et choisir parmi différents préréglages de style. C'était la première fois.

Au début, j'ai trouvé cela presque trop simple. Où sont tous les réglages? Mais je me suis rendu compte que je n'en avais pas besoin. Pour 95% Sur mes photos, les réglages de base sont tout à fait suffisants.

Pour les nerds, le mode Avancé est également disponible

Si vous voulez plus de contrôle, pas de problème. Il y a un onglet avancé où vous pouvez régler toutes les choses techniques. Modes de performance (Quality, Speed, Extreme Speed), résolutions personnalisées, échelle de guidance, étapes d'échantillonnage, etc.

La différence avec l'A1111 est que ces paramètres sont facultatifs. Le programme fonctionne aussi très bien sans eux. Avec l'A1111, l'interface graphique vous saute aux oreilles dès le premier lancement avec une centaine d'options différentes, et vous ne savez pas par où commencer. Chez Fooocus, ils sont là quand vous en avez besoin, mais ils n'énervent pas quand vous n'en avez pas besoin.

J'ai découvert que je ne touchais presque jamais les réglages avancés. Les réglages automatiques sont tout simplement assez bons.

GUI vs. ligne de commande: Pourquoi Fooocus marque des points ici

Avez-vous déjà essayé de travailler avec la ligne de commande? Alors, c'est vrai? Avec des ordres à taper?

Avec de nombreuses configurations SDXL, vous ne pouvez pas vous en passer. Même si l'outil a une interface graphique, vous devez d'abord le lancer à partir de la ligne de commande. Et si cela ne fonctionne pas, il est dit: «Ouvre la ligne de commande et entre les commandes suivantes …»

Je suis développeur, je peux gérer la ligne de commande. Mais je comprends tout à fait quand les gens disent: «Ne lâchez pas, c’est trop compliqué pour moi.» L’autre jour, ma copine voulait aussi générer des images et quand je voulais lui expliquer comment lancer l’A1111 («Alors, vous ouvrez la ligne de commande, allez dans le bon dossier avec cd, « Activez l’environnement virtuel avec … »), elle n’a roulé que les yeux.

Avec Fooocus? «Il suffit de double-cliquer sur le run.bat.» Tout le monde le comprend. Un onglet de navigateur s’ouvre et c’est parti. Aucune commande cryptique, aucune «activate venv» ou «pip install» ou quoi que ce soit d’autre.

C'est le point où Fooocus est meilleur non seulement pour les débutants, mais aussi pour les personnes qui veulent simplement générer des images sans avoir à se soucier de l'informatique.

Styles: 275 préréglages prêts à l'emploi qui apportent vraiment quelque chose

Je dois avouer que lorsque j’ai vu que Fooocus avait plus de 275 préréglages de style différents, j’ai d’abord pensé: «Oh mon dieu, encore plus d’options dont je n’ai pas besoin.» Mais ensuite, j’ai essayé ces préréglages et ils sont vraiment très bons.

Un style n'est pas seulement quelques mots rapides supplémentaires. Ce sont des configurations complètes qui optimisent également les paramètres techniques. Si vous choisissez «Cinematic», vous obtiendrez non seulement des looks cinématographiques, mais le système ajustera également les paramètres d’échantillonnage pour obtenir le meilleur résultat pour ce style.

Quelques exemples que j'ai trouvé particulièrement cool:

Cinematic: Parfait pour tout ce qui ressemble à une capture d'écran d'un film. Cool Lens Flares, éclairage dramatique, le programme complet. J’ai pris quelques photos pour une vignette YouTube, ce qui m’a semblé très professionnel.

anime: Si vous aimez le style anime, c'est la voie à suivre. Pas de résultats hybrides étranges, mais un look anime vraiment propre. Mon copain fait des dessins de personnages pour son jeu indépendant.

Photographic: C'est mon style par défaut. On dirait que quelqu'un a pris des photos avec un bon appareil photo. Pas aussi artificiel que certaines images d'IA.

Vous pouvez également combiner plusieurs styles. «Cinematic + Fantasy», par exemple, vous donne des scènes cinématographiques fantastiques. Le système est assez intelligent pour mélanger judicieusement les deux styles.

Avec d'autres outils, vous devriez tous créer ces effets vous-même. Testez différentes invites, ajustez les paramètres, peut-être chargez-vous encore des LoRA. Chez Fooocus, vous cliquez simplement sur un style et cela fonctionne.

Exemples pratiques: Comment j'utilise vraiment Fooocus

Assez de théorie, laissez-moi vous montrer comment j'utilise cette chose dans la vraie vie:

Contenu pour les médias sociaux

Je fais du contenu pour Instagram et LinkedIn de temps en temps. Avant, je cherchais des photos de stock sur Unsplash ou Pexels qui n'étaient jamais parfaites. Maintenant, je fais comme ça:

Je pense à ce dont j’ai besoin, par exemple «modern workspace with laptop and coffee cup, morning light». Choisissez le style «Photographic», réglez le ratio d’aspect sur 1:1 pour Instagram (ou 16:9 pour LinkedIn) et générez 4 à 5 variantes. Ça ne prend pas deux minutes.

Ensuite, je choisis le meilleur, peut-être que je fais encore un peu de color grading dans Lightroom (je n’en ai pas besoin, mais je l’aime bien), et le post est prêt. De l'idée à l'image finie: 10 minutes max.

Cela aurait pris plus de temps avec l'A1111, car je devrais d'abord passer par tous les réglages. Avec Fooocus? Entrez rapidement, choisissez le style, done.

Art conceptuel pour un projet

L'autre jour, j'ai eu un projet où je voulais visualiser différents concepts d'espace. Un peu comme «futuristic office space with plants, natural lighting, minimalist design».

Avec Fooocus, j'ai d'abord généré 20-30 variantes différentes, juste pour voir ce qui est possible. Ça m'a peut-être pris une demi-heure. Ensuite, j'ai sélectionné les trois meilleurs et les ai utilisés en tant qu'invites d'image (plus à ce sujet) pour créer des variantes encore plus spécifiques.

En fin de compte, j'ai eu une très bonne collection de concepts avec lesquels je pourrais continuer à travailler. Si je l'avais fait avec un designer, nous aurions fini à quelques milliers d'euros et plusieurs semaines en termes de coût et de temps. Avec Fooocus? Un après-midi et 0 euro.

Illustrations pour un site web/imprimés

Pour les sites web et les imprimés, j'ai régulièrement besoin d'images. Images d'en-tête, illustrations de concepts spécifiques, de telles choses. J'avais l'habitude de passer du temps à trouver des photos de stock et à les éditer.

Maintenant, j'écris simplement une invite basée sur le thème de l'article. Par exemple, pour un article sur la productivité: «person working focused at desk, plants in background, warm lighting, productive atmosphere». Style «numérique» ou «photographique», selon ce qui convient le mieux.

Mieux encore, les images sont uniques. Personne d'autre n'a les mêmes images. Ce n’est plus un moment «j’ai déjà vu ailleurs».

Image Prompting: Du bon au génial

D'accord, ça va être cool. Fooocus peut non seulement texte-à-image, mais aussi image-à-image. Vous téléchargez une image et Fooocus en génère des variations ou l'utilise comme source d'inspiration.

Je l'ai utilisé comme ça l'autre jour: si j'avais une photo d'un paysage, la composition était bonne, mais le temps était meh. J’ai donc téléchargé la photo et écrit: «same composition, but golden hour lighting with dramatic clouds». Boom, résultat parfait.

Vous pouvez également contrôler l'influence de l'image de référence. À 100% reste's très proche de l'original, à 30% Il ne s’agit plus que d’une inspiration grossière. Et vous pouvez même combiner plusieurs images – composition de l’image 1, style de couleur de l’image 2, détails de l’image 3.

Cela fonctionne plus facilement avec Fooocus qu'avec la concurrence, car tous les paramètres techniques sont déjà préréglés de manière judicieuse. Avec l'A1111, vous devriez jouer avec Denoising Strength, ControlNet et ce que je sais. Chez Fooocus, vous téléchargez l'image et cela fonctionne simplement.

Ce que Fooocus n'est pas

Pour être juste, Fooocus n’est pas la meilleure solution pour tout le monde. Il y a des situations où les autres outils conviennent mieux:

Si vous voulez vraiment contrôler chaque aspect du processus de génération - chaque nœud, chaque paramètre, chaque étape - vous êtes mieux servi avec ComfyUI. Fooocus automatise beaucoup de choses, et parfois cela signifie moins de contrôle.

Si vous avez des flux de travail personnalisés très spécifiques avec des dizaines de ControlNets différents et des processus multi-étapes et que sais-je, alors A1111 ou ComfyUI offrent plus de possibilités.

Et si vous voulez travailler avec Stable Diffusion 1.5 ou d’autres modèles plus anciens (je ne sais pas pourquoi, mais certaines personnes l’aiment), Fooocus n’est pas optimal. C'est vraiment sur SDXL.

Pour 90% l'utilisateur est Fooocus mais le meilleur choix. À moins que vous ne vouliez vraiment aller en profondeur et contrôler chaque paramètre vous-même.

Performance: Est-ce que ça marche aussi sur mon ordinateur?

Je reçois souvent la question suivante: «Mon GPU est-il suffisant pour cela?» Brève réponse: probablement oui.

Je l’ai testé sur différents systèmes:

PC de jeu (RTX 4060TI 16GB + 32GB RAM): Fonctionne comme lubrifié. 1024×1024 images en 12-15 secondes. Peut également faire des résolutions plus élevées avec l'upscaling, pas de problème.

Vieux ordinateur portable (GTX 1660 Ti, 8GB RAM): Fonctionne aussi. Cela dure plus longtemps, donc 25-30 secondes pour une image, mais c'est possible. Parfois, je dois passer en mode «vitesse» au lieu de «qualité», mais les résultats sont toujours bons.

Calculatrice alternative (RTX 2070 Super, 8GB VRAM): Fonctionne sans problème. Il n'a même que 8 Go de RAM, mais grâce à l'option Virtual Swap de Microsoft, c'est tout de même possible.

En comparaison, Fooocus est même un peu plus rapide que l'A1111 avec les mêmes paramètres. C'est probablement parce que le pipeline est plus optimisé. Mais le vrai gain n’est pas la vitesse, c’est le temps que vous NE passez PAS à optimiser les paramètres.

Si ça ne marche pas: dépannage

Normalement, Fooocus fonctionne simplement. Mais il y a parfois des problèmes. Voici quelques choses que j'ai rencontrées:

Erreur «Out of Memory»: Se produit parfois lorsque trop d'autres programmes sont en cours d'exécution. Solution: fermer d’autres programmes GPU-hungry (Chrome avec 50 onglets, par exemple) ou activer le mode «Low VRAM» dans les paramètres. Aide le plus souvent.

La génération dure éternellement: Vérifiez d’abord si le mode «Quality» avec max Steps n’est pas activé par inadvertance. La «vitesse» ou la «vitesse extrême» sont tout à fait acceptables pour les tests. L’upscaling prend également du temps – si vous n’en avez pas besoin pour la première fois, désactivez-le.

Les images ont l'air bizarres: La plupart du temps, c'est à l'improviste. Soyez plus spécifiques. Ou ajoutez à l'invite négative des choses que vous ne voulez pas. «blurry, distorted, bad anatomy» aide souvent.

Le programme ne démarre pas: Vérifier le pare-feu ou l'antivirus. Parfois, ils bloquent le téléchargement initial des modèles. Ou le port 7865 est déjà occupé, vous devrez alors changer le fichier config, mais je n’en ai jamais eu besoin.

Honnêtement, j'ai eu moins de problèmes avec Fooocus qu'avec tout autre outil dans ce domaine. La plupart des choses fonctionnent simplement hors de la boîte.

Mises à jour et maintenance : s'exécute automatiquement

Fooocus est activement développé. Toutes les quelques semaines, il y a de nouvelles versions avec des corrections de bugs et des fonctionnalités. La mise à jour est super facile:

Soit vous téléchargez simplement la nouvelle version et la décompressez dans un nouveau dossier. Si vous avez des modèles personnalisés, copiez-les, c'est fait.

Ou, si vous avez Git dessus, allez dans le dossier Fooocus et faites git pull. Encore plus simple.

Le développement ne cesse d'avancer. Actuellement, la version 2.5.x est disponible et apporte des améliorations vraiment cool à l'inpainting (c'est-à-dire l'édition de parties d'images). J'ai hâte de voir ce qui va se passer.

Ma conclusion après un mois d'utilisation intensive

J'utilise Fooocus ici et là depuis un certain temps maintenant, et je peux honnêtement dire que l'A1111 ne me manque pas. Pas un peu.

Les images sont tout aussi bonnes, c’est clair, c’est SDXL. Mais le chemin est tellement plus agréable. J'ouvre le programme, j'appuie sur une touche et 20 secondes plus tard, j'ai une bonne image. Pas de réglage des paramètres d'une demi-heure, pas de dépannage, pas de frustration.

Pour les créateurs de contenu, les concepteurs ou simplement les personnes qui veulent prendre des photos cool, Fooocus est parfait. Cela vous ôte la complexité technique sans vous faire passer pour des tuteurs. Vous pouvez toujours aller en profondeur si vous le souhaitez, mais vous n’en avez pas besoin.

Trois choses que j'aime le plus:

Premièrement,: L'installation. Je peux recommander n'importe quel Fooocus sans avoir à envoyer des vidéos didactiques pendant une soirée. «Téléchargez-le, double-cliquez, c’est fait» – tout le monde le comprend.

Deuxièmement,: La gestion automatique des modèles. Je n'ai plus à me soucier de trouver, de télécharger et d'organiser les bons modèles. Fooocus le fait. Et honnêtement, c'est un énorme gain de temps.

Troisièmement,: La cohérence des résultats. À A1111, j'avais toujours ces jours où tout à coup toutes les images avaient l'air de merde et je ne savais pas pourquoi. Avec Fooocus? Fonctionne simplement. Toujours. Les réglages automatiques sont si bien réglés que vous pouvez compter sur eux.

Voilà, c'est à votre tour!

Si vous avez lu jusqu’à présent, vous en savez plus sur Fooocus que la plupart des gens qui l’utilisent déjà. Il est temps de l'essayer vous-même!

Voici le plan: Allez sur GitHub, recherchez «lllyasviel/Fooocus«, téléchargez la dernière version (v2.5.5). Décompressez la chose, double-cliquez sur run.bat (ou launch.py si vous êtes sur Linux/Mac), attendez les quelques minutes pendant que les modèles se chargent, puis commencez.

Commencez par quelque chose de simple: «a beautiful landscape» ou «a cute cat» - vous connaissez les classiques. Regardez ce qui se passe. Essayez différents styles. Expérimentez avec l'Image Prompting. Amusez-vous avec ça!

Happy Generating!