Parlons un peu de MidJouney …
Midjourney a été fondée par David Holz, co-fondateur de Leap motion . Il est entré pour la première fois en version bêta ouverte le 12 juillet 2022. La société a travaillé sur l’amélioration de ses algorithmes; la version 3 en mai 2022.
Le programme a été utilisé par le magazine britannique The Economist pour la couverture de son numéro de juin 2022 ; en Italie, le grand journal Corriere della Sera a publié une bande dessinée créée avec Midjourney par l’écrivain Vanni Santoni en août 2022 ; de bons débuts !
Le , une œuvre générée par une intelligence artificielle gagne un concours de beaux-arts, la Colorado State Fair Fine Arts Competition : Théâtre D’opéra Spatial, de Jason M. Allen, générée par Midjourney. Le jury et les autres artistes n’étaient pas au courant que cette œuvre avait été conçue artificiellement, ce qui a généré une polémique autour de la qualification d’art une œuvre qui n’a pas été complètement produite de la main et de l’esprit d’un artiste, et qui utilise des images existantes, ce qui pose la question du plagiat. Les organisateurs de la compétition ont dû revoir les modalités du concours pour l’année suivante.
En janvier 2023, trois artistes Sarah Andersen , Kelly McKernan et Karla Ortiz ont déposé une plainte pour violation du droit d’auteur contre Stable Diffusion, Midjourney et DeviantArt , affirmant que ces sociétés avaient enfreint les droits de millions d’artistes en formant des outils d’IA sur cinq milliards d’images extraits du Web sans le consentement des artistes originaux.
MidJourney est un système d’intelligence artificielle capable de créer des images à partir de textes descriptifs entrés par l’utilisateur. Sur le site web officiel, ses créateurs se présentent comme « un laboratoire de recherche indépendant. Explorant de nouveaux mediums de pensée. Étendant les pouvoirs de l’imagination de l’espèce humaine ».
Ce modèle d’intelligence artificielle a été entraîné sur un vaste nombre d’images, comme la plupart des IA text-to-images. Toutefois, il se distingue en mettant l’accent sur le style artistique plutôt que sur le réalisme. En optimisant leur IA, les créateurs de MidJourney voulaient avant tout que les images générées soient belles.
Actuellement en version 3.0, le logiciel incorpore désormais une boucle de feedback basée sur l’activité et les réactions des utilisateurs. Ceci a permis d’améliorer la qualité d’image, en analysant les données indiquant quelles images les utilisateurs aiment et comment ils les utilisent.
L’entreprise n’a pas encore révélé quelles technologies elle utilise, mais confirme utiliser les modèles d’intelligence artificielle les plus avancés dotés de milliards de paramètres et entraînés sur des milliards d’images. En outre, les images sont générées sur le Cloud d’un vendeur utilisant une énergie verte.
Chaque image nécessite plusieurs petaops, ce qui représente 10^15 opérations par seconde. Selon les créateurs du logiciel, jamais aucun service accessible au grand public n’avait permis à un individu d’utiliser autant de puissance de calcul.
La plupart des utilisateurs se servent de cet outil pour s’amuser, et donner vie à leur imagination. Toutefois, environ 30% des utilisateurs ont un usage professionnel de cet outil.
De nombreux graphistes utilisent MidJourney dans le cadre de leur flux de travail de développement de concept. Ils génèrent plusieurs variations d’une idée, et la présentent à leurs clients pour déterminer dans quelle direction poursuivre. Selon Holz, les professionnels se servent de cet outil pour « supercharger » le processus de création ou de communication.
En outre, toujours selon le créateur, environ 20% des utilisateurs s’en serviraient à des fins thérapeutiques. Créer des images pourrait les aider à surmonter un traumatisme ou un deuil. L’IA est exploitée ici comme « outil de réflexion émotionnelle et intellectuelle ».
Pendant longtemps, MidJourney était réservé à un usage non-commercial. Désormais, l’usage commercial peut être autorisé. En juin 2022, le célèbre magazine The Economist a laissé l’IA créer sa couverture.
Pour utiliser MidJourney , vous devez au préalable, vous inscrire sur le site officiel. Les invitations sont ensuite envoyées par vagues.
Après avoir reçu un e-mail d’invitation, vous communiquerez avec le programme via la messagerie Discord sur un canal public. Il suffit d’entrer un texte, et le robot MidJourney renverra une image après environ une minute.
Il est toutefois possible de payer un abonnement pour 10 dollars ou 30 dollars par mois afin de pouvoir soumettre son texte en privé via un message direct au robot. Ceci permet d’éviter les messages des autres utilisateurs du canal public. Par défaut, les images générées par l’IA restent néanmoins visibles publiquement.
En tant qu’application sociale, MidJourney fixe des règles et des limites concernant le contenu autorisé. Le contenu gore ou pour adulte est strictement interdit, et les utilisateurs sont priés d’éviter de créer du contenu visuellement choquant ou perturbant.
Certains textes peuvent ainsi être bloqués automatiquement. De plus, une quarantaine de modérateurs garde un œil sur les images créées par les utilisateurs.
Les créateurs de MidJourney n’apprécient pas non plus l’idée qu’on utilise leur IA pour créer de fausses photographies de type DeepFake. Il s’agit selon eux d’un usage « extrêmement dangereux ».
Pour utiliser Midjourney, il faut rejoindre le serveur Discord dédié. Il est donc nécessaire de posséder un compte sur la plateforme. Mais avant de vous lancer, renseignez-vous sur les différents plans proposés par Midjourney.
Voici comment accéder à Midjourney :
Retrouvez facilement Midjourney sur Discord grâce à la barre de recherche.
Une fois sur le serveur de Midjourney, trouvez les salons nommés « newbies » pour les nouveaux utilisateurs.
Maintenant que vous avez rejoint le serveur Discord de Midjourney, ainsi qu’un salon « newbie » dédié aux néophytes, vous allez pouvoir effectuer quelques réglages avant de vous lancer. Pour cela :
Les réglages permettent notamment de choisir la version de Midjourney que vous souhaitez utiliser.
Midjourney fonctionne avec des commandes, qui sont toutes introduites par un slash, par exemple /settings comme vu ci-dessus. Il en va de même pour vos requêtes de génération d’images. Voici les bases pour effectuer une demande à Midjourney :
Il y a plusieurs choses à connaître avant de se lancer pleinement dans la génération d’images sur Midjourney. Des éléments à anticiper qui permettent de ne pas perdre de temps ou gaspiller les 25 essais gratuits de la bêta (quand celle-ci est active). Il est donc important de savoir que :
Pour générer des images avec Midjourney, vous allez devoir allier des commandes (/imagine, par exemple) avec vos requêtes (« prompt »). Voici quelques commandes utiles pour bien débuter :
Retrouver la liste des commandes Midjourney
Outre les commandes, Midjourney propose de nombreux paramètres pour correspondre à vos demandes avec précision. Les paramètres s’ajoutent toujours à la suite de votre « prompt » et sont introduits par un double tiret. Voici quelques-uns des paramètres à connaître :
Retrouver la liste des paramètres Midjourney
Vidéo didactique : Comment utiliser Midjourney ; le guide ultime pour débutants
La question de la propriété intellectuelle est très sensible lorsqu’on évoque l’art généré par IA. Actuellement, la justice américaine interdit par exemple d’accorder des droits d’auteur sur des images générées par l’Intelligence Artificielle.
En février 2022, la US Copyright Office Review Board a rejeté une requête visant à accorder un copyright à une image de paysage générée par ordinateur et intitulée « A Recent Entrance to Paradise ». Pour cause, cette image n’avait pas été créée par un humain.
Selon les conditions d’utilisation de MidJourney, les utilisateurs détiennent toutes les oeuvres qu’il crée avec le service. Toutefois, l’entreprise exige une licence de copyright des utilisateurs pour reproduire le contenu créé avec le service. Il s’agit d’une précaution nécessaire pour héberger les images des utilisateurs.
En outre, des problèmes de propriété intellectuelle pourraient survenir concernant les modèles IA entraînés sur du matériel soumis à des droits d’auteur. Une IA entraînée sur du contenu existant risque aussi de générer des images présentant des similitudes…
Attention : L’utilisation d’œuvres de 16 000 artistes sans consentement devant la Justice
Alors que les oeuvres de plus de 16 000 artistes ont servi sans le consentement des ayant-droits à entraîner Midjourney, l’IA spécialisée dans la génération d’images écope d’une class action aux États-Unis.
Publié sur Presse Citron le 24 janvier 2024
Les créateurs de MidJourney reconnaissent que la loi n’est pas encore suffisamment claire concernant le contenu généré par IA. Il s’attend à ce que des lois plus spécifiques soient adoptées dans le futur.
David Holz a grandi en Floride. Il a lancé son entreprise de design pendant qu’il étudiait les mathématiques et la physique à l’université. Il préparait son PhD de Mathématiques, mais a finalement fait une pause en 2008 pour co-fonder l’entreprise Leap Motion. Cette dernière a été dédiée à la fabrication de périphériques informatiques.
L’année suivante, Holz passe un an en tant qu’étudiant chercheur aux Max Planck Institute. Il a ensuite passé deux ans en tant que chercheur étudiant au Langley Research Center de la NASA. Il a aussi travaillé sur le LiDAR, les missions vers Mars et la science atmosphérique.
Toutefois, cette époque était aussi une période de doute pour Holz. Il explique qu’il se demandait « pourquoi il travaillait sur ces choses ». Par la suite, il souhaitait travailler sur une seule chose qui lui tenait à cœur.
Il a décide de se focalisé sur Leap Motion. Cette dernière développe un appareil hardware permettant de suivre les mouvements de la main et de les utiliser pour contrôler un ordinateur ou tout autre appareil.
David Holz a dirigé cette entreprise pendant douze ans. Lorsqu’il l’a quittée, elle employait environ 100 personnes.
En 2021, il a finalement sauté le pas pour créer MidJourney.
Selon lui, cette entreprise est encore relativement petite et ne regroupe qu’une dizaine de personnes. Elle est également auto-financée, et n’a aucun investisseur externe !
Quoi qu’il en soit, David Holz explique que les motivations de l’équipe ne sont pas vraiment financières. Il a dit « nous sommes juste là à travailler sur des choses qui nous passionnent et à nous amuser. Et nous travaillons sur beaucoup de projets différents ».
Selon lui, l’aspect technologique de l’IA et la mesure dans laquelle il va s’améliorer est plutôt facile à prédire. En revanche, « les ramifications humaines de cette extension sont très difficiles à imaginer ».
À ses yeux, « il y a là quelque chose à l’intersection de l’humanité et de la technologie. Pour vraiment comprendre ce dont il s’agit et ce que ça devrait être, nous avons vraiment besoin de mener beaucoup d’expériences ». David Holz précise alors que l’entreprise est déjà rentable.
Pour le futur, les créateurs de MidJourney craignent qu’il soit victime de son succès. À l’heure actuelle, plusieurs centaines de milliers de personnes utilisent déjà le service et requièrent la puissance d’environ 10 000 serveurs.
Toutefois, si 10 millions de personnes tentent d’utiliser cette technologie, David Holz explique qu’il n’y aura tout simplement pas suffisamment d’ordinateurs disponibles dans le monde.
D’après David Holz, les outils intelligence artificielle comme MidJourney peuvent aider les artistes à s’améliorer et découvrir de nouveaux horizons dans leur discipline. Ils n’ont pas forcément vocation à faire de chacun un artiste professionnel, et un artiste utilisant ces outils sera toujours meilleur qu’un simple particulier les utilisant.
Il reconnaît en revanche que ces outils pourraient ajouter une pression sur les artistes, même si ce n’est pas encore le cas. Il estime que l’outil va énormément s’améliorer au fil des deux prochaines années…
Midjourney propose diverses commandes pour préciser ses prompts (requêtes). L’une d’elles est commode pour générer des motifs répétés.
Voici un exemple de prompt passé sur Midjourney avec la commande « –tile ». La commande complète était : « /imagine realistic flaming flowers –testp –tile
La qualité de votre résultat dépendra évidemment de la finesse de votre requête sur Midjourney. Peut-être vous faudra-t-il ajouter des instructions pour ajuster le rendu. Vous avez également la possibilité de demander des variations sur une image qui vous parait prometteuse. Et si vraiment cela ne donne rien, vous pouvez demander de relancer de nouvelles propositions.
Un autre exemple ci-dessous, avec la commande : « /imagine Paper origami showing birds –tile –test ». Le rendu est également plutôt convaincant ici, avec un effet plus artistique que pour les fleurs enflammées. LIbre à vous ensuite de rajouter d’autres paramètres, pour avoir un affichage en paysage plutôt qu’en portrait. Il existe de la documentation en anglais sur le site officiel.
L’une des fonctionnalités très appréciables de Midjourney est sa faculté à fusionner des images entre elles pour un résultat cohérent. Cette commande s’appelle « blend » (« mélange », en anglais) et fonctionne comme « imagine », à ceci près que l’inscription de « /blend » dans la zone de saisie de texte sur Discord aura pour effet de faire apparaître des paramètres supplémentaires.
C’est ici qu’il vous faut aller chercher vos images sur votre ordinateur pour les envoyer à Midjourney. Vous pouvez demander une fusion entre deux et six images. Notez que ce service est, là aussi, soumis aux conditions d’utilisation de l’outil. Les images que vous choisissez sont également publiques : les autres personnes sur le Discord peuvent les voir.
Et c’est fait !
Par défaut, le système d’intelligence artificielle de Midjourney est calibré sur une version générale pour la création d’image. Celle-ci peut être utilisée dans différentes versions (v1, v2, et ainsi de suite jusqu’à la v5).
Mais il existe aussi des options bien plus spécialisées.
Cette faculté supplémentaire est en fait l’évolution d’un modèle d’IA déjà existant dans Midjourney : NijiJourney. Celui-ci existait jusqu’à présent en version v4. Il est maintenant proposé en version v5, avec une esthétique plus prononcée encore.
Pour l’employer, il faut avoir un abonnement actif à Midjourney et activer le paramètre dans les options, avec la commande « /settings ». Vous pouvez également ajouter la commande en fin de prompt avec les commandes « –niji 5 » ou « –niji 4 » selon la génération du modèle (sans les guillemets).
Ce modèle est très spécialisé : lorsqu’on lui a envoyé des « prompts » basiques comme « un chat », « une galaxie » ou bien « un panda roux assis sur un rocher », l’intelligence artificielle a systématiquement refaçonné ses requêtes pour les faire correspondre à la japanimation. On n’a jamais eu droit à un visuel classique, comme sait les faire Midjourney.
Les rendus diffèrent y compris lorsque les instructions sont élémentaires. Cependant, cela reste joli : sur certaines images, on a l’impression de voir des scènes tirées d’un film du studio Ghibli. Dans d’autres, le dernier plan d’un film de Makoto Shinkai ou de Mamoru Hosoda. On croise aussi des images qui rappellent des illustrations qui peuplent les artbooks d’artistes.
Les résultats sont superbes, mais ils peuvent parfois diverger fortement de ce que vous souhaitiez.
Un exemple : on voulait demander à l’IA d’imaginer une IA en train dessiner une illustration au petit matin, dans une ambiance détachée. Les quatre images retranscrivent certes cette atmosphère matinale et suspendue… mais pour le sujet lui-même, l’IA est passée à côté.
Par défaut, le modèle NijiJourney est calé sur une stylisation réglée à 100 (« –s 100 »). Il est toutefois possible de l’augmenter ou de la diminuer pour avoir accentuer ou atténuer cet effet d’anime. Vous pouvez aller de zéro (« –s 0 ») à mille (« –s 1000 »). Ces commandes sont à ajouter dans votre prompt, sans les guillemets, mais en incluant bien les deux tirets.
Autre article : Comment utiliser ChatGPT pour perfectionner vos créations Midjourney
Publié sur Le Journal du Net par Benjamin Polge le 1er septembre 2023
Cette vidéo permet d’aller plus loin : Améliorer ses prompts / Prompt Engineering (pas à pas)
Pour la liste complète : Les incroyables fakes de Midjourney
Le service de génération d’images à partir d’un texte Midjourney se pare d’une nouvelle fonctionnalité qui permet de… décrire des images avec des mots. De quoi mieux appréhender le fonctionnement des commandes du service.
Depuis quelques jours maintenant, le robot conversationnel de Midjourney, qui est accessible via Discord, dispose d’une nouvelle fonction qui demande au logiciel de décrire une image qu’on lui envoie. Describe, c’est son nom, est un prompt très simple d’utilisation puisqu’il suffit de saisir /describe puis de charger l’image à traiter. En retour, le bot Midjourney vous répond sous la forme de quatre descriptions d’image numérotées. Il est dès lors possible, en sélectionnant une des propositions, de « lancer » un rendu tout en gardant la possibilité de modifier la description.
Cela fait naturellement écho à la possibilité d’envoyer une image à Midjourney lors d’une commande pour qu’il s’en inspire. Mais ici, c’est bien le vocabulaire utilisé pour décrire l’image téléversée qui est intéressant. On notera soigneusement quels mots sont employés pour décrire l’ambiance, le rendu de la lumière ou la colorimétrie de l’image. Vous aurez ainsi la possibilité de progresser dans la réalisation de vos prochaines commandes.
Cette interface est simplissime !
Pas besoin d’un long discours :
C’est tout…
Je pense que cela ce passe de commentaire.
Il est intéressant de noter que les fonctionnalités du bot sont listées dès que l’on tape le caractère / dans la barre de commande.
Pour en savoir plus, vous pouvez d’ailleurs saisir /help, qui listera en retour différentes informations, notamment la liste des commandes exécutables par le logiciel.
Les réglages de Midjourney ne sont accessibles qu’en tapant une requête précise : « settings ».
C’est à partir de ce panneau de commande que vous pouvez ajuster la façon dont Midjourney fonctionne : quelle qualité d’image voulez-vous ? Quelle version de Midjourney ? Souhaitez-vous utiliser une IA plus spécialisée ? Et ainsi de suite.
Il s’appelle DreamGenerator, et il s’agit d’un appareil photo unique en son genre. À la croisée des chemins entre un Nikon classique et Midjourney, DreamGenerator peut transformer, sous vos yeux, vos photos grâce à de l’intelligence artificielle.
Kyle Goodrich, l’inventeur, a présenté sa création sur Twitter le 18 juillet 2023. Celui qui est également ingénieur chez SnapChat décrit DreamGenerator comme « un appareil photo qui transforme vos clichés en tout autre chose grâce au pouvoir de l’IA générative. Choisissez parmi 30 prompts, prenez une photo, et regardez votre image se métamorphoser en chef-d’œuvre, juste sous vos yeux ! »
Le concept derrière DreamGenerator est simple, mais est novateur. Un petit appareil photo va prendre un cliché, puis et les utilisateurs pourront choisir de le transformer grâce à de l’IA générative embarquée. Comme on peut le voir sur la vidéo de démonstration, un portrait de famille classique peut changer avec un effet année 80 qui donne à tout le monde une coupe de cheveux typique de l’époque.
L’IA utilisée pour DreamGenerator est Stable Diffusion. Moins connue que Midjourney, Stable Diffusion est gratuite et fonctionne sur les mêmes principes : à partir d’un simple prompt, le système peut entièrement créer une image ou bien modifier une photo déjà existante. S’il n’y a d’ordinaire pas de limite aux prompts pour les IA, seule une liste de 30 consignes est disponible avec DreamGenerator. L’appareil photo peut aussi modifier les clichés selon certains thèmes : dinosaures, far west, zombie, pirate, rétro, démon ou encore conte de fées. D’après la vidéo de présentation, il est également possible de transformer une photo de son chien en un portrait officiel d’astronaute de la NASA.
Pour l’instant, DreamGenerator n’est pas un produit prêt à être mis en vente, ni même sur le point d’être produit : il n’y a pas de date de sortie annoncée, encore moins de prix