Midjourney: Das neue KI-Bilder-Tool
Schon lange gewinnen Tools auf Basis künstlicher Intelligenz immer mehr an Popularität, sowohl im professionellen Rahmen, als auch in der privaten Nutzung. Das ist natürlich auch an uns nicht vorbeigegangen. Über das KI-Tool ChatGPT, bei dem es sich um einen sprach- und textbasierten Chatbot handelt, sind wir auf die Bild-KI Midjourney aufmerksam geworden. Gerade in der kreativen Branche bringt Midjourney so einiges an Potenzial mit sich. Das hat natürlich unser Interesse geweckt, da neu generierte Bilder immer ein wichtiger Aspekt des Onlinemarketings sind. Hier ein kleiner Überblick über das neue KI-Tool.
Was ist Midjourney?
Das amerikanische Forschungsinstitut Midjourney hat eine künstliche Intelligenz entwickelt, welche in der Lage ist, auf Basis eines Textes, das dazu passende Image zu generieren. Text-to-Image-Tool, wie man auch so schön sagt. Gelauncht wurde das Projekt im Juli 2022 und befindet sich jetzt, Stand 2023, in Version 5.
Auf Grundlage eines Textes oder einzelner Stichwörter, die auf Englisch eingegeben werden, designt Midjourney das gewünschte Bild. Der Art des Images sind dabei keine Grenzen gesetzt. Egal ob Fotorealistisch, Comic-Stil, 3D-Kunst oder Klassiker – Midjourney generiert alles. Voraussetzung: der Befehl stimmt.
Die KI hinter Midjourney ist lernfähig. Anhand der Millionen von Bildbeschreibungen weiß sie, wie bestimmte Objekte aussehen und kann diese abbilden. Sie arbeitet mit systematischen zusammenhängen und nicht wissen in dem Sinne wie wir es kennen. Seit dem ersten Launch des Systems sind deutliche Verbesserungen zu erkennen. Zum Beispiel wurde die Darstellung von Händen seit dem letzten Update drastisch verbessert.
Die ersten Schritte mit Midjourney
Schritt 1
Voraussetzung für die Nutzung von Midjourney ist ein Discord Account. Für jeden, der damit nichts anfangen kann: Bei Discord handelt sich um einen Onlinedienst für Chat, Sprach- und Videokonferenzen, sowie Instant Messaging. Ein Account kann schnell, einfach und vor allem kostenlos erstellt werden.
Schritt 2
Auf der Webseite von Midjourney befindet sich unter anderem der Button “Join the Beta”. Darüber wird man zu Discord weitergeleitet. Das Beta kennzeichnet, dass es sich dabei um die Testversion handelt.
Schritt 3
Bei Discord ist der Kanal von Midjourney auszuwählen. Auf den ersten Blick mag dieser ein wenig unübersichtlich aussehen. Relevant für die Text-to-Image Funktion sind zunächst nur die sogenannten Newcomer Rooms. Welchem davon man beitritt ist völlig irrelevant, die Experience ist in allen die gleiche. In der Beta-Version können dabei insgesamt 25 Bilder erstellt werden.
KI-Bilder erstellen mit Midjourney
Um der KI eine Anweisung zu geben, startest du mit dem Befehl “ /imagine”. Schon bei der Eingabe wird das Feld “prompt” oberhalb des Eingabefelds angezeigt. Dieses muss angeklickt werden, damit im Eingabefeld der Befehl geschrieben werden kann. Erst so, weiß die künstliche Intelligenz, dass sie mit der Erstellung eines Images starten soll.
Dem aktuellen Stand (03.2023) nach müssen die Prompts auf Englisch formuliert werden, da die KI von Midjourney noch nicht mehrsprachig ist. Wir haben es ausprobiert – Befehle, die auf Deutsch oder in anderen Sprachen eingegeben werden, werden zwar verarbeitet, aber das Ergebnis fällt weniger gut aus.
Bei der Formulierung der Prompts ist dabei auf einiges zu achten. Je präziser die Angaben sind, desto wahrscheinlicher bekommst du ein Bild, das tatsächlich deinen Vorstellungen entspricht. Auf welche Details es dabei ankommt, muss man selbst herausfinden und ausprobieren.
Die KI generiert vier Vorschläge, die zu der eingegebenen Textphrase passen. Auf Basis dessen kann die Eingabe weiter angepasst werden, solange bis das Image der vollsten Zufriedenheit entspricht. Auch die einzelnen Bildvorschläge lassen sich weiter anpassen.
Von oben links, nach unten rechts, sind die Grafiken der Leserichtung nach von 1 bis 4 durchnummeriert. Die Funktionen U1-U4 stehen für das upscalen des jeweiligen Designs, was dir eine verbesserte Auflösung eines einzelnen Bildes liefert. V hingegen steht für “variation” und erstellt weitere Varianten des gewünschten Images.
Als Unterstützung oder als kleine Starthilfe bei der Formulierung der Prompts steht ein extra dafür konzipiertes Handbuch zur Verfügung – natürlich auf Englisch.
Die Prompts lassen sich in zwei Kategorien einteilen: Basic und advanced Prompts.
Basic Prompt
Damit ist der einfache, eben beschriebene Textbefehl gemeint. Hinter “ /imagine” kannst du dich frei ausleben und der KI in englischer Sprache deine Wünsche mitteilen. Diese Prompts sind einfach auszuführen und gerade zum Testen von Midjourney ideal.
Advanced Prompt
Neben der Texteingabe besteht auch die Möglichkeit eigene Bilder hochzuladen. Dadurch wird der KI eine visuelle Grundlage geliefert, anhand deren ein Bild erstellt wird. So kann der Inhalt und Stil der erzeugten Bilder beeinflusst werden. Das bietet sich vor allem dann an, wenn du bereits eine konkrete Vorstellung von dem gewünschten Image hast.
Die Bilder lassen sich in folgenden Formaten hochladen: PNG, GIF und JPG. Bild URLS müssen an den Anfang des Prompts gesetzt werden.
Hier hast du zwei Möglichkeiten. Entweder zwei Bilder hochladen, die im Zuge der Bilderstellung kombiniert werden oder aber ein Bild zusammen mit einem Textbefehl. Das Bild wird dann mittels des Textes verändert und angepasst.
→ Achte beim Hochladen der Bilder auf das Urheberrecht!
Privatsphäre bei Midjourney
Die Newcomer Rooms sind öffentlich. Das heißt, jeder kann alle Eingaben und die dadurch erstellten Bilder sehen und auch weiter bearbeiten oder herunterladen. Dieser öffentliche Austausch muss unbedingt bedacht werden, gerade wenn es darum geht, privatere Images beispielsweise mit persönliches Fotos erstellen zu lassen. Mit einem Pro-Abo können Bilder auch im Privaten Modus erstellt werden.
Dadurch, dass der Chat live ist und von vielen Menschen zur gleichen Zeit genutzt wird, kann es sein, dass meine seine Bilder eine Weile suchen und scrollen muss. Das ist etwas umständlich und ärgerlich. Hoffentlich entwickeln die Köpfe hinter Midjourney noch eine komfortablere Lösung dafür. Auf der anderen Seite kann man sich so Inspirationen für tausende Images holen und sich besonders als Anfänger an den Formulierungen anderer orientieren.
„Relaxed“ und „Fast Mode“ bei Midjourney
Midjourney bietet zwei Modi an, um Images generieren zu lassen. Den Bezeichnungen fast und relaxed kann man schon entnehmen, dass sie sich in ihrer Geschwindigkeit unterscheiden und das nicht zu knapp.
Relaxed Mode
In diesem Modus werden die Textbefehle aller User in einer virtuellen Warteschleife eingereiht. Nach und nach werden diese abgearbeitet. Es kann also eine Weile dauern, bis dein Bild an der Reihe ist. Mit bis zu 20 Minuten solltest du hier schon rechnen. Bedenkt man, dass diese Bilder dann teils weiter verändert werden müssen, kann sich dieser Prozess auch mal über Stunden in die Länge ziehen.
Fast Mode
Hier wandert der Befehl nicht in die Warteschlange, sondern wird quasi bevorzugt behandelt und kommt direkt an die Reihe. Die Images werden in Normalfall innerhalb weniger Minuten generiert.
Rechtliches bei Midjourney
Bilder auf Basis einer bloßen Texteingabe generieren zu lassen, klingt ja nach einer netten Spielerei, doch generell und insbesondere wenn man in kommerziellen Gefilden unterwegs ist, stellt sich natürlich die Frage nach Eigentums- und Nutzungsrechten.
In der kostenfreien Version lassen sich die Images unter der Lizenz: Creative Commons Noncommercial 4.0 Attribution International nutzen.
Wie schon in der Bezeichnung steckt, sind Images mit einem Beta-Account nicht für die kommerzielle Nutzung zulässig. Im Privaten Rahmen können die Bilder geteilt werden, es muss aber ein Bildnachweis gebracht werden.
Bei kostenpflichtigen Abos sieht die Sache schon anders aus.
Die über einen bezahlten Account erstellten Bilder können kostenfrei verwendet werden. Hier ist noch einmal hervorzuheben, dass JEDER, der in den öffentlichen Chats unterwegs ist, deine Bilder nutzen kann. Wenn also Bilder erstellt werden sollen, die andere (noch) nicht zu sehen bekommen sollen, wird ein Pro-Abo mit dem privaten Stealth-Mode fällig.
Midjourney: Wie viel kostet es?
Kostenfrei können im Rahmen der Beta-Version insgesamt 25 Bilder zum Testen erstellt werden, für eine Nutzung darüber hinaus muss eines der drei, derzeit verfügbaren Abonnements abgeschlossen werden.
Anders als bei den meisten Systemen wird bei den Abos und der Preisbildung nicht die Anzahl der Images als Maß der Dinge genommen, sondern die GPU-Time. Für all die da draußen, die mit dieser Bezeichnung genauso wenig anfangen können wie ich: Die Bezeichnung GPU kommt aus dem Englischen und steht für Graphic Processor Unit. Sie berechnet die angezeigten Pixel und sorgt dafür, dass die eingegebenen Daten visualisiert werden können. Zusammenhängend mit dem Abrechnungssystem von Midjourney heißt das, je höher die Bildqualität, desto länger rechnet die GPU. Das wiederum bedeutet, bei höherer Bildqualität können weniger Images generiert werden, als bei niedriger.
Aktuell ist Kreditkartenzahlung die einzige Zahlungsmöglichkeit bei Midjourney. Kündigen lässt sich ein Abo zum Ende jedes Monats ohne Kündigungsfrist. Hier muss unbedingt darauf geachtet werden, dass die kommerziellen Nutzungsrechte beim Wechseln in die Beta-Version verloren gehen.
Basic-Abo
Für 10 $ monatlich stehen hier 200 Minuten GPU Time zur Verfügung. Wie auch schon bei der Test-Version können die Textbefehle in das Suchfeld eingegeben werden.
Standard-Abo
Das Standard-Abo schlägt mit 20 $ pro Monat zu Buche. Im fast mode stehen hier 15 Stunden GPU Time zur Verfügung. Im relaxed mode lassen sich unbegrenzt viele Bilder erstellen, dann natürlich mit entsprechender Wartezeit.
Pro-Abo
Im Pro Abo ist nicht nur die längste GPU Time enthalten, sondern auch eine zusätzliche Funktion. Im Stealth-Mode können Bilder privat von der künstlichen Intelligenz erstellte werden, ohne dass jeder im Discord-Chat sie sehen kann. Für diesen Privat-Modus ist “/private” einzugeben. Die GPU Time im fast Modus beträgt 30 Stunden. Im relaxed mode können auch hier unbegrenzte Mengen an Bildern generiert werden. Wer sich für das Pro Abonnement entscheidet, muss mit monatlichen Kosten von 60 $ rechnen.
→ Um zu überprüfen, wie viel GPU Time noch übrig ist, muss in die Chatbox lediglich der Befehl ”/info” eingegeben werden!
Unsere Erfahrungen mit Midjourney
Wir haben Midjourney natürlich auch umfangreich ausgetestet. Das System dahinter ist wirklich super unkompliziert, einfach den Textbefehl hinter /imagien promt eingeben und voilà: Ein Bild wird generiert.
Was aber aufgefallen ist, die passenden Prompts zu formulieren ist gar nicht so einfach! Es erfordert einiges an Fingerspitzengefühl und Wortgewandtheit um, besonders wenn man bereits eine grobe Vorstellung hat. Die Formulierungen sollten so detailreich und ausgeschmückt wie möglich sein. Ein Vorteil ist es hier natürlich, wenn man über Wissen in Grafikdesign und Fotografie verfügt, um Stile, Kameraperspektiven und grafische Eigenheiten genauer benenn zu können.
Gerade im Onlinemarketing braucht man ständig Bilder für Beiträge jeder Art. Dementsprechend bietet Midjourney hier eine gute Möglichkeit, um an einzigartiges Bild zu kommen.
Die Zukunft von Midjourney
Wenn man sich anschaut, was die KI hinter Midjourney bereits jetzt zustande bringt, auch wenn sie derzeitig noch in den Kinderschuhen steckt, stellt sich die Frage, ob die künstliche Intelligenz die Arbeit von kreativen Köpfen und Grafikdesignern zukünftig ersetzen wird.
Ob es auf diese Frage eine generelle Antwort gibt, ist meiner Meinung nach schwer zu sagen. Ohne Zweifel übernimmt die KI einige Aufgaben, die sonst von menschlicher Hand ausgeführt werden und das unbestritten in unfassbarer Qualität. Ich persönlich glaube nicht, dass Berufe vollständig von der KI ersetzt werden, zumindest jetzt noch nicht. Wer weiß, was sich in diesen Bereich in den nächsten Jahren noch so tut. Meiner Meinung nach stehen in erster Linie Änderungen in Berufsfeldern bevor. Auch wenn Midjourney Bilder in kürzester Zeit erstellt, stehen hinter den Entwürfen Menschen, die sich Textbefehle überlegen und die Bilder bis zur Perfektion optimieren.
Natürlich stellt sich auch immer die Frage nach dem Urheberrecht. Wenn von Midjourney erstellte Bilder für Graphic-Novels oder Illustrationen in Büchern verwendet werden, bei wem liegt dann das Recht an diesem Bild? Diese und weitere Fragen dieser Art müssen zukünftig noch geklärt werden.
Noch befindet sich Midjourney in seinen Anfängen, wir können nur spekulieren, was in den nächsten Monaten und Jahren noch möglich sein wird.