Ritterinnen beim Umzug: Bilder erstellen mit KI, eine tiefgründige Reise und lustige Ergebnisse

Bilder erstellen mit Künstlicher Intelligenz (KI), die Möglichkeiten sind enorm. Im vergangenen Jahr ist eine Revolution passiert. Foto-ähnliche Bilder, aber auch Comics und verschiedenste künstlerische Stile können in einer Minute erstellt werden. Bilder, zu denen die Einzelperson oft gar nicht in der Lage wäre oder ewig brauchen würde.

Aber es ist mit Hindernissen verbunden:

1. Du musst wissen, wie du „prompten“ kannst, also wie genau du die Arbeitsaufträge formulierst. Und das funktioniert für verschiedene KI-Tools unterschiedlich.

2. Es ist Übungssache. Ausprobieren und machen, machen, machen!

3. Manches geht, manches nicht.

Um dich ein bisschen zu unterhalten, zeige ich dir einige Versuche, welche die Möglichkeiten und Grenzen beleuchten.

 

Die liebe Grane schickte mir ein Bild, das sie mit Leonardo AI erstellt hatte. Eine sehr kreative Bildidee, nämlich zwei Ritterinnen mittleren Alters beim Umzug, die Bücher schleppen.

Das ist eine tolle Gestaltungsaufgabe, die mit mehreren Herausforderungen einhergeht!

 

Willkommen auf einer tiefgründigen Bildreise …

Bilder von Frauen, die nicht Barbie sind, sind nicht immer leicht zu bekommen.

Etwas kräftigere Frauen zum Beispiel. Zunächst bekommst du mal Geschlechterstereotypen.

 

Außerdem tun sich alle Künstlichen Intelligenzen schwer damit, das Alter richtig einzuschätzen.

Von der Gesellschaft haben sie gelernt: Jung ist jung, und alt ist alt.

Dazwischen gibt es nichts!

Ist ja allgemein bekannt, nicht? Wer nicht mehr jung ist, ist … alt. Die mittleren Jahre verschwinden irgendwie in der Unsichtbarkeit.

 

So auch bei der KI:

40-jährige echt wirkende Frauen, die nicht aussehen wie direkt aus Hollywood, sind schwer zu generieren.

Und wenn du „50“ oder „60“ als Alter eingibst, wirst du womöglich eine Greisin erhalten.

 

Leonardo

Leonardo ist klasse darin, verschiedene beeindruckende Stile zu erzeugen. Insbesondere fotorealistische Bilder, die direkt wie aus einem Film aussehen können.

Aber … Manchmal dann doch störend eine falsche Anzahl von Beinen, Armen oder Fingern oder auch mehrere Köpfe.

Und das hat Grane eingegeben:

 

PROMPT: a pair of two hard working yet smiling 60-year-old full-figured female medieval warriors with broad hips and muscular arms, with long, messy, greyish hair. they are carrying big cardboard boxes overflowing with books of all genres into a small living room full with boxes and book shelves, Photorealistic, anatomically correct hands, many details, warm light, golden hour.

PROMPT auf deutsch: Ein Paar von zwei fleißigen, dennoch lächelnden 60-jährigen vollschlanken weiblichen mittelalterlichen Kriegerinnen mit breiten Hüften und muskulösen Armen, mit langen, zerzausten, grauen Haaren. Sie tragen große Kartons, die mit Büchern aller Genres überquellen, in ein kleines Wohnzimmer voller Kisten und Bücherregale. Fotorealistisch, anatomisch korrekte Hände, viele Details, warmes Licht, goldene Stunde.

Das sieht doch klasse aus!

Die Optik der Ladies ist wirklich cool. Fast wie ein Foto. Erstaunlich, was inzwischen alles geht. Sie wirken wie Personen.

Das mit den Büchern, die aus den Kisten quellen, hat nicht so ganz geklappt; mit der einen Hand gibt es auch ein Problem; aber insgesamt ein tolles Bild. Danke an Grane, die mir Bild und Prompt zur Verfügung gestellt hat!

Ich selbst arbeite bisher fast nur mit ChatGPT und DALL-E 3; ich berichtete davon im letzten Artikel: Drei Tipps für mehr Zeitverschwendung: „Hilfe, ich habe zu viel Zeit!“ 😱 

ChatGPT ist ein Chatbot, ein Large Language Model, welches dann für die Bild-KI DALL-E die Arbeitsanweisungen formuliert. Sehr praktisch. Ich kann hier in normaler Sprache und vielen blumigen Details beschreiben, was ich gerne hätte.

 

Bilder erstellen mit ChatGPT 4 und DALL-E 3

Die Bildidee fand ich so spannend, dass ich sie auch einmal probieren wollte. Ich gab denselben Prompt ein.

ChatGPT: Hier ist das Bild, das deiner Beschreibung entspricht. Schau dir die zwei fleißigen und dennoch lächelnden 60-jährigen, kraftvollen weiblichen mittelalterlichen Kriegerinnen an, wie sie große Kartons voller Bücher in ein kleines Wohnzimmer tragen, das bereits mit Kartons und Bücherregalen gefüllt ist.

Jana 😲: Ganz nett, DALL-E hat die Tätigkeit der Frauen besser hinbekommen, die Umgebung ist schön, die Kleidung kreativ. Aber Gesichter und Haare wie direkt aus Hollywood, mit einer Art manischem Grinsen, das Gesicht künstlich. Das lassen wir doch noch ein bisschen abändern, dann haben wir unser gewünschtes Ergebnis.

(Optimistisch!)

Jana an ChatGPT: Umgebung und Props, Kleidung und Figuren sind klasse. Die Gesichter wirken aber im Stil etwas übertrieben, fast karikaturhaft. Könnten wir es noch einmal machen als realistische, sympathische Frauen wie auf einem echten Foto?

 

ChatGPT: Ich habe das Bild entsprechend deiner Anfrage angepasst, um die Gesichter der Frauen realistischer und sympathischer darzustellen, ähnlich wie auf einem echten Foto.

Jana: (😱 Kann jetzt nicht sein, oder?!) An ChatGPT: Das gefällt mir schon besser. Eine der Figuren ist aber leider ein Mann.

Neues Bild wird erstellt.

ChatGPT: Ich habe das Bild angepasst, um sicherzustellen, dass beide Figuren als Frauen dargestellt werden. Hoffentlich entspricht dies nun deinen Vorstellungen.

Jana: (😂😐Sehr charmant! Tolle Details. schöne Farbe und Beleuchtung. Interessante Kleidung. Aber das ist einfach nicht wahr, jetzt habe ich diese beiden freundlichen Zwerge hier! Wie sag ich das der KI? Ich gebe ihr dieselbe Arbeitsanweisung einfach nochmal. Das soll oft helfen.)

An ChatGPT: a pair of two hard working yet smiling 60-year-old full-figured women. They are dressed in knight’s armor and have broad hips and muscular arms, with long, messy, greyish hair. They are carrying big cardboard boxes overflowing with books of all genres into a small living room full with boxes and book shelves. The scene should depict both characters as women, looking as realistic and natural as a photograph from a movie, with the faces of the women appearing realistic, sympathetic, and without exaggeration. Ensure both figures are clearly female, resembling real people you might meet. The lighting should be warm, resembling golden hour, with photorealistic, anatomically correct hands and many details in the environment and props.

(Die KI versteht das ohne weiteres als Aufforderung, das nächste Bild zu erstellen.)

ChatGPT: Ich habe das Bild erneut angepasst, um beide Figuren als Frauen in Ritterrüstungen darzustellen, die realistisch und natürlich aussehen, ähnlich wie in einer Fotografie aus einem Film.

Jana (🤦‍♀️Wir müssen fair bleiben. All das wäre vor etwas über einem Jahr noch gar nicht möglich gewesen. Die Möglichkeiten sind erstaunlich. Also versuchen wir es doch noch einmal.)

An ChatGPT: Ich möchte gerne diesen Prompt mit dir besprechen:
 
„a pair of two hard working yet smiling 60-year-old full-figured female medieval warriors with broad hips and muscular arms, with long, messy, greyish hair. They are carrying big cardboard boxes overflowing with books of all genres into a small living room full with boxes and book shelves. The scene should depict both characters as women, looking as realistic and natural as a photograph, with the faces of the women appearing realistic, sympathetic, and without exaggeration. Ensure both figures are clearly female, resembling real people you might meet. The lighting should be warm, resembling golden hour, with photorealistic, anatomically correct hands and many details in the environment and props.“
 
Warum denkst du macht DALL-E Männer ins Bild? Was müsste man an dem Prompt ändern, um zwei Frauen zu bekommen?
 
 

Chat GPT: Die Herausforderung, die du beschreibst, kann aus mehreren Gründen auftreten. DALL-E generiert Bilder basierend auf dem eingegebenen Text und den gelernten Zusammenhängen in seiner Trainingsdatenbank. Die Erkennung und Darstellung von Geschlechtern kann manchmal durch ungenaue oder nicht eindeutige Beschreibungen beeinflusst werden.

Obwohl dein Prompt spezifisch weibliche Figuren anfragt, könnte die Beschreibung von „mittelalterlichen Kriegern“ mit „breiten Hüften und muskulösen Armen“ in Verbindung mit der Ritterrüstung oder physischen Aktivität wie dem Tragen schwerer Kisten DALL-E in die Irre führen, da diese Attribute traditionell sowohl mit männlichen als auch weiblichen Figuren assoziiert werden können.

Um die Wahrscheinlichkeit zu erhöhen, dass beide Figuren eindeutig als Frauen erkannt werden, könntest du folgende Anpassungen vornehmen:

  1. Verstärke die Geschlechtsspezifikation: Mache es noch klarer, dass beide Figuren weiblich sind, indem du beispielsweise hinzufügst, dass sie „weibliche Kriegerinnen“ oder „Frauen“ sind.
  2. Beschreibe traditionell feminine Merkmale: Während du die körperliche Stärke der Figuren betonst, könntest du auch traditionell als feminin wahrgenommene Merkmale oder Details einbeziehen, die zur visuellen Identifikation beitragen, ohne dabei stereotype Darstellungen zu fördern.
  3. Vermeide Missverständnisse: Begriffe wie „Krieger“ könnten mit männlichen Figuren assoziiert werden. Die Verwendung von „Kriegerinnen“ könnte hier helfen.

Ein überarbeiteter Prompt könnte also lauten:

„Ein Paar von zwei fleißigen, lächelnden 60-jährigen vollschlanken Frauen, gekleidet in Ritterrüstungen, mit breiten Hüften und muskulösen Armen, sowie langen, zerzausten, grauen Haaren. Sie tragen große Kartons, die mit Büchern aller Genres überquellen, in ein kleines Wohnzimmer voller Kisten und Bücherregale. Die Szene sollte beide Charaktere als Frauen darstellen, die so realistisch und natürlich aussehen, als wären sie auf einem Foto abgebildet, mit Gesichtern, die realistisch, sympathisch und ohne Übertreibung erscheinen. Stelle sicher, dass beide Figuren eindeutig als Frauen erkennbar sind, ähnlich realen Personen, denen man begegnen könnte. Das Licht sollte warm sein, ähnlich der goldenen Stunde, mit fotorealistischen, anatomisch korrekten Händen und vielen Details in der Umgebung und den Requisiten.“

Diese Anpassungen sollten dazu beitragen, dass DALL-E die gewünschte Darstellung genauer erfasst und umsetzt.

 

Jana: (Das kann jetzt nicht mehr schief gehen! Die KI hat selbst alles perfekt vorbereitet.)

An ChatGPT: Bitte probiere doch diesen Prompt einmal für mich aus.

Jana: (🤣😭😜 Ich kann nicht mehr. Für heute bin ich durch.)

 

Bilder erstellen mit Midjourney

Ein anderer Tag.

Ich möchte einen weiteren Versuch wagen.

Die dritte bekannte KI zum Erstellen von Bildern ist Midjourney. Ich habe sie für einen Monat gebucht, kenne mich aber noch nicht besonders gut aus. Den Prompt mit den Umzugshelferinnen / Ritterinnen möchte ich trotzdem mal probieren und gebe ihn ein.

Die Nutzerin erhält hier immer gleich vier Bilder zur Auswahl.

Erster Versuch:

Wow. Das sieht ziemlich nach Harry Potter aus. Und die Damen hochbetagt und teils ein bisschen gruselig.

Welches dieser Bilder gefällt dir am besten?

Ich habe mal das vierte gewählt. Zwar lächeln sie nun wirklich nicht, aber die Bücher sind wirklich liebevoll gemacht. Und von diesem vierten habe ich mir vier Variationen erstellen lassen:

Wir sind jetzt eindeutig bei Herrn der Ringe gelandet, die Damen im ersten Bild sind wohl Orkladies. Schon ziemlich cool, aber auch recht unheimlich. Ein leichter Vibe von merkwürdigen Zwischenwelten.
 
Ich ändere einmal den Prompt ein bisschen und sage, dass ich die Damen 50-jährig haben möchte.
 
 
😂🤦‍♀️
Ich schmeiß mich weg.
Es ist wirklich sehr kreativ! Diese Riesinnen in Bikinis. Und diese verschrobenen Gesichter. 50-jährig?!
Es wird zunehmend grenzwertig.
Wie kommt die KI nur darauf, solche krassen Gestalten zu designen?
 
Ich mache weitere Versuche und wähle daraus ein Bild, das mir mit am besten gefällt.
Ist es nicht hübsch, wie liebevoll die Kartons mit Klebeband zusammengehalten werden? Und das Glasfenster, entzückend.
Hier wirklich lächelnde Ritterinnen, offenbar gut gelaunt bei der Arbeit.
 
Was ich außerdem an der KI mag: So vorurteilslos. Es macht ihr nichts aus, Ritterinnen mit Umzugskartons zu gestalten. Mit dieser Grafik könnte ich jetzt weitermachen, bis ich zum Beispiel die perfekte Buchillustration habe.
 
Eine Variation später bin ich irgendwie hier gelandet:
Das hat was von Carl Spitzweg. Wunderbare Details, nicht alle so ganz schlüssig. Und auch keine Ritterinnen.
 
Aber dabei lasse ich es für heute.
 
Worum es hier eigentlich geht: Herausfinden, mit welchen Prompts es möglich wird, innere Bildwelten im Außen umzusetzen. Noch nie waren wir dem so nah wie heute.
 
Der Weg dorthin mit Experimentierfreude, Langmut – und amüsanten Zwischenstufen.
 
Beste Grüße von
Jana
 

Weitere Artikel zu / mit KI

 

One Reply to “Ritterinnen beim Umzug: Bilder erstellen mit KI, eine tiefgründige Reise und lustige Ergebnisse”

  1. Ich schmeiß mich weg. Midjourney ist wirklich sehr künstlerisch-illustrativ unterwegs und hat offensichtlich noch andere Wesen als einfach nur Männer zum Kisten-Schleppen im Angebot.

    Vielleicht solltest du bei Dall-E zur noch besseren Verständlichkeit „Ritterrinnenrüstunginnen“ schreiben?

    Höchst vergnüglich, diese KI-Bildexperimente. Sie sind nicht nur ideal für zu viel Zeit, sondern helfen auch gegen zu viel leeren Speicherplatz auf der Festplatte.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert