Dall-E entdecken: Text-to-Image Generierung mit KI

Letzte Aktualisierung 18.10.2023

DALL-E und der Nachfolger DALL-E 2 ist eine von OpenAI entwickelte künstliche Intelligenz (KI), die in wenigen Sekunden Bilder generieren kann. Dieser Blog-Artikel wird dir näher bringen, was DALL-E eigentlich ist, wie dieses Tool funktioniert und auf welche Weise man es nutzen kann.

Einführung in DALL-E

Der Begriff „DALL-E“ bezeichnet eine von OpenAI entwickelte Software, die Textanweisungen in bildliche Darstellungen umwandelt. Der Name ist eine Kombination aus Elementen des Surrealisten Dalí und dem Filmtitel „WALL-E“ von Pixar.

Das System nutzt ein neuronales Netzwerk, um mittels künstlicher Intelligenz Textvorgaben in neue Bildinhalte zu verwandeln. Diese Technologie wurde erstmals im Januar 2021 von OpenAI vorgestellt. Die verbesserte Version „DALL-E 2“ ist in der Lage, eine größere Anzahl von Bildern in höherer Auflösung zu generieren und die erstellten Bilder nachträglich zu bearbeiten.

© OpenAIDALLE

Wie meldet man sich an?

Bevor du DALL-E verwenden kannst, ist ein Login bei OpenAI erforderlich. Falls du bereits ein Konto hast, beispielsweise für die Nutzung von Chat-GPT, ist es nicht notwendig, ein neues anzulegen. Falls Du dies noch nicht hast, kannst Du in folgendem Beitrag: ChatGPT-Anleitung: So meldest du dich kostenlos an, nachlesen, wie Du Dich anmelden kannst.

Ist DALL-E kostenlos?

Kostenlose Guthaben wurden an Neuanmeldungen vergeben, die sich vor dem 6. April 2023 für die Nutzung angemeldet haben. Inzwischen wird bei Anmeldung eine Aufladung benötigt, damit Du DALL-E nutzen kannst. Mittels Kreditkarte kannst Du Dir schnell die benötigten Credits aufladen. Weitere Infos dazu findest Du hier: https://help.openai.com/en/articles/6399305-how-dall-e-credits-work

Wie funktioniert es denn nun?

Die Funktionsweise basiert auf einem komplexen neuronalen Netzwerk, das als Artificial Intelligence fungiert. Dieses Netzwerk wurde durch maschinelles Lernen dazu trainiert, Textanweisungen in visuelle Darstellungen umzusetzen. Der Prozess beginnt mit der Texteingabe in das DALL-E-System in Form einer Anweisung oder eines Satzes.

DALL-E Bilder mit Otter
© OpenAIDALLE

Das Netzwerk analysiert den eingegebenen Text und versucht, ein Verständnis der darin beschriebenen Ideen und Details zu entwickeln. Anschließend nutzt es diese Informationen, um Bildinhalte zu generieren, die auf den gegebenen Anweisungen basieren. Dieser Vorgang umfasst die Kombination visueller Elemente, Farben, Formen und Strukturen, um ein Bild zu erzeugen, das der Beschreibung im Text entspricht. Das Besondere an DALL-E ist seine Fähigkeit, kreative und oft überraschende Interpretationen der Texteingabe zu liefern. Zum Beispiel kann es Tiere in unerwarteten Umgebungen darstellen oder Dinge so kombinieren, dass sie dem menschlichen Auge unkonventionell erscheinen.

Hier nochmal kurz und knapp zusammengefasst, wie Du vorgehen solltest:

  • In dem Textfeld eine Beschreibung einfügen, was du genau erhalten möchtest. Je mehr Vorgaben Du gibst, umso genauer wird das Ergebnis. Die besten Ergebnisse werden übrigens in Englisch erzielt, aber DALL-E versteht auch Vorgaben in Deutsch.
  • Du kannst auch ein eigenes Foto/Bild hochladen und dieses verändern lassen.
  • Generierung starten
  • Beispielbilder bewundern 🙂

Falls Du mit den Bilder nicht zufrieden bist, kannst Du sie nachträglich weiter verändern. Dazu einfach per Rechtsklick auf die drei Punkte und dort „Edit“ auswählen. Danach kannst du mit den vorgebenen Tools das Bild nach Deinen Wünschen anpassen.

In welchen Bereichen könnte man DALL-E einsetzen? 

  1. Kreative Anwendungen: DALL-E kann in Werbung, Design und Content-Erstellung genutzt werden, um ansprechende Bilder zu generieren.
  2. Bildung und Forschung: Die Technologie kann Bildungsmaterialien visuell aufwerten.
  3. Entertainment: DALL-E könnte visuelle Effekte in Filmen, Animationen und Videospielen bereichern.
  4. Künstlerische Inspiration: Kreative können die generierten Bilder als Grundlage für eigene Werke nutzen.

Mögliche Stilrichtungen die Du verwenden kannst:

Hier möchten wir Dir einige mögliche Stilrichtungen und Vorgaben nennen, die Du für die Erstellung deiner Fotos verwenden kannst. Das Ergebnis wird sich dadurch immer verändern.

  • Portrait, Digital Art, Cartoon, 3D Rendering, Oil Painting, Watercolor, Stained Glass, Handdrawn Sketch, Abstract Expressionism, Abstract Illusion, Cinematic, Collage Art, Cartographic Art, Cartoon, Childrens Book Illustration und so weiter
  • Banksy, Andy Warhol, Conrad Roset, Craig Mullins, Da Vinci, Picasso, Ellen Jewett, Akira Toriyama, Anna Dittmann und wer Dir eben noch so einfällt
  • Cyberpunk, Sci-Fi, Modern, Neon, Realstic, 3D Rendering,
  • Orte und Wahrzeichen

Mein erstellter Hase kann sich doch sehen lassen: Ich habe folgende Eingaben gemacht: Ein Hase, Analytical Cubism, Cai Guo Qiang, Light painting, DarkOrange, Goth Punk

Wie Du daran sehen kannst, sind Deiner Fantasie wirklich keine Grenzen gesetzt. Falls Dir Ideen oder Eingabemöglichkeiten fehlen, kannst Du auch Chat-GPT fragen oder folgenden Prompt-Generator nutzen: https://tipseason.com/dalle-prompt-generator

Kleiner Tipp

Der Bing Image Creator greift auch auf DALL-E zu und darüber kann das Tool kostenlos genutzt werden, allerdings eingeschränkt und nicht vollständig nutzbar. Aber für einen kleinen Blick und zum testen ist es allemal ausreichend.

Trotz des Potenzials müssen ethische Aspekte, Urheberrechte und Datenschutz beachtet werden. Aber DALL-E zeigt eindrucksvoll, wie KI unsere Interaktion mit visuellen Inhalten neu gestalten kann.

Wir freuen uns auf Deinen Kommentar oder auch Anmerkungen. Nutzt Du solche Anwendungen schon? 

Vielleicht interessiert Dich auch folgendes?

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Nach oben scrollen