Text-to-Image
Auch bekannt als: T2I, Bildgenerierung aus Text
Text-to-Image erzeugt ein Bild aus einer Textbeschreibung. Du schreibst, was du sehen willst, das Modell generiert es. Die Grundfunktion aller Bildgeneratoren von Midjourney bis Flux.
Die einfachste Form der Bildgenerierung: Text rein, Bild raus. "Ein Porträt einer älteren Frau in warmem Seitenlicht, dokumentarischer Stil" wird zu einem Bild.
Was die Qualität bestimmt
Nicht die Länge des Prompts, sondern die Präzision. Spezifische visuelle Konzepte (Lichtstimmung, Perspektive, Stil) steuern besser als allgemeine Adjektive ("schön", "detailliert").
Die Entwicklung
Vor zwei Jahren waren Hände ein Problem. Heute produzieren aktuelle Modelle fotorealistische Ergebnisse, die ohne Expertise kaum von Fotos zu unterscheiden sind. Die Geschwindigkeit der Verbesserung ist bemerkenswert.