Diffusion-Modell

Definition

Diffusion-Modelle sind eine Klasse generativer Modelle, die Bilder erzeugen, indem sie schrittweise zufälliges Rauschen in ein kohärentes Bild umwandeln. Im Training lernt das Modell den umgekehrten Prozess: Wie man aus einem verrauschten Bild das Originalbild rekonstruiert. Bei der Generierung startet das Modell mit reinem Rauschen und entfernt es Schritt für Schritt, gesteuert durch einen Text-Prompt. Diese Architektur ist die Grundlage von DALL-E 3, Midjourney, Stable Diffusion und FLUX. Diffusion-Modelle haben 2023–2024 die Bildgenerierung revolutioniert und liefern fotorealistische Ergebnisse aus Textbeschreibungen.

Definition

Verwandte Begriffe