KI-Konzepte lernen | Interaktiver Leitfaden

Was sind Diffusionsmodelle?

Diffusionsmodelle lernen, einen schrittweisen Korruptionsprozess umzukehren. Im Training werden Daten nach und nach verrauscht; bei der Generierung sagt das Modell Entrauschungsschritte voraus, bis wieder Struktur entsteht.

Die Kernintuition

Generierung ist iterative Verfeinerung. Statt die ganze Ausgabe in einem Schritt zu erzeugen, verbessert das Modell wiederholt einen verrauschten Zustand und erreicht so oft stabile, hochwertige Samples.

Text-Diffusion

Arbeitet auf maskierten Token-Sequenzen und verfeinert Token-Schätzungen iterativ mit denoising-ähnlichen Updates.

Bild-Diffusion

Arbeitet auf latenten Bildrepräsentationen und entrauscht sie zu konsistenten Bildern, gesteürt durch Textbedingungen.

Lernpfad

Folge dieser Reihenfolge, um Intuition von den Grundlagen bis zu modalitiespezifischen Systemen aufzubaün.

Was sind Diffusionsmodelle?

Die Kernintuition

Text-Diffusion

Bild-Diffusion

Lernpfad

Wie Diffusion funktioniert

Text-Diffusion

Bild-Diffusion