In der Nacht auf den 16.02. hat OpenAI neue KI vorgestellt. Der Name: Sora
Sora, das wegweisende KI-Modell von OpenAI, nutzt eine Diffusionsarchitektur, um aus Textanweisungen hochrealistische Videosequenzen zu generieren.
Durch den schrittweisen Prozess der Rauschentfernung wird die Transformation von statischem Rauschen zu einer detaillierten Szene ermöglicht. Mit einer Transformer-Architektur und der Verwendung von Patch-Units zur Repräsentation von Videos und Bildern erreicht Sora überlegene Skalierung und Vielseitigkeit in der visuellen Generierung. Durch den Einsatz der Recaptioning-Technik aus DALL·E 3 kann das Modell genaue und treue Interpretationen der vom Benutzer angegebenen Textanweisungen liefern. Sora ist in der Lage, aus einem statischen Bild ein animiertes Video zu erstellen und sogar fehlende Frames in vorhandenen Videos zu ergänzen. Neben der Generierung von Videos aus reinen Textanweisungen unterstützt Sora auch die Bearbeitung von vorhandenen Bildern und Videos für erweiterte Anwendungen. Entdecken Sie die innovative Welt der visuellen Forschung und Kreation mit Sora von OpenAI.
Weitere Informationen zu Sora
Thomas Dahlhaus
Senior Projektmanager bei avency