#OpenAI hat kürzlich Sora, ein neues Text-zu-Video-Modell, vorgestellt, das auf dem Fortschritt von DALL·E und GPT-Modellen aufbaut.
Sora verwendet die Recaptions-Technik von DALL-E 3, um hochdeskriptive Bildunterschriften für Trainingsdaten zu erstellen. Obwohl Sora beeindruckende Ergebnisse liefert, erkennt OpenAI an, dass es noch Verbesserungsbedarf gibt, insbesondere bei der Interpretation von Inhalten. Das Modell kann bis zu 60-sekündige Videos erstellen und ermöglicht die Definition von Kamerabewegungen per Prompt. OpenAI arbeitet zudem mit Experten für Fehlinformation, hasserfüllte Inhalte und Voreingenommenheit zusammen, um Sicherheitsaspekte zu stärken.
Kommentare sind geschlossen