AI Breakdown der trio-group

AI-Breakdown | KW 20, 2024 – OpenAI Spring Update: Omni, 4 Millionen Token

Geschrieben von trio-group | November 2024

Guten Morgen liebe KI-Enthusiasten,

spannende Zeiten in der KI-Welt! 

Erst sieht nach einer ruhigen Woche aus, aber dann kündigte OpenAI für Montagabend Ihr "Spring Update" an. 

OpenAI stellt ChatGPT-4o vor

Das kleine „o“ steht für Omni und bedeutet, dass ChatGPT-4o nativ Text, Audio und Video verarbeiten kann. Wer möchte, kann sich die kurze Präsentation selbst anschauen (ca. 26 Minuten, englisch, mit Untertiteln):
Quelle: YouTube - Präsentation von ChatGPT-4o

Hier die wichtigsten Neuerungen:

  • Das Modell wird für alle verfügbar sein (kostenlos und Premium)
  • Verdoppelte Geschwindigkeit
  • Echtzeitgespräche mit einer Latenz von ca. 320 Millisekunden, was einer menschlichen Konversation entspricht
  • Erkennung von Emotionen sowie die Möglichkeit, in der Stimmausgabe die Tonalität zu verändern
  • Desktop-App für ChatGPT

Das Modell wird in den nächsten Wochen schrittweise allen Nutzern zur Verfügung gestellt. Wir nähern uns damit immer mehr dem persönlichen Assistenten. Ich konnte Omni schon ausprobieren, und es macht sehr viel Spaß.

AlphaFold 3 von Google DeepMind

Google's DeepMind hat AlphaFold 3 vorgestellt! Diese KI kann die Strukturen von Proteinen, DNA und RNA vorhersagen. CEO Demis Hassabis erwartet, dass wir die ersten mit KI erstellten Medikamente in wenigen Jahren in klinischen Studien sehen werden.
Quelle: Google Blog - AlphaFold 3
Quelle: YouTube - AlphaFold 3 Erklärung

Microsofts KI-Entwicklungen: MAI-1

Mustafa Suleyman, der zu Microsoft AI gewechselt ist, arbeitet an MAI-1, einem LLM mit 500 Milliarden Parametern. Microsoft setzt auf Vielfalt in der KI-Entwicklung.
Quelle: Ars Technica - Microsofts MAI-1

Partnerschaft zwischen OpenAI und Stack Overflow

OpenAI und Stack Overflow arbeiten zusammen, was in der Community nicht überall gut ankommt. Einige Nutzer versuchen, ihre Beiträge zu löschen – ohne Erfolg. Wem gehören die Beiträge? Dem Nutzer oder der Plattform?
Quelle: Stack Overflow - OpenAI Partnerschaft
Quelle: Twitter - nixcraft zur Partnerschaft

4 Millionen Token Kontextfenster

Gradient AI sprengt die Grenzen mit einem 4 Millionen Token Kontextfenster. Das ist so, als würde man dreimal die Harry-Potter-Serie durch einen KI-Filter schicken.
Quelle: Twitter - Gradient AI Kontextfenster

Sora Inpainting-Funktion

Sora kann jetzt Charaktere in Videos austauschen, ohne die Szene zu verändern. Wie cool ist das? Ein Mann, eine Frau, ein Roboter – wähle deinen Darsteller!
Quelle: Twitter - ShaunRalston zur Sora Inpainting-Funktion

11 Labs Musikgenerierung

11 Labs erweckt Musik mit nur einem Textbefehl zum Leben. Stell dir vor, du tippst etwas ein und bekommst einen Song, der klingt wie Tom Petty! 🎤🎶

Das war es für diese Woche. Uns stehen viele Neuerungen bevor. In den nächsten Wochen werden unter anderem Apple und Google auf Ihren Entwicklerkonferenzen viele Neuigkeiten präsentieren. Ich bin sehr gespannt und freue mich darauf, dir davon zu berichten.

Hab bis dahin eine gute Zeit und bleib Neugierig!