Hallo liebe schwitzende KI-Enthusiasten,
ich hoffe, du sitzt gerade in einem kühlen Büro oder hast ein kaltes Getränk vor dir. Wir blicken zurück auf eine spannende Woche voller neuer Themen. Schnapp dir ein paar Eiswürfel und dann ran an die News.
Ich freue mich jedes Jahr auf die Erdbeerzeit. Wer aktuell viel über Erdbeeren auf sozialen Netzwerken liest, könnte etwas verwirrt sein. Grund für die vielen Erdbeeren ist unter anderem, dass OpenAI ihr neuestes Projekt mit dem Codenamen Strawberry, also Erdbeere, versehen hat. Das nehmen einige zum Anlass, um darüber zu spekulieren, ob ein Bild von Sam Altman, dem Chef von OpenAI, das seine Erdbeerpflanze zeigt, vielleicht ein Hinweis ist.
Quelle: X (ehem. Twitter) - Sam Altman über seine Erdbeerpflanze
Quelle: X (ehem. Twitter) - Spekulationen zu Strawberry
Das Äquivalent zu einem Menschenleben solle Nvidia täglich an Videos heruntergeladen haben. Damit trainiert Nvidia ihre KI-Modelle. Wir reden hier von über 600.000 Stunden Videomaterial, jeden Tag!
Quelle: 404 Media - Nvidia AI Scraping Cosmos Project
Aktuell machen viele Bilder von Sprechern für verschiedene Veranstaltungen wie TED oder einem Google Event die Runde. Das Spannende: Weder die Sprecher noch die Veranstaltungen gibt es. Das erst kürzlich vorgestellte Text-zu-Bilder-Modell Flux ermöglicht täuschend echte Bilder. Hättest du es erkannt, wenn du es nicht gewusst hättest?
Quelle: X (ehem. Twitter) - Trending mit Flux
Quelle: Reddit - Flux und die neue Bildqualität
OpenAI hat, laut internen Berichten, schon festgestellt, dass sich Menschen dem neuen Sprachmodell sehr nahe fühlen können. Vergleiche zum Film Her, wo sich der Protagonist in die KI verliebt, mit der er nur per Stimme kommuniziert, liegen hier nahe. Da das Modell weiterhin nur wenigen Menschen zur Verfügung steht, warten wir noch auf eine unabhängige Bestätigung.
Quelle: Wired - OpenAI Voice Mode Emotional Attachment
Ein wichtiger Aspekt bei KI-Modellen ist die Sicherheit der Anwendungen. OpenAI hat ein sehr ausführliches Werk vorgestellt, die System Card, in welchem beschrieben wird, welche Maßnahmen für die Sicherheit ergriffen wurden. Ebenfalls ist dort eine Kategorisierung der Risiken erfolgt. Laut eigenen Angaben geht von dem neuesten Modell GPT-4o ein mittleres Risiko aus. Gleichzeitig hat Anthropic ihr erweitertes Bug-Bounty-Programm vorgestellt. Bis zu 15.000 $ werden ausgelobt, wer einen Fehler findet.
Quelle: Anthropic - Model Safety Bug Bounty
Quelle: OpenAI - GPT-4o System Card
Quelle: The Verge - OpenAI Safety Assessment GPT-4o
Gleich zweimal stellt Amazon eine neue KI-Suche für das einfachere Finden von Audioinhalten vor. Amazon Music und Audible erhalten beide eine verbesserte Suche. Inwieweit die Vorschläge besser sind als die aktuellen Empfehlungen, werden wir alle gemeinsam herausfinden.
Quelle: About Amazon - New Topics AI Feature for Podcasts
Quelle: TechCrunch - Audible AI-powered Search Feature
Google integriert die Gemini-KI in Google TV-Streamer. So soll der Fernseher und später natürlich auch das Haus wirklich smart werden. Ob Zusammenfassungen von Inhalten und persönliche Empfehlungen den persönlichen Geschmack treffen, bleibt abzuwarten. Gleichzeitig werden viel mehr Menschen mit KI in Kontakt kommen.
Quelle: The Fast Mode - Google Unveils New Gemini AI-Powered TV Streamer
Google DeepMind Team hat einen neuen Roboter entworfen, der so ziemlich jeden Tischtennis-Amateur schlagen kann. Die Entscheidungen trifft der Roboter nicht nach einem vorgegebenen Muster, sondern situationsabhängig mittels KI. Für mich bräuchte die KI auf jeden Fall ein Verständnis, wann ich mal gewinnen sollte, um nicht die Lust am Spiel zu verlieren.
Quelle: X (ehem. Twitter) - TechCrunch über Tischtennisroboter
Automattic, die Firma hinter wordpress.com, hat einen KI-gestützten Schreibassistenten veröffentlicht. Damit erhalten Millionen von Blogs einen KI-Zugang.
Quelle: TechCrunch - Automattic Launches AI Writing Tool
Mit Qwen2-Math haben chinesische Forscher ein Modell vorgestellt, welches einen besonderen Fokus auf Mathematik legt. Das Modell soll Fragen zu diesen Themen besser und korrekter beantworten als andere Modelle. Wann KI-Modelle den Taschenrechner ersetzen können, ist nicht klar.
Quelle: Qwen - Qwen2-Math Blog
Anscheinend nutzen einige die Sommerpause nicht nur zum Ausspannen, sondern auch zum Wechsel des Arbeitgebers. Character.ai-Gründer Noam Shazeer wechselt zurück zu Google. Zico Kolter von der Carnegie Mellon University gehört ab jetzt zum Board von OpenAI, mit dem Fokus auf Sicherheit. Greg Brockmann, einer der Gründer von OpenAI, verlässt das Unternehmen nach 9 Jahren.
Quelle: TechCrunch - Character.ai CEO Returns to Google
Quelle: OpenAI - Zico Kolter Joins Board
Quelle: X (ehem. Twitter) - Greg Brockmann verlässt OpenAI
Auch wenn es um tiefe Technik geht, APIs bestimmen viele Dienste unseres Alltags. Umso wichtiger, dass OpenAI strukturierte Outputs für die Ergebnisse der KI-Modelle für Entwickler bereitstellt. Jeder, der mit den Modellen aus technischer Sicht arbeitet, hat so das Leben leichter.
Quelle: OpenAI - Structured Outputs in the API
Während gerade ziemlich heiße Tage in Deutschland sind und wir uns auf die Abkühlung freuen, glaube ich an einen heißen Endspurt, was die Themen rund um KI angeht. Aktuell gibt es viele Gerüchte und vieles, was angekündigt wurde, darf noch erscheinen.
Bis dahin, bleibt neugierig und behaltet einen kühlen Kopf.