schon wieder ist eine Woche um und die KI-Welt kennt keine Ferien. Zumindest bist jetzt nicht. Schnap dir etwas leckers zu trinken und los gehts:
Elvenlabs bringt die Stimmen von Judy Garland, James Dean, Burt Reynolds und Sir Laurence Olivier zurück. Schon letzte Woche haben wir über die Möglichkeit berichtet, sich Nachrichten vorlesen zu lassen. Wir können also davon ausgehen, dass weitere Stimmen hinzukommen werden. Welche Stimme würdest du gerne hören?
Quelle: Elvenlabs - Iconic Voices
Störende Hintergrundgeräusche sollen der Vergangenheit angehören. Mit dem Voice Isolator sollen sich Stimmen kristallklar anhören. Schaut mal in das Werbevideo rein, der verwendete Laubbläser ist wirklich weg. Mal sehen, wann diese Technik auf dem Handy läuft.
Quelle: Elvenlabs - Voice Isolator
Das KI-Forschungslabor Kyutai in Paris hat ein Sprachmodell namens Moshi vorgestellt. Mit Moshi kann man sich in Echtzeit unterhalten. Im Gegensatz zu den Ankündigungen von OpenAI ist diese Technologie schon verfügbar und kann von jedem ausprobiert werden. Zudem ist sie Open Source und kann in anderen Anwendungen verwendet werden.
Quelle: Moshi - Real Time Chat
Quelle: YouTube - Moshi Livestream
Mit InternLM 2.5 gibt es das erste Open Source LLM mit einem Kontextfenster von 1 Million Tokens. Was vor ein paar Monaten noch großes Thema war, scheint jetzt für viele Anwendungsfälle gelöst zu sein.
Quelle: X (ehem. Twitter) - InternLM 2.5
Perplexity stellt mit Pro Search seine verbesserte Suche vor. Unter anderem soll diese in der Lage sein, eine mehrstufige Argumentation aufzubauen und selbst einen Plan zur Beantwortung der Frage zu erstellen. Die Integration von Wolfram Alpha soll bei mathematischen Fragestellungen helfen.
Quelle: Perplexity - Pro Search
Figma reiht sich in die Liste von Firmen ein, die ihre Nutzungsbedingungen im Hinblick auf KI ändern. Wenn man nicht widerspricht, dürfen alle Inhalte, die man dort erstellt hat, für das Training von KI-Modellen verwendet werden. Wäre ein Opt-in nicht besser?
Quelle: Stackdiary - Figma und KI-Content
YouTube ändert ebenfalls seine Richtlinien. Es ist nun möglich, Inhalte entfernen zu lassen, die KI-generiert sind und deine Stimme oder dein Aussehen imitieren. Vormals konnten nur gestohlene Inhalte entfernt werden.
Quelle: TechCrunch - YouTube KI-Richtlinien
Wie schwierig der Umgang mit KI noch wird, zeigt sich z.B. bei Instagram. Hier wurde vor einiger Zeit das Label "Made with AI" eingeführt. Es betrifft aber auch Bilder, die z.B. mit Photoshop verändert wurden und bei denen KI-Filter verwendet wurden. Nach Beschwerden der Fotografen heißt das Label nun "AI Info".
Quelle: The Verge - Meta Instagram AI Info Label
Elon Musk hat auf X angekündigt, dass die nächste Version des eigenen LLMs im August erscheinen wird. Ob sich Grok 2 an die Spitze der Charts setzen kann, bleibt abzuwarten.
Quelle: Coinspeaker - Grok 2 von Elon Musk
Forscher an der Ruhr-Universität haben zusammen mit Kollegen eine KI entwickelt, die Lügen in Texten und Aussagen besser als Menschen erkennen kann. Allerdings führt diese Technologie nicht nur zu mehr Vertrauen, sondern kann es auch zerstören.
Quelle: IDW - KI und Lügen erkennen
Laut der New York Times fand der Einbruch in die Systeme von OpenAI schon im Frühjahr 2023 statt. Die Hacker hatten wohl keinen Zugriff auf die KI-Systeme oder Kundendaten.
Quelle: NY Times - Einbruch bei OpenAI
Das Forschungsteam von Salesforce zeigt, dass kleine Sprachmodelle besser oder gleichwertig zu weitaus größeren Modellen sein können.
Quelle: VentureBeat - Salesforce und kleine KI-Modelle
Das war es für diese Woche. Welche Stimme würdest du gerne öfters hören oder mit welchen schon verstorbenen Menschen würdest du dich gerne noch einmal unterhalten?
Hab noch eine gute Woche und bleib Neugierig,