AI Breakdown der trio-group

AI Breakdown | KW 49, 2024 – Persönlich, Bilder und Schach matt

Geschrieben von trio-group | Dezember 2024

Persönlich, Bilder und Schach matt!

Wir wagen mal wieder den Blick über den Tellerrand hinein in die Welt der KI. Auch kurz vor der ruhigeren Weihnachtszeit bleibt es spannend in der KI-Welt.

Shutdown: OpenAI arbeitet weiterhin an Sora einem Text zu Video Generator. Einige wenige Tester haben schon vorab Zugang. Nachdem jemand aus dieser Testergruppe den Zugang öffentlich gemacht hatte, wurde allen Tester der Zugang wieder entzogen. Die in der Zeit generierten Videos findet man immer noch. https://huggingface.co/spaces/PR-Puppets/PR-Puppet-Sora https://www.engadget.com/deals/the-best-cyber-monday-tech-deals-worth-your-money-from-amazon-target-walmart-best-buy-apple-and-others-173752685.html https://x.com/AICentral_/status/1861682902406426723

Charaktere aus Bildern: weiter ist da schon Luma AI. Mit dem neuesten Update kann man unter anderem Charaktere aus Bildern für weitere Videos nutzen. https://venturebeat.com/ai/luma-expands-dream-machine-ai-video-model-into-full-creative-platform-mobile-app/

Videos vergrößern: Mit Runway kann man nun Videos in ein neues Seitenverhältnis umwandeln und fehlende Bereiche mit der KI berechnen lassen. Ebenso bietet Runway jetzt einen eigenen Text-zu-Bild-Generator an. https://x.com/runwayml/status/1860074950167818617 https://runwayml.com/research/introducing-frames

Kontrolle: Mit dem Update 3.5 Large von Stable Diffusion gibt es jetzt mehr Kontrolle für die Erstellung der eigenen Bildern. Mit Kontrollnetzen lassen sich die Struktur der Bilder besser steuern oder verändern. https://stability.ai/news/sd3-5-large-controlnets

Matt: Schon einmal von einer Schokoladendame Schach gesetzt worden? Einem Zepelin oder einer Blume? Nein? Mit Googles GenChess könnt Ihr Euch einfach Eure eigenen Schachfiguren erstellen und eine virtuelle Partie wagen. https://x.com/Googlelabs/status/1861447589604008087 (Leider bisher nicht in Deutschland verfügbar)

Podcast: Auch die kostenlose App von ElvenLabs "ElevenReader" kann jetzt aus Euren Inhalten wie PDF, Text oder News einen individuellen Podcast erstellen. 32 Sprachen werden derzeit unterstützt. https://elevenlabs.io/blog/genfm-on-elevenreader

3D: Eine Forschungsarbeit von NVIDIA zeigt den Weg auf wie aus zweidimensionalen Bildern 3D-Modelle werden. Dabei greifen verschiedene KI-Modelle ineinander um diese zu erzeugen. https://research.nvidia.com/labs/dir/edify-3d/

Kontext: Claude von Anthropic erlaubt es jetzt mittels der API die Daten aus Eurer Firma direkt dem Sprachmodell zur Verfügung zustellen. Die Anbindung soll über das Open Source "Model Context Protocol" ermöglicht werden und einen standardisierten Austausch ermöglichen. https://www.anthropic.com/news/model-context-protocol

Persönlich: Mache Ergebnisse der Sprachmodelle wirken generisch und wenig wie von uns selbst geschrieben. Um mehr den persönlichen Stil zu treffen, kann man Claude nun mit eigenen Textbeispielen versorgen, aus denen dann der eigene Stil extrahiert wird. https://www.anthropic.com/news/styles

Vertrauen: Letzte Woche haben wir noch darüber berichtet, dass Amazon eine weitere Milliarde Dollar in Anthropic investiert. Ganz alleine auf Anthropic verlässt sich Amazon beim Thema KI aber nicht. So stellte Amazon ein eigenes Modell vor, welches Bilder und Videos analysieren kann. https://www.theinformation.com/articles/amazon-develops-video-ai-model-hedging-its-reliance-on-anthropic

Entführung: Auf dem Video ist ein kleiner Roboter zu sehen, dem schlussendlich andere größere Roboter folgen. Dabei handelte es sich um einen Sicherheitstest, der aufzeigte, dass KI-gestützte Roboter angreifbar sind. So hatte der kleine Roboter lediglich gesagt, dass Sie ihm nach Hause folgen sollten. https://interestingengineering.com/innovation/ai-robot-kidnaps-12-robots-in-shanghai

Experten: In einer Studie der Universität von London schnitten KI-Modelle besser als menschliche Experten ab. Mit dem Tool „BrainBench“ wurde die Fähigkeit von 15 KI-Modellen und 171 Neurowissenschaftlern getestet, echte von gefälschten Ergebnissen in Forschungszusammenfassungen zu unterscheiden. Die KI-Modelle erreichten eine Genauigkeit von 81 % gegenüber 63 % bei den Experten - wobei ein auf neurowissenschaftliche Arbeiten trainiertes „BrainGPT“ mit 86 % sogar noch besser abschnitt. https://www.nature.com/articles/s41562-024-02046-9

Ob Experte oder nicht, schön, dass Du Dich weiterhin für KI und diesen Newsletter interessierst.

In diesem Sinne bleibt Neugierig und bis nächste Woche