AI-Breakdown | KW 13, 2025 – NVIDIA, Websuche & APIs | trio-group

24.03.2025

4 Min. Lesedauer

NVIDIA GTC: KI für Unternehmen und Automotive

Großer Auftritt von Jensen Huang: Die GTC-Keynote fand in einer riesigen Arena statt und gab vorwiegend Einblicke in Enterprise-Lösungen.

AI in Wireless & Automotive: Nvidia setzt zunehmend auf KI-basierte Optimierung in drahtlosen Netzwerken und im Automobilsektor (z. B. Partnerschaft mit General Motors und Volvo). https://blogs.nvidia.com/blog/auto-ecosystem-physical-ai/ https://blogs.nvidia.com/blog/aerial-telecom-research/

Open-Source-Datensatz: Für Robotik und autonome Fahr-Entwicklung stellt Nvidia neue offene Datensätze bereit, um Forschung und Entwicklung zu beschleunigen. https://blogs.nvidia.com/blog/open-physical-ai-dataset/

Google AI: Neue Canvas-Ansicht und Forschungsmodelle

Canvas in Gemini: Ähnlich wie bei ChatGPT können User nun Code und Texte in separaten Fenstern bearbeiten oder ansehen. https://blog.google/products/gemini/gemini-collaboration-features/

Mindmaps in Notebook LM: Eine visuelle Übersichtsfunktion fasst komplexe Themen zu „Mindmaps“ zusammen – ideal für Forschung und schnelleres Verständnis. https://x.com/tokumin/status/1902251588925915429

TxGemma: Googles neues Gesundheits-/Pharma-Modell soll bei der Wirkstoffsuche unterstützen, indem es Molekül- und Proteinstrukturen analysiert. https://techcrunch.com/2025/03/18/google-plans-to-release-new-open-ai-models-for-drug-discovery/

Anthropic Claude: Endlich mit Websuche

Websuche integriert: Claude beherrscht jetzt die Online-Recherche direkt im Chat und rückt damit näher an ChatGPT & Co. https://www.anthropic.com/news/web-search

Bisher nicht für API: Entwickler müssen sich gedulden. Die neue Suchfunktion steht bisher nur in der Webversion zur Verfügung.

OpenAI: Audio-Modelle, 01 Pro in der API & neue Integrationen

GPT-4o Transcribe: Neues leistungsstärkeres Audio-zu-Text-Modell mit besserer Genauigkeit und schnellerem Transkriptions-Tempo als Whisper. https://x.com/openaidevs/status/1902817202358685880

Text-to-Speech: GPT-4o Mini TTS bietet natürliche, ausdrucksstarke Sprachausgabe.

o1 Pro-Modell für Entwickler: Bald in der API nutzbar, allerdings mit hohen Kosten pro Token. Vorsicht bei größeren Projekten! https://x.com/OpenAIDevs/status/1902485690958450871 https://x.com/OpenAIDevs/status/1902114937624830106

Google Drive & Slack-Anbindung: ChatGPT soll künftig direkt auf Dokumente in Google Drive und Slack zugreifen können. https://techcrunch.com/2025/03/17/openai-to-start-testing-chatgpt-connectors-for-google-drive-and-slack/

Perplexity & Mistral: Effiziente Modelle

Perplexity Sonar: Das auf Metas Llama basierende Modell wurde verbessert – höhere Leistung bei geringeren Kosten. https://www.perplexity.ai/de/hub/blog/new-sonar-search-modes-outperform-openai-in-cost-and-performance

Mistral Small 3.1: Kleines, multimodales Modell, das Gemma 3 und GPT-4o Mini laut eigenen Angaben schon in einigen Aufgaben übertrifft. https://x.com/MistralAI/status/1901668499832918151

Baidu Ernie X1

Deep-Seek-Konkurrenz: Baidus neues KI-Modell setzt auf fortschrittliches Reasoning und will in China direkt mit Google & Co. konkurrieren. https://www.bloomberg.com/news/articles/2025-03-16/baidu-releases-reasoning-ai-model-to-take-on-deepseek

Adobe: KI-Agenten für Marketing & Websites

Customer Journey Optimizer: Neue KI-Agenten zur automatischen Analyse von Trends, Tests und Website-Optimierung. https://news.adobe.com/news/2025/03/adobe-brings-ai-agents-to-adobe-experience-cloud

Content Creation: Adobe vereinfacht die Erstellung personalisierter Inhalte mittels generativer KI.

xAI (Elon Musk): Einstieg in AI-Video

Übernahme von Hotshot: Der Dienst für AI-Videogenerierung soll künftig mit den riesigen Ressourcen xAIs kombiniert werden. Man darf auf schnelle Fortschritte hoffen. https://x.com/aakashsastry/status/1901668601364689338

Kreative KI: Pika Labs, Krea & Co.

Pika Labs: Neue Funktion „Segment Control“, um einzelne Objekte in Videos zu verändern oder „schweben“ zu lassen – während der Rest unberührt bleibt. https://x.com/matancohengrumi/status/1902805542113861635

Krea: KI-Video-Training mit eigenen Beispielen, um Stil und Inhalte gezielt zu steuern und konsistente Resultate zu erzielen. https://x.com/krea_ai/status/1902722055759671505

Bild- und 3D-Highlights

Topaz Labs: Gigapixel 8.3.0 für schnellere und bessere Bildaufbereitung. https://x.com/topazlabs/status/1902742856512446490

Stability.AI: „Stable Virtual Camera“ erzeugt 3D-Kamerafahrten aus einzelnen Bildern – ideal für dynamische Videoeffekte. https://stability.ai/news/introducing-stable-virtual-camera-multi-view-video-generation-with-3d-camera-control

Hanyuan / Hannon: Verbesserte Open-Source-3D-Modelle für realistischere Multiview-Generierung. https://x.com/TXhunyuan/status/1901831819655606598

Roblox: „Roblox Cube“ ermöglicht promptbasiertes 3D-Objekt-Design für Spieleentwicklung – Text rein, 3D-Objekt raus. https://corp.roblox.com/newsroom/2025/03/introducing-roblox-cube

AI-Schlagzeile aus Italien

AI-gesteuerte Zeitung: Eine italienische Tageszeitung veröffentlichte eine komplette Ausgabe, die fast ausschließlich durch KI-Modelle erstellt wurde – Journalisten kamen nur noch als Fragesteller zum Einsatz. https://gizmodo.com/italian-newspaper-creates-entirely-ai-generated-edition-2000577463

Wohin geht die Reise?

Die Konvergenz von KI in (fast) allen Bereichen – ob Creative Tools, Medizin-Forschung, Kundenservice oder Gaming – schreitet rasant voran. Es bleibt spannend, wie Unternehmen und Entwickler die Balance zwischen Innovation, Ethik und Nutzwert finden.

Was meint ihr dazu? Schreibt gerne eure Gedanken oder Erfahrungen in die Kommentare. Wir lesen uns nächste Woche wieder mit weiteren Neuigkeiten aus der KI-Welt – bleibt wie immer neugierig!

Herzliche Grüße und bis bald

Tobit

Fragen Sie unseren Experten

Daniel Szkutnik

Chief Executive Officer

d.szkutnik@trio-group.de

oder

0621 33840-153