← findnix.eu
🎬 tube.tchncs.de tube.tchncs.de

KI-Modell Gemma 4 angetestet: Was kann es, was nicht?

⏱ 1:08:09 🌐 tube.tchncs.de

In diesem Video zeige ich Euch (auch live), wie erstaunlich gut Googles multimodales KI-Modell Gamma 4 ist. Neben typischer KI-"Textverarbeitung" wie das Zusammenfassen von Texten, Erstellen von Videobeschreibungen oder -titeln, kann Gemma 4 auch mit Bildern und Audiodaten umgehen. Dazu lasse ich einige Bilder (z.B. das Foto eines TFTs, auf dem der BIOS-Einstelldialog zu sehen ist oder einen Comicstrip) analysieren, stelle Fragen dazu und bekomme ziemlich gute Bildbeschreibungen oder Übersetzungen der Sprechblasen. Um die Audiofähigkeit zu testen, lasse ich die Handlung eines 50-minütigen Hörspiels zusammenfassen, was im Großen und Ganzen ebenfalls gelingt. * Folien, Links, etc.: https://goos-habermann.de/weisheit-10272-KI-Modell-Gemma-4-angetestet-Was-kann-es-was-nicht 00:51 Was ist Gemma 4? + Themenausblick 08:42 Gemma 4 starten 12:25 Selbstdarstellung Gemma 4: Was ist gut? 13:38 Selbstdarstellung Gemma 4: Was ist nicht so gut? 14:36 Wissensabfrage: 10 Interessante Fakten über Debi

https://tube.tchncs.de/w/hM33Q1n8CTS8Lq2hme2Xyu
Multimodalität LLM Bildanalyse KI AI
Indexiert von findnix.eu · Eigene Seite einreichen