Whisper v3: Sprache lokal in Text umwandeln
Dieses Mal stelle ich Euch Whisper Version 3 – ein beeindruckendes KI-Sprachmodell – vor, das es Euch erlaubt, Sprache aus Videos oder Audiodateien in Text umzuwandeln. Die Umwandlung geschieht komplett lokal auf Euren eigenen Rechnern ohne Cloud und Internetverbindung! Whisper ist eines der wenigen OpenAI-Projekte, das tatsächlich OpenSource ist, was bedeutet, daß Ihr es kostenlos auf Euren Systemen verwenden könnt. Ich zeige Euch, wie Ihr Whisper installieren und konfigurieren könnt. Zudem habe ich ein paar Benchmark-Ergebnisse für Euch, die Aufschluß darüber geben, wie stark sich Whisper-Large-v3 und das -Turbo-Model voneinander in Verarbeitungsgeschwindigkeit und Qualität unterscheiden. * Folien, Links, etc.: https://goos-habermann.de/weisheit-10250-Whisper-v3-Sprache-lokal-in-Text-umwandeln 00:24 Was ist Whisper? 01:55 Whisper installieren 04:33 Whisper verwenden 06:15 Audiospur aus Video extrahieren 08:21 Benchmark: Wie schnell ist Whisper? 11:48 Ist das größere Whisper besser?
↗https://tube.tchncs.de/w/fZ1j1mS8Ta1WNKsFae5X6J