Offline KI-Dokumentenauswertung mit Teuken-7B + pgvector [23. Kielux 2025]
Ein Vortrag von Ulf Strohbach (NetUSE AG) - Volle Kontrolle: PDF-Parsing mit Apache Tika, Speicherung in PostgreSQL + pgvector. - Semantische Suche über lokale Embeddings. - Interaktive Befragungen Ihrer Dokumente mit Teuken-7B via Ollama - ganz ohne Cloud. Einblick in Feeding the Machine: Wir diskutieren, wie proprietäre KI-Trainings oft auf unfairer Datenannotation basieren und zeigen, warum offene, lokal laufende Modelle wie Teuken mehr Transparenz, Datenschutz und Nachhaltigkeit bieten. Freuen Sie sich auf eine Live-Demo der End-to-End-Pipeline! Der Vortrag wurde auf den Kieler Open Source und Linux Tagen im Jahr 2025 gehalten. Für Inhalt und Richtigkeit sind ausschließlich die jeweiligen Referenten verantwortlich. Webseite: https://kielux.de/programm/KOLT25
↗https://tube.tchncs.de/w/m4vYyBoDFBmYeHrZ6fCNNR