{"guid":"4638e763-717b-5e7b-a48a-6f05ae2428a7","title":"Ein Telefonat mit GPT: von Spracherkennung bis -ausgabe","subtitle":null,"slug":"clt25-198-ein-telefonat-mit-gpt-von-spracherkennung-bis-ausgabe","link":"https://chemnitzer.linux-tage.de/2025/de/programm/beitrag/198","description":"Museen stehen vor der Herausforderung, ihre Inhalte möglichst attraktiv erlebbar gestalten zu wollen. Insbesondere kann historischem Wissen durch aktuelle Tools aus dem Bereich KI zu neuem Leben verholfen werden. Wie ein solches Vorhaben umgesetzt werden kann, zeigt unser Projekt.\n\nDas Robert-Schumann-Haus in Zwickau trat an die Westsächsische Hochschule Zwickau heran, mit dem Ziel, Besucher*innen die Möglichkeit zu geben, sich über einen historischen Telefonapparat mit Clara Schumann  „unterhalten“ zu können. Über einen Zeitraum von 1,5 Jahren haben mehrere Studierendengruppen im Rahmen von Lehrveranstaltungen unter Leitung von Prof. Dr.-Ing. Hellbach eine technische Lösung entwickelt.\n\nAb Frühjahr 2025 wird dieses interaktive Erlebnis für die Besucher*innen des Robert-Schumann-Hauses zugänglich sein.\n\nIm Vortrag werden die Herausforderungen und die Entwicklung eines Chatbots aus Komponenten wie Spracherkennung (Whisper), großem Sprachmodell (GPT via LangChain mit Anbindung an eine ChromaDB) und Sprachsynthese (ElevenLabs) durch ein Team von Studierenden beleuchtet. Der Prototyp läuft dabei großteils auf einem Desktop-PC, während ein  Raspberry Pi im Telefonapparat die Audioein- und ausgabe steuert.\n\nLicensed to the public under http://creativecommons.org/licenses/by/4.0","original_language":"deu","persons":["Phillip Blaschka","Lisette Kratkey","Tom Borowsky"],"tags":["13","2025","clt25","Vortrag","V7","clt25-deu","Day 1"],"view_count":570,"promoted":false,"date":"2025-03-22T17:00:00.000+01:00","release_date":"2025-05-01T00:00:00.000+02:00","updated_at":"2026-04-15T18:30:06.502+02:00","length":2277,"duration":2277,"thumb_url":"https://static.media.ccc.de/media/events/clt/2025/13-4638e763-717b-5e7b-a48a-6f05ae2428a7.jpg","poster_url":"https://static.media.ccc.de/media/events/clt/2025/13-4638e763-717b-5e7b-a48a-6f05ae2428a7_preview.jpg","timeline_url":"https://static.media.ccc.de/media/events/clt/2025/13-4638e763-717b-5e7b-a48a-6f05ae2428a7.timeline.jpg","thumbnails_url":"https://static.media.ccc.de/media/events/clt/2025/13-4638e763-717b-5e7b-a48a-6f05ae2428a7.thumbnails.vtt","frontend_link":"https://media.ccc.de/v/clt25-198-ein-telefonat-mit-gpt-von-spracherkennung-bis-ausgabe","url":"https://api.media.ccc.de/public/events/4638e763-717b-5e7b-a48a-6f05ae2428a7","conference_title":"Chemnitzer Linux-Tage 2025","conference_url":"https://api.media.ccc.de/public/conferences/clt25","related":[],"recordings":[{"size":23,"length":2277,"mime_type":"audio/opus","language":"deu","filename":"clt25-13-deu-Ein_Telefonat_mit_GPT_von_Spracherkennung_bis_-ausgabe_opus.opus","state":"new","folder":"opus","high_quality":false,"width":0,"height":0,"updated_at":"2025-05-01T22:02:06.938+02:00","recording_url":"https://cdn.media.ccc.de/events/clt/2025/opus/clt25-13-deu-Ein_Telefonat_mit_GPT_von_Spracherkennung_bis_-ausgabe_opus.opus","url":"https://api.media.ccc.de/public/recordings/87480","event_url":"https://api.media.ccc.de/public/events/4638e763-717b-5e7b-a48a-6f05ae2428a7","conference_url":"https://api.media.ccc.de/public/conferences/clt25"},{"size":34,"length":2277,"mime_type":"audio/mpeg","language":"deu","filename":"clt25-13-deu-Ein_Telefonat_mit_GPT_von_Spracherkennung_bis_-ausgabe_mp3.mp3","state":"new","folder":"mp3","high_quality":false,"width":0,"height":0,"updated_at":"2025-05-01T22:02:03.104+02:00","recording_url":"https://cdn.media.ccc.de/events/clt/2025/mp3/clt25-13-deu-Ein_Telefonat_mit_GPT_von_Spracherkennung_bis_-ausgabe_mp3.mp3","url":"https://api.media.ccc.de/public/recordings/87479","event_url":"https://api.media.ccc.de/public/events/4638e763-717b-5e7b-a48a-6f05ae2428a7","conference_url":"https://api.media.ccc.de/public/conferences/clt25"},{"size":73,"length":2277,"mime_type":"video/webm","language":"deu","filename":"clt25-13-deu-Ein_Telefonat_mit_GPT_von_Spracherkennung_bis_-ausgabe_webm-sd.webm","state":"new","folder":"webm-sd","high_quality":false,"width":720,"height":576,"updated_at":"2025-05-01T22:26:21.794+02:00","recording_url":"https://cdn.media.ccc.de/events/clt/2025/webm-sd/clt25-13-deu-Ein_Telefonat_mit_GPT_von_Spracherkennung_bis_-ausgabe_webm-sd.webm","url":"https://api.media.ccc.de/public/recordings/87483","event_url":"https://api.media.ccc.de/public/events/4638e763-717b-5e7b-a48a-6f05ae2428a7","conference_url":"https://api.media.ccc.de/public/conferences/clt25"},{"size":151,"length":2277,"mime_type":"video/webm","language":"deu","filename":"clt25-13-deu-Ein_Telefonat_mit_GPT_von_Spracherkennung_bis_-ausgabe_webm-hd.webm","state":"new","folder":"webm-hd","high_quality":true,"width":1920,"height":1080,"updated_at":"2025-05-01T22:26:05.273+02:00","recording_url":"https://cdn.media.ccc.de/events/clt/2025/webm-hd/clt25-13-deu-Ein_Telefonat_mit_GPT_von_Spracherkennung_bis_-ausgabe_webm-hd.webm","url":"https://api.media.ccc.de/public/recordings/87482","event_url":"https://api.media.ccc.de/public/events/4638e763-717b-5e7b-a48a-6f05ae2428a7","conference_url":"https://api.media.ccc.de/public/conferences/clt25"},{"size":55,"length":2277,"mime_type":"video/mp4","language":"deu","filename":"clt25-13-deu-Ein_Telefonat_mit_GPT_von_Spracherkennung_bis_-ausgabe_sd.mp4","state":"new","folder":"h264-sd","high_quality":false,"width":720,"height":576,"updated_at":"2025-05-01T22:04:24.682+02:00","recording_url":"https://cdn.media.ccc.de/events/clt/2025/h264-sd/clt25-13-deu-Ein_Telefonat_mit_GPT_von_Spracherkennung_bis_-ausgabe_sd.mp4","url":"https://api.media.ccc.de/public/recordings/87481","event_url":"https://api.media.ccc.de/public/events/4638e763-717b-5e7b-a48a-6f05ae2428a7","conference_url":"https://api.media.ccc.de/public/conferences/clt25"},{"size":103,"length":2277,"mime_type":"video/mp4","language":"deu","filename":"clt25-13-deu-Ein_Telefonat_mit_GPT_von_Spracherkennung_bis_-ausgabe_hd.mp4","state":"new","folder":"h264-hd","high_quality":true,"width":1920,"height":1080,"updated_at":"2025-05-01T22:01:58.043+02:00","recording_url":"https://cdn.media.ccc.de/events/clt/2025/h264-hd/clt25-13-deu-Ein_Telefonat_mit_GPT_von_Spracherkennung_bis_-ausgabe_hd.mp4","url":"https://api.media.ccc.de/public/recordings/87478","event_url":"https://api.media.ccc.de/public/events/4638e763-717b-5e7b-a48a-6f05ae2428a7","conference_url":"https://api.media.ccc.de/public/conferences/clt25"}]}