
Insights: Qualität von KI – Testen von Chatbots und semantischer Korrektheit
Datum und Uhrzeit:
Online-Session
Im Insights Qualität von KI – Testen von Chatbots und semantischer Korrektheit werden Testansätze von Large Language Models am Beispiel von Testen von Chatbots vorgestellt und über die Möglichkeiten des Testens von semantischer Korrektheit gesprochen.
In dieser Präsentation betrachten Bastian Kerr und Marco Kropp (beide QualityMinds) verschiedene praktische Use Cases und mögliche Fehlerquellen bei der Nutzung von KI-Modellen, insbesondere im Kontext der Text- und Audioverarbeitung. Wir zeigen anhand konkreter Beispiele, wie scheinbar kleine Probleme, wie etwa bei der automatischen Markdown-Formatierung, in spezifischen Anwendungsszenarien unerwünschte Auswirkungen haben können. Besondere Herausforderungen entstehen durch inkonsistentes Verhalten, technische Artefakte aus dem Training der Modelle, sowie möglicher Halluzinationen. Wir präsentieren Lösungsansätze und Empfehlungen, wie Unternehmen diese Herausforderungen erkennen und durch sorgfältige Testvorgehen sowie gezielte Prompt-Optimierungen minimieren können.
Im Panel diskutieren u.a. Markus Schell (Mercedes), Danjiel Pirs (Robert Bosch) und Matthias Eichenseher (Siemens).
Online-Session, Datum und Uhrzeit:
Agenda
15:30 Uhr I Begrüßung und Vorstellung der Teilnehmer:innen

Dr. Gerd Große
Vorstandsvorsitzender GFFT e.V., Head of United Innovations
15:40 Uhr I Qualität von KI - Testen von Chatbots und semantischer Korrektheit

Bastian Knerr
Teamlead Testing, Qualityminds
16:00 Uhr I Gemeinsame Diskussion u.a. mit

Matthias Eichenseher, Siemens

Markus Schell, Mercedes Benz
tbd
orem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper mattis, pulvinar dapibus leo.