{"id":498761,"date":"2023-11-14T03:26:44","date_gmt":"2023-11-14T11:26:44","guid":{"rendered":"https:\/\/www.genesys.com\/blog\/post\/messen-der-ki-qualitaet-voreingenommenheit-genauigkeit-und-benchmarking-fuer-dialogorientierte-ki"},"modified":"2024-01-15T00:40:37","modified_gmt":"2024-01-15T08:40:37","slug":"measuring-ai-quality-bias-accuracy-and-benchmarking-for-conversational-ai","status":"publish","type":"blog","link":"https:\/\/www.genesys.com\/de-de\/blog\/post\/measuring-ai-quality-bias-accuracy-and-benchmarking-for-conversational-ai","title":{"rendered":"Messen der KI-Qualit\u00e4t: Voreingenommenheit, Genauigkeit und Benchmarking f\u00fcr dialogorientierte KI"},"content":{"rendered":"<div class=\"wpb-content-wrapper\"><p>[vc_section full_width=&#8220;stretch_row&#8220;][vc_row][vc_column][vc_column_text]<span data-contrast=\"auto\">Experten f\u00fcr k\u00fcnstliche Intelligenz (KI) werden oft gebeten, ihre Arbeit zu demonstrieren. Sie m\u00fcssen beweisen, dass ihre KI-Technologie funktioniert und sich mit einer alternativen KI-L\u00f6sung messen kann oder besser ist als diese. Das scheint ein gerechtfertigtes Anliegen zu sein. Doch das Messen der KI-Qualit\u00e4t ist schwierig und in einigen F\u00e4llen sogar unm\u00f6glich. Es gibt Ma\u00dfeinheiten, die zum Testen von KI verwendet werden: Error\u00a0Rates, Recall, Lift, Confidence. Aber viele von ihnen sind ohne Kontext bedeutungslos. Und bei KI ist der echte KPI der ROI.<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span> <span data-contrast=\"auto\">Das hei\u00dft nicht, dass alle KI-Technologien gleich aufgebaut sind oder dass die Qualit\u00e4t irrelevant ist. Die Qualit\u00e4t Ihrer KI-L\u00f6sung wirkt sich wesentlich auf Ihre F\u00e4higkeit aus, mit der KI ein ROI zu erzielen. In diesem Blog werde ich Benchmarks f\u00fcr die KI-Qualit\u00e4t, Konzepte und Best Practices beleuchten. Dies kann als Bezugspunkt f\u00fcr diejenigen dienen, die sich in irgendeiner der Phasen der KI-Implementierung befinden.\u00a0<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span><\/p>\n<h2><span data-contrast=\"auto\">Mit realistischen Erwartungen beginnen<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span><\/h2>\n<p><span data-contrast=\"auto\">Einige erwarten, dass KI immer akkurat ist. Viele Menschen glauben, dass KI menschliche Fehler korrigiert und dass KI, da menschliche Fehler unvermeidlich und erwartbar sind, das Gegenteil davon sein muss. Diese Perfektion erreichen zu wollen, ist ein unm\u00f6gliches Vorhaben. Die Erwartungen m\u00fcssen realistisch sein. Der beste Weg, den Erfolg von KI zu messen, sind die gesch\u00e4ftlichen Auswirkungen.\u00a0<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span> <span data-contrast=\"auto\">Es gibt einige Dinge, die KI im Contact Center leisten kann, die ein Mensch nicht kann. Selbst wenn ein Chatbot beispielsweise nur eine Frage beantworten kann, kann er dennoch diese Frage rund um die Uhr beantworten, ohne jemals eine Pause einzulegen. Wenn diese Frage f\u00fcr einen Gro\u00dfteil der Kunden oder ein kleines, aber wichtiges Kundensegment wichtig ist, hat der Chatbot einen gro\u00dfen Wert, der weit \u00fcber seine F\u00e4higkeit hinausgeht, eine Vielzahl von Anfragen genau zu verstehen und auf diese dialogorientiert zu reagieren.\u00a0<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span> <span data-contrast=\"auto\">Bei der dialogorientierten KI werden die Erwartungen an Perfektion mit Sicherheit nicht erf\u00fcllt.\u00a0<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span> <span data-contrast=\"auto\">Dialogorientierte KI-Bots werden mit Daten trainiert. Die Qualit\u00e4t des zugrunde liegenden Natural Language Understanding (NLU)-Modells h\u00e4ngt von dem f\u00fcr das Training und die Tests verwendeten Datensatz ab. Vielleicht haben Sie einige Berichte gesehen, die NLU-Benchmarks enthalten. Stellen Sie bei der \u00dcberpr\u00fcfung der Zahlen sicher, dass Sie verstehen, welche Daten verwendet wurden.\u00a0<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span> <span data-contrast=\"auto\">Nehmen wir an, Anbieter\u00a0A hat die gleichen Trainings- und Testdaten f\u00fcr die Analyse verwendet, aber Anbieter\u00a0B und C hatten einen anderen Datensatz f\u00fcr das Training. Die Ergebnisse f\u00fcr Anbieter\u00a0A werden wahrscheinlich die Ergebnisse von Anbieter\u00a0B und C \u00fcbertreffen. Anbieter\u00a0A verwendet (im Prinzip) das Geburtsjahr, um das Alter vorherzusagen. Dies ist ein zu 100\u00a0% genaues Modell, jedoch wahrscheinlich nicht die beste Nutzung von KI.<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span><\/p>\n<h2><span data-contrast=\"auto\">Messen der Qualit\u00e4t und grundlegende Benchmarks<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span><\/h2>\n<p><span data-contrast=\"auto\">NLU-Modelle werden mit diesen <\/span><a href=\"https:\/\/towardsdatascience.com\/a-look-at-precision-recall-and-f1-score-36b5fd0dd3ec\" target=\"_blank\" rel=\"noopener\"><span data-contrast=\"none\">Dimensionen<\/span><\/a> gemessen<span data-contrast=\"auto\">:<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span><\/p>\n<ul>\n<li><span data-contrast=\"auto\"><strong>Accuracy:<\/strong> Anzahl der korrekten Vorhersagen aus allen Vorhersagen<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span><\/li>\n<li><span data-contrast=\"auto\"><strong>Precision:<\/strong> Anzahl der positiven Vorhersagen, die korrekt sind<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span><\/li>\n<li><span data-contrast=\"auto\"><strong>Recall<\/strong>: Anzahl der vom \u201eClassifier\u201c korrekt vorhergesagten positiven F\u00e4lle aus allen positiven F\u00e4llen in den Daten \u2013 auch bekannt als Sensitivit\u00e4t<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span><\/li>\n<li><span data-contrast=\"auto\"><strong>F1-Score:<\/strong> Kombiniert Precision und Recall und gilt als besseres Ma\u00df\u00a0<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span><\/li>\n<\/ul>\n<p><span data-contrast=\"auto\">Im Fall der dialogorientierten KI ist eine positive Vorhersage eine \u00dcbereinstimmung zwischen dem, was ein Kunde gesagt hat, und dem, was ein Kunde gemeint hat. Bei der Qualit\u00e4tsanalyse wird verglichen, wie gut das NLU-Modell nat\u00fcrliche Sprache versteht. Es misst nicht, wie die dialogorientierte KI auf die gestellten Fragen reagiert.\u00a0<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span> <span data-contrast=\"auto\">Ihr NLU-Modell kann m\u00f6glicherweise genau erfassen, was die Kunden w\u00fcnschen. Ihr Framework ist jedoch m\u00f6glicherweise nicht in der Lage, eine Verbindung zu den Systemen herzustellen, die es ben\u00f6tigt, um die Anfrage zufriedenstellend zu beantworten, den Anruf unter Beibehaltung des Kontexts zum richtigen Kanal zu leiten oder die richtige Antwort auf die Frage zu finden. Die NLU-Genauigkeit steht nicht stellvertretend f\u00fcr die Kundenzufriedenheit oder die Probleml\u00f6sung beim ersten Kontakt (First-Contact-Resolution).\u00a0<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span> <span data-contrast=\"auto\">Scores sind in der Regel eine Bewertung zu einem spezifischen Zeitpunkt und h\u00e4ngen stark von den f\u00fcr die Analyse verwendeten Daten ab. Unterschiede bei den Bewertungen sind m\u00f6glicherweise schwer zu interpretieren (es sei denn, Sie sind Experte f\u00fcr linguistische Modelle). Wenn zum Beispiel ein NLU-Modell einen Score von 79\u00a0% und ein anderes einen Score von 80\u00a0% hat, was bedeutet das? Ver\u00f6ffentlichte Vergleiche enthalten oft nicht \u2013 oder nur im Kleingedruckten \u2013 den Umfang des Tests oder die H\u00e4ufigkeit, mit der ein Test durchgef\u00fchrt wurde, und sie liefern selten die tats\u00e4chlich verwendeten Daten.\u00a0<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span> <span data-contrast=\"auto\">Wenn Sie einen vorgeschulten Standard-Bot in Betracht ziehen, k\u00f6nnte es hilfreich sein, diese Benchmarks zu haben. M\u00f6glicherweise m\u00fcssen Sie Ihre Bewertung jedoch erweitern, um andere Faktoren einzubeziehen, wie Personalisierungs-, Analyse- und Optimierungsf\u00e4higkeiten. Mehr dazu sp\u00e4ter.<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span> <span data-contrast=\"auto\">F\u00fcr diejenigen, die Genesys AI zum Erstellen und Bereitstellen von Bots verwenden, sind die NLU-Modelle so einzigartig wie unsere Kunden. Sie werden zweckorientiert mit Daten geschult, die entweder kundenspezifisch oder spezifisch f\u00fcr den Anwendungsfall sind, den der Kunde versucht zu l\u00f6sen. Herk\u00f6mmliche Benchmark-Berichte w\u00fcrden Genesys AI nicht gerecht. Viele Teams testen jedoch regelm\u00e4\u00dfig die Leistung des <\/span><a href=\"https:\/\/www.genesys.com\/article\/set-bot-confidence-thresholds-with-confidence\" target=\"_blank\" rel=\"noopener\"><span data-contrast=\"none\">Genesys NLU-Modells<\/span><\/a><span data-contrast=\"auto\"> im Vergleich zu anderen unter Zuhilfenahme eines Standard-Korpus (Abbildung\u00a01).\u00a0<\/span><span data-ccp-props=\"{&quot;201341983&quot;:0,&quot;335559739&quot;:160,&quot;335559740&quot;:259}\">\u00a0<\/span>[\/vc_column_text][vc_single_image image=&#8220;491296&#8243; css=&#8220;.vc_custom_1694532622553{margin-top: 1.5em !important;margin-bottom: 1.5em !important;}&#8220;][vc_column_text]Der \u201eBanking-Bot\u201c wird anhand eines Standarddatensatzes trainiert, der die vielen Self-Service-Anfragen abbildet, die f\u00fcr eine Bank typisch sind. Dieser Test zeigt, dass sich das Genesys NLU-Modell mit einigen Drittanbieter-KIs messen kann und in diesem Test eine bessere Leistung erbringt als andere. Wenn wir den Test auf andere Sprachen erweitern, variieren die Ergebnisse. Dieser Test wurde mit demselben Datensatz durchgef\u00fchrt, der (von einem Menschen) in die verschiedenen unten aufgef\u00fchrten Sprachen \u00fcbersetzt wurde. Wenn Sie versuchen, NLU-Anbieter allein auf der Grundlage von Benchmarks zu vergleichen, ist Sprache eine wichtige Dimension. Einige NLU-Modelle funktionieren besonders gut mit einem Sprachensatz, aber nicht so gut mit anderen (Abbildung 2).[\/vc_column_text][vc_single_image image=&#8220;491297&#8243; css=&#8220;.vc_custom_1694532610171{margin-top: 1.5em !important;margin-bottom: 1.5em !important;}&#8220;][vc_column_text]W\u00e4gen Sie die Ergebnisse ab: Diese und viele andere Testergebnisse werden zur Feinabstimmung der zugrunde liegenden Komponenten verwendet, um sicherzustellen, dass diejenigen, die Bots erstellen, mit ihrem Bot dasselbe oder ein besseres NLU-Niveau erreichen k\u00f6nnen als mit anderen beliebten NLU-Optionen.<\/p>\n<h2>Wie wird ein dialogorientierter KI-Bot trainiert?<\/h2>\n<p>Bots sind f\u00fcr den Einsatz im echten Leben konzipiert, nicht f\u00fcr das Testen von Datens\u00e4tzen. Man muss ein Gef\u00fchl daf\u00fcr haben, welche Leistung ein Modell mit Daten erbringt, die repr\u00e4sentativ f\u00fcr die vielf\u00e4ltigen, tats\u00e4chlich eingehenden Endbenutzer-Anfragen f\u00fcr den Anwendungsfall sind, f\u00fcr den der Bot erstellt wurde.\u00a0 Ein \u201erepr\u00e4sentativer\u201c Testsatz erstellt eine Momentaufnahme der tats\u00e4chlichen (anonymisierten) \u00c4u\u00dferungen von Kunden. Dies kann manuell oder automatisch erfolgen. Die Intentionsverteilung ist sehr unausgewogen, da es in der Regel nur eine geringe Anzahl von Intentionen gibt, die die h\u00e4ufigsten Gr\u00fcnde sind, warum Kunden Ihren Bot \u00fcberhaupt kontaktieren. Nach der Feinabstimmung des Bots, werden die h\u00e4ufigsten \u00c4u\u00dferungen von Kunden Teil des Modells sein; nur die, die nicht angesprochen werden, bleiben \u00fcbrig. Diese Art von Testsatz misst die Leistung unter Praxisbedingungen und ist <a href=\"https:\/\/www.genesys.com\/blog\/post\/optimizing-your-bot-an-ai-love-story\" target=\"_blank\" rel=\"noopener\">entscheidend f\u00fcr die Aufrechterhaltung der Qualit\u00e4t \u00fcber einen l\u00e4ngeren Zeitraum<\/a>. NLU-Modelle sind die Grundlage f\u00fcr dialogorientierte KI-Bots. Ein NLU-Modell prognostiziert die <a href=\"https:\/\/help.genesys.cloud\/articles\/intents-overview\/\" target=\"_blank\" rel=\"noopener\">Intention<\/a> des Endnutzers und extrahiert <a href=\"https:\/\/help.genesys.cloud\/articles\/slots-and-slot-types-overview\/\" target=\"_blank\" rel=\"noopener\">Slots<\/a> (Daten), indem es anhand einer Reihe beispielhafter <a href=\"https:\/\/help.genesys.cloud\/articles\/work-with-utterances\/\" target=\"_blank\" rel=\"noopener\">\u00c4u\u00dferungen<\/a> trainiert wird, die in der Regel aus verschiedenen M\u00f6glichkeiten bestehen, wie ein Kunde eine Frage stellt. Umfassende Tools zur Erstellung von Bot-Inhalten erm\u00f6glichen es Bot-Entwicklern, die f\u00fcr ihren Bot erforderlichen Intentionen und Slots hinzuzuf\u00fcgen und zu trainieren. Dar\u00fcber hinaus bieten sie Analysetools, mit denen man sehen kann, welche Leistung der Bot erbringt, sowie Tools zur Verbesserung des NLU-Modells im Laufe der Zeit. Generische NLU-Modelle k\u00f6nnen m\u00f6glicherweise grundlegende Fragen gut verstehen, aber Kundenservice ist nicht generisch. Die Spezifit\u00e4t, die Bots ben\u00f6tigen, um effizient zu sein, ergibt sich aus den Trainingsdaten (Korpus), die w\u00e4hrend des Trainingsprozesses verwendet werden. Je genauer die Trainingsdaten tats\u00e4chliche Gespr\u00e4chen abbilden, desto besser wird der Bot funktionieren. Eine M\u00f6glichkeit, bessere Daten zu erhalten, besteht darin, die tats\u00e4chlichen Gespr\u00e4che zu nutzen. Eine bew\u00e4hrte Methode ist, diaologorientierte KI-Technologie mit einem Tool zu implementieren, das Intentionen und \u00c4u\u00dferungen, die diese Intentionen repr\u00e4sentieren, aus tats\u00e4chlichen Gespr\u00e4chen (aufgezeichnet oder digital) extrahiert. Es ist wichtig, eine M\u00f6glichkeit zu haben, den Bot vor der Bereitstellung zu testen und nach der Bereitstellung etwaige verpasste Intentionsidentifizierungen zu erfassen. Die Qualit\u00e4t der dialogorientierten KI ist nicht statisch. Bots k\u00f6nnen sich im Laufe der Zeit verbessern, wenn es eine M\u00f6glichkeit gibt, sie nach der Bereitstellung zu optimieren. Dies kann mit Standard-Bots, die eine benutzerdefinierte Entwicklung ben\u00f6tigen, schwierig sein. Ein gro\u00dfer Vorteil eines integrierten Bot-Frameworks besteht darin, dass Sie Bots, die nicht wie erwartet funktionieren, in Echtzeit und ohne Unterbrechung korrigieren k\u00f6nnen. Wenn Sie an Qualit\u00e4t denken, fragen Sie nach Optimierung. Ist die Optimierung automatisch? Gibt es im Prozess einen \u201eHuman in the Loop\u201c? Wie k\u00f6nnen Sie als Unternehmen \u201esehen\u201c, was passiert?<\/p>\n<h2>Voreingenommenheit bei KI verstehen<\/h2>\n<p>Voreingenommenheit sollte Teil der \u00dcberlegungen zur Qualit\u00e4t sein. Voreingenommenheit bei KI ist unvermeidbar. Wichtig ist nicht, wo Voreingenommenheit vorhanden ist (es gibt sie), sondern wie gut der Bot sie erkennen und bis zur Quelle zur\u00fcckverfolgen kann. Wenn Sie ein bereits trainiertes Modell (einen Standard-Bot) verwenden, kennen Sie wahrscheinlich das Trainingsset nicht. Selbst ein gro\u00dfer Korpus mit einer gro\u00dfen Bandbreite von Inhalten aus einer Branche kann einseitig sein, wenn diese Quelle eine einzige Region oder einen bestimmten Zeitpunkt abbildet. Es gibt einige F\u00e4lle, in denen antrainierte Voreingenommenheit <a href=\"https:\/\/www.kdnuggets.com\/2022\/11\/expect-ai-quality-trends-2023.html\" target=\"_blank\" rel=\"noopener\">KI-Projekte<\/a> aus der Bahn geworfen hat. Viele KI-Projekte k\u00f6nnen gar nicht genug korrigiert werden, um brauchbar zu sein. Voreingenommenheit ist von besonderem Interesse f\u00fcr diejenigen, die vorgeschulte gro\u00dfe Sprachmodelle (LLMs) verwenden m\u00f6chten. Der Vorteil gro\u00dfer, sofort einsatzbereiter Standard-Modelle besteht darin, dass sie \u00e4u\u00dferst dialogorientiert sind und mit einer Vielzahl von Gespr\u00e4chsmustern in Ber\u00fchrung gekommen sind. Die Trainingsets sind jedoch so gro\u00df, dass sie schwer zu pflegen sind, und sie h\u00e4ngen von der F\u00e4higkeit der Anbieter ab, wirklich vorurteilsfreie Daten zu finden und zu verwenden. Ein <a href=\"https:\/\/aclanthology.org\/2023.acl-long.656.pdf\" target=\"_blank\" rel=\"noopener\">k\u00fcrzlich erschienener Artikel<\/a> zeigt, dass LLMs parteiisch sind \u2013 dies sollten Sie ber\u00fccksichtigen, wenn Sie Fragen zu Politik oder Ereignissen stellen. Eine parteiische Voreingenommenheit k\u00f6nnte die Informationen, die Sie erhalten, ver\u00e4ndern (Abbildung 3).[\/vc_column_text][vc_single_image image=&#8220;491299&#8243; css=&#8220;.vc_custom_1694532594022{margin-top: 1.5em !important;margin-bottom: 1.5em !important;}&#8220;][vc_column_text]<\/p>\n<h2>Wie man mit der Voreingenommenheit dialogorientierter KI umgeht<\/h2>\n<p>Beginnen Sie mit dem Ziel und dem Output, wenn Sie ein KI-Projekt starten. Was soll das KI-Projekt erreichen (automatisieren) und welche Auswirkungen h\u00e4tte es auf diese Leistung, wenn die verwendeten Daten Voreingenommenheiten enthalten, die die Entscheidung wesentlich ver\u00e4ndern? Beispielsweise kann Voreingenommenheit bei einem Modell, das zur Automatisierung von Kreditgenehmigungen oder Besch\u00e4ftigungsverh\u00e4ltnissen verwendet wird, zu einer Entscheidung f\u00fchren, die unethisch und wahrscheinlich in den meisten L\u00e4ndern illegal ist. Die Strategie, um so etwas zu entsch\u00e4rfen, besteht darin, die Verwendung von Daten wie Alter, Geschlecht und ethnische Herkunft zu vermeiden. Doch oft gibt es innerhalb der Daten Dimensionen, die mit diesen gesch\u00fctzten Kategorien in Zusammenhang stehen und die Ergebnisse beeinflussen. So k\u00f6nnte eine falsche Voreingenommenheit in das Modell eingebracht werden. Bei einigen sensiblen Entscheidungen, wie z.\u00a0B. Personalentscheidungen, wird der Einsatz von KI streng reguliert und \u00fcberwacht (und das ist gut so). Wenn man das Ergebnis der dialogorientierten KI betrachtet, hat Voreingenommenheit m\u00f6glicherweise keine wesentliche Auswirkung auf das Gespr\u00e4ch. Sie ist zwar zu ber\u00fccksichtigen, aber ihre Auswirkungen sind wahrscheinlich nicht zu vergleichen mit den gesch\u00e4ftlichen Auswirkungen, die ein voreingenommenes Besch\u00e4ftigungsmodell h\u00e4tte. Um Voreingenommenheit zu bewerten und zu ber\u00fccksichtigen, beginnen Sie mit dem Ergebnis und arbeiten Sie sich zur\u00fcck zu den Daten. Die Quelle der Voreingenommenheit sind die Trainingsdaten. Ein Besch\u00e4ftigungsmodell, das mit Daten aus einer Zeit trainiert wurde, in der bestimmte Gruppen von Besch\u00e4ftigungsverh\u00e4ltnissen oder bestimmten Positionen regelm\u00e4\u00dfig ausgeschlossen wurden, wird diese Voreingenommenheit in die Gegenwart mitnehmen. Eine M\u00f6glichkeit, die Voreingenommenheit unter Kontrolle zu halten, besteht darin sicherzustellen, dass die Daten gut ausgewogen sind. Verwenden Sie f\u00fcr die dialogorientierte KI und f\u00fcr die KI-basierte Automatisierung der Customer Experience tats\u00e4chliche Gespr\u00e4chsdaten aus Ihrem eigenen Kundenstamm, da diese die m\u00f6glichen Gespr\u00e4che abbilden. Integrierte Analysen erm\u00f6glichen es Benutzern zu beurteilen, ob es bei der Antwort des Bots eine Voreingenommenheit gibt. Wenn man beobachtet, wie Intentionen aus \u00c4u\u00dferungen abgeleitet werden sowie welche \u00c4u\u00dferungen verstanden werden und welche nicht, wird ersichtlich, ob ein Potenzial f\u00fcr Voreingenommenheit besteht. Ein integrierter Feedback-Mechanismus kann dabei helfen, Probleme zu erfassen, und die Optimierungs-Tools erm\u00f6glichen es Unternehmen, einen Bot anzupassen. Dies ist kein unbeaufsichtigter Prozess, der aus dem Ruder geraten kann. Im Gegenteil: Der Prozess ist kontrolliert, genau bedacht und es gibt einen \u201eHuman-in-the-Loop\u201c. Das bedeutet, dass dies sowohl f\u00fcr hochsensible Informationen als auch f\u00fcr allgemeine Informationen funktionieren kann. Manche Formen von KI k\u00f6nnen nur eins von beiden umsetzen, was ihre Leistungsf\u00e4higkeit einschr\u00e4nkt.<\/p>\n<h2>Best Practices und Empfehlungen f\u00fcr dialogorientierte KI<\/h2>\n<p>Im Contact Center ben\u00f6tigen Sie dialogorientierte KI, die Ihren Kunden hochwertige Antworten gibt und mit der Sie gesch\u00e4ftliche Fortschritte erzielen k\u00f6nnen. Die Versuchung liegt nahe, nach Benchmark-Berichten und technischen Spezifikationen zu suchen. Dabei k\u00f6nnen Sie viele Daten erhalten, die m\u00f6glicherweise schwer zu verstehen sind und Ihnen wahrscheinlich nicht helfen werden, Ihre Ziele zu erreichen. Es ist wichtig, eine L\u00f6sung zu haben, die die folgenden Eigenschaften aufweist:<\/p>\n<ol>\n<li>Ein Prozess mit einem \u201eHuman in the Loop\u201c, stellt sicher, dass die Schritte, die f\u00fcr die Erstellung, Bereitstellung, Messung und Optimierung einer effektiven Implementierung dialogorientierter KI \u00fcberwacht und kontrolliert werden.<\/li>\n<li>Die Benutzerfreundlichkeit ist f\u00fcr die Qualit\u00e4t von entscheidender Bedeutung, da so das Unternehmen die Kontrolle \u00fcbernehmen kann. Ein benutzerfreundliches Bot-Framework, f\u00fcr das keine Codierung erforderlich ist, macht KI f\u00fcr alle zug\u00e4nglich und beseitigt H\u00fcrden.<\/li>\n<li>Domain-Expertise bedeutet, dass die KI \u00fcber integrierte Beschleuniger, Analysen und Verbindungselemente verf\u00fcgt, um die Erstellung einer hochwertigen KI-L\u00f6sung zu erleichtern.<\/li>\n<li>Die Transparenz der Daten ist ein kritischer Faktor. Sie m\u00fcssen wissen, woher die Daten stammen und welche Art von Daten w\u00e4hrend des Trainingsprozesses verwendet werden. Undurchsichtige, vorgefertigte Modelle m\u00f6gen einfach erscheinen, aber sie k\u00f6nnen Probleme enthalten, die ein Projekt zum Scheitern bringen k\u00f6nnen \u2013 eine Korrektur ist dann nicht mehr m\u00f6glich.<\/li>\n<\/ol>\n<p>Erfahren Sie in diesem Video mehr \u00fcber den <a href=\"https:\/\/www.youtube.com\/watch?v=VmKKmKg6B4I\" target=\"_blank\" rel=\"noopener\">Ansatz von Genesys f\u00fcr dialogorientierte KI<\/a>.[\/vc_column_text][\/vc_column][\/vc_row][vc_row][vc_column]<a class=\"component-cta-block card w-100 h-100 bgc-teal centered cta-text-center \"  href=\"https:\/\/www.genesys.com\/resources\/increase-your-cx-effectiveness-with-conversational-ai?ost_tool=blog&amp;ost_campaign=ft-blog\" target=\"_blank\" rel=\"\"><div class=\"card-body text-center col-content\"><h4 class=\"font-roboto font-swb\">Steigerung der CX-Effektivit\u00e4t mit dialogorientierter KI<\/h4>\n<p>Erfahren Sie, wie Sie bessere automatisierte und menschlich unterst\u00fctzte Gespr\u00e4chserlebnisse bieten k\u00f6nnen.<\/p>\n<div class=\" btn-container justify-content-center mt-2\"><div class=\"btn btn-white\">Lesen Sie das E-Book<\/div><\/div><\/div><\/a>[\/vc_column][\/vc_row][\/vc_section]<\/p>\n<\/div>","protected":false},"excerpt":{"rendered":"<p>[vc_section full_width=&#8220;stretch_row&#8220;][vc_row][vc_column][vc_column_text]Experten f\u00fcr k\u00fcnstliche Intelligenz (KI) werden oft gebeten, ihre Arbeit zu demonstrieren. Sie m\u00fcssen beweisen, dass ihre KI-Technologie funktioniert und sich mit einer alternativen KI-L\u00f6sung messen kann oder besser ist als diese. Das scheint ein gerechtfertigtes Anliegen zu sein. Doch das Messen der KI-Qualit\u00e4t ist schwierig und in einigen F\u00e4llen sogar unm\u00f6glich. Es gibt [&hellip;]<\/p>\n","protected":false},"author":954,"featured_media":491322,"template":"","tax_priority":[54],"tax_blogtype":[17746],"tax_blogcategory":[15930],"tax_contenttheme":[14884],"tax_bundle":[],"tax_contenttheme2":[],"tax_capability_sitewide":[16219],"tax_products_programs":[16496],"tax_buying_job":[16656],"tax_buyer_persona":[16898],"tax_sector":[],"tax_segment":[17118,17131,17077],"class_list":["post-498761","blog","type-blog","status-publish","has-post-thumbnail","hentry","tax_priority-54","tax_blogtype-genesys-de-de","tax_blogcategory-ai-and-machine-learning-de-de","tax_contenttheme-level-up-your-technology-de-de","tax_capability_sitewide-ai-and-automation-de-de","tax_products_programs-genesys-ai-de-de","tax_buying_job-job-2-solution-exploration-de-de","tax_buyer_persona-technical-de-de","tax_segment-midsized-de-de","tax_segment-smb-de-de","tax_segment-enterprise-de-de","tax_content_type-blog-de-de"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/blog\/498761","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/types\/blog"}],"author":[{"embeddable":true,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/users\/954"}],"version-history":[{"count":3,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/blog\/498761\/revisions"}],"predecessor-version":[{"id":503863,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/blog\/498761\/revisions\/503863"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/media\/491322"}],"wp:attachment":[{"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/media?parent=498761"}],"wp:term":[{"taxonomy":"tax_priority","embeddable":true,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/tax_priority?post=498761"},{"taxonomy":"tax_blogtype","embeddable":true,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/tax_blogtype?post=498761"},{"taxonomy":"tax_blogcategory","embeddable":true,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/tax_blogcategory?post=498761"},{"taxonomy":"tax_contenttheme","embeddable":true,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/tax_contenttheme?post=498761"},{"taxonomy":"tax_bundle","embeddable":true,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/tax_bundle?post=498761"},{"taxonomy":"tax_contenttheme2","embeddable":true,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/tax_contenttheme2?post=498761"},{"taxonomy":"tax_capability_sitewide","embeddable":true,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/tax_capability_sitewide?post=498761"},{"taxonomy":"tax_products_programs","embeddable":true,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/tax_products_programs?post=498761"},{"taxonomy":"tax_buying_job","embeddable":true,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/tax_buying_job?post=498761"},{"taxonomy":"tax_buyer_persona","embeddable":true,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/tax_buyer_persona?post=498761"},{"taxonomy":"tax_sector","embeddable":true,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/tax_sector?post=498761"},{"taxonomy":"tax_segment","embeddable":true,"href":"https:\/\/www.genesys.com\/de-de\/wp-json\/wp\/v2\/tax_segment?post=498761"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}