"Die Objektivität, Reliabilität und Validität der Wissensakquisition von Expertensystemen"
© Thimo Echtermann, Universität Dortmund, Dezember 1990





6. Ergebnis der Arbeit

6.1. Einflußfaktoren

Die bisherige Darstellung der Wissenserhebungsmethoden hat gezeigt, daß jede Methode prinzipielle Stärken und Schwächen bei der Akquisition von Expertenwissen besitzt. Neben diesen prinzipiellen Gesichtspunkten ist der Einsatz einer Erhebungsmethode von verschiedenen Einflußfaktoren abhängig, die nachfolgend beschrieben werden.
 
 

6.1.1. Wissensarten

Expertenwissen bildet keine homogene Menge von Informationen, sondern ist vielschichtig und von heterogener Beschaffenheit. Diese Heterogenität bedingt den Einsatz unterschiedlicher Methoden, die die Besonderheiten des Expertenwissens entsprechend ihrer Stärken berücksichtigen.

Die Differenzierung des Expertenwissens ist in der Literatur nicht einheitlich dargestellt, aber eine häufig vorzufindende Unterteilung ist die in deklaratives und prozedurales Wissen.
 
 

6.1.1.1. Deklaratives Wissen

Deklaratives Wissen (knowing that) ist das Wissen um Fakten und deren Beziehungen untereinander, also die Klassifizierung von Wissenselementen. Ist beispielsweise bekannt, daß die Konsumenten in einem bestimmten Marktsegment mindestens die Hochschulreife besitzen, so kann man daraus schließen, daß sie zur Altersgruppe der Erwachsenen gehören. Obwohl die Konstruktion diese Satzes an eine WENN-DANN-Struktur erinnert, stellt die Aussage kein prozedurales Wissen dar. Hier werden Fakten miteinander kausal verknüpft, ohne daß eine konkrete Handlungsanweisung vermittelt wird. Eine andere Form der Verknüpfung von Fakten ist die Darstellung in einer hierarchischen Struktur: Apfel ist eine Subkategorie von Baumobst. Ein Beispiel für Faktenwissen wäre die Kenntnis der Leerlaufdrehzahl eines bestimmten Wagen- und Motortyps. Deklaratives Wissen kann auch heuristische Elemente enthalten. Das heuristische Prinzip beruht auf Wahrscheinlichkeiten, es ist die "Kunst der begründeten Vermutung". Die Heuristik entspricht daher eher den, durch langjährige Praxis entstandenen, Faustregeln, die nicht mit absoluter Sicherheit die richtigen Resultate liefern. Ein Beispiel hierfür wäre die hohe Ausfallwahrscheinlichkeit eines bestimmten Bausteins innerhalb eines technischen Gerätes, die den Experten bei einem Defekt zuerst diesen Baustein überprüfen läßt.
 
 

6.1.1.2. Prozedurales Wissen

Prozedurales Wissen (knowing how) verkörpert das Expertenwissen "in Aktion", in Form konkreter Handlungsanweisungen zur Lösung eines Problems unter gegebenen Voraussetzungen. Im allgemeinen wird prozedurales Wissen in Form von WENN-DANN-Beziehungen erhoben, kann aber auch im Sinne eines Algorithmus durch aufeinanderfolgende Handlungsanweisungen verkörpert werden. Prozedurales Wissen in Form eines Algorithmus findet sich häufig in Reparaturanleitungen, die dem Laien Handlungsanweisungen geben sollen, wie am folgenden Beispiel des Entlüftens einer KFZ-Bremsanlage beschrieben wird:

"Staubkappe vom Entlüftungsventil abnehmen (Arbeitsreihenfolge hinten rechts, hinten links, vorn rechts und zuletzt vorn links). Ventil sauberreiben, durchsichtigen Schlauch auf den Ventilnippel schieben ..."

Im Bereich des prozeduralen Wissens gibt es ebenfalls heuristische Elemente. Zahlreiche "Tricks" und "Kniffe" kennzeichnen den praktisch erfahrenen Experten. Sie führen, wie unter 6.1.1. angesprochen, nur mit einer gewissen Wahrscheinlichkeit zu einem gewünschten Ergebnis. Heuristik ist dann von Nutzen, wenn zur Lösung eines Problems keine Algorithmen existieren, oder deren Anwendung unvertretbar hohen Zeitbedarf bedeutet.
 
 

6.1.1.3. Übersicht

 
Methode Deklaratives Wissen Prozedurales Wissen
Introspektion
+
-
Intensivinterview
+
+
Strukturiertes Interview
++
+
Protokollanalyse
-
++
Inhaltsanalyse
+
-
MDS
++
-
Heidelberger Strukturlegetechnik
++
-
Automatische Wissensakquisition (KRITON)
++
++
                          Abb. 2  
(Abb.2) Legende:
++  geeignete Methode
+ bedingt geeignete Methode
- ungeeignete Methode
  6.1.2. Wissensquellen

Die charakterlichen Besonderheiten eines Experten, sowie die Anzahl der als Wissensquelle zur Verfügung stehenden Experten sind Einflußfaktoren, die bei der Auswahl der Erhebungsmethoden berücksichtigt werden müssen.
 
 

6.1.2.1. Charakterliche Besonderheiten des Experten

Als Beispiel für charakterliche Besonderheiten mag die Introvertiertheit bzw. Extrovertiertheit eines Experten beschrieben werden. Diese Charakterausprägungen wurden in ihren Einflüssen auf einige Erhebungsmethoden empirisch untersucht. Eine bereits in Kapitel 3.4.1.2. zitierte Arbeit von Burton, Shedbolt, Hedgecock und Rugg unterteilte die Studenten gemäß dem Eysenck Personality-Test in intro- und extrovertierte Studenten. So wurde festgestellt, daß introvertierte Studenten im Interview mehr Zeit als ihre extrovertierten Kollegen benötigten (p<0.01), dabei aber eine größere Anzahl der mit den "goldenen Regeln" übereinstimmenden Regeln bildeten (p<0.01), also zuverlässigere Daten erhoben werden konnten. Die übrigen Erhebungsmethoden wurden ebenfalls dahingehend überprüft, zeigten aber keine signifikanten Ergebnisse. Daß introvertierte Personen im Interview längere Zeit benötigen, ist nicht verwunderlich, überraschend ist jedoch die Feststellung, daß sie reliablere Regeln bildeten.
 
 

6.1.2.2. Anzahl der Experten

Bisher wurden die Wissenserhebungsmethoden im Hinblick auf einen einzigen Experten als Wissensquelle untersucht. Besonders leistungsfähige Expertensysteme sind meistens auf die Bedürfnisse eines einzelnen Experten zugeschnitten, dienen diesem als Unterstützung bei der Routinearbeit, aber Systeme, die das Wissen und die Erfahrung mehrerer Experten enthalten, bieten aufgrund ihrer allgemeinen Einsatzfähigkeit einen höheren Nutzeffekt.

Einige Autoren empfehlen daher dringend, das Wissen mehrerer Fachexperten zur Erstellung der Wissensbasis zu erheben. Gerade in sehr komplexen und umfangreichen Wissensgebieten, wie beispielsweise der Medizin oder den Ingenieurwissenschaften, haben sich die Experten auf kleinere Aufgabengebiete innerhalb des Fachgebietes konzentriert. Bei der Entwicklung eines Kopiergerätes ist ein Experte auf die Materialauswahl, ein anderer auf die Elektronik spezialisiert. Ein Expertensystem zur Entwicklung eines Kopierers muß demnach auf dem Wissen mehrerer Experten basieren, um Fehler und Ungenauigkeiten zu vermeiden.

Sind jedoch alle bisher beschriebenen Erhebungsmethoden für die Erfassung des Wissens mehrerer Experten geeignet? Im allgemeinen kann diese Frage bejaht werden. Hart gibt jedoch zu bedenken, daß unterschiedliche Experten auch unterschiedliche Meinungen besitzen. Um Inkonsistenzen der Wissensbasis auszuschließen, müssen sich die Experten auf jeweils eine gültige Aussage einigen. Gruppendiskussionen oder die Anwendung der Delphi-Methode können hierbei behilflich sein. Problematisch bei der Gruppendiskussion ist der Umstand, daß einige Experten zu Wortführern werden und die Gruppenmeinung dominieren. Introvertierte Experten stehen bei der Gruppendiskussion eher im Hintergrund und bringen ihre Meinungen seltener in die Diskussion ein. Die Delphi-Methode hingegen erhebt die Gruppenmeinung schriftlich und anonym, jeder Experte hat ungeachtet seiner charakterlichen Besonderheiten und unbeeinflußt vom Prinzip des "Gruppenzwangs" die Möglichkeit, sein Wissen darzustellen.

Geeignet zur Erfassung des Wissens mehrerer Experten sind die direkten Wissensakquisitionsmethoden, unter der Voraussetzung, daß bei differierenden Ergebnissen adäquate Methoden eingesetzt werden, um widerspruchsfreie Aussagen zu erhalten. Bei den indirekten Techniken sind die Skalierungsmethoden (z.B. MDS, repertory grids) ebenfalls dazu geeignet. Auch hier ist zu beachten, daß die unterschiedlichen Distanzschätzungen egalisiert werden müssen.

Die Strukturierungsmethoden (Heidelberger Strukturlegetechnik beispielsweise) eignen sich hingegen nicht zur Erfassung des Wissens mehrerer Experten, da sie das Wissen über die, im Gedächtnis gespeicherte, individuelle Wissensrepräsentation erhebt. So sind beispielsweise die "subjektiven Theorien", die mit der Heidelberger Strukturlegetechnik erfaßt werden, auf die Person des Experten bezogen und daher nur bedingt mit denen anderer Fachexperten vergleichbar. Der Aufwand durch den anschließenden Einigungs- und Diskussionsprozeß der Experten ist so hoch, daß sich andere Methoden der Wissenserhebung effektiver einsetzen lassen.
 
 

6.1.3. Phasen der Entwicklung

Der Prozeß der Wissenserhebung wird in mehrere Phasen gegliedert, da sich herausgestellt hat, daß keine Erhebungsmethode allein mächtig genug ist, das gesamte Wissen zu erfassen. Eine Spezialisierung der Methoden auf eine bestimmte Phase der Wissensakquisition ermöglicht es, die Vorteile der Methoden gezielt auszunutzen.

In der Vorbereitungsphase erstellt der Wissensingenieur das Anforderungsprofil für das zu konstruierende Expertensystem. Eine Zusammenarbeit mit potentiellen Anwendern verringert die Gefahr, "am Markt vorbei" zu planen. Anschließend beginnt die Suche nach einem Experten (oder mehreren Experten), der sowohl das benötigte Fachwissen besitzt, als auch zur Kooperation bereit ist. Ein, mangels Zeit oder Interesse, nicht kooperierender Experte ist für die Wissensakquisition nahezu unbrauchbar.

In der Orientierungsphase macht sich der Wissensingenieur mit dem Wissensgebiet vertraut, um die Ausführungen des Experten verstehen zu können, und um eine gemeinsame Diskussionsbasis zu erlangen. In dieser Phase sollte der Wissensingenieur die Inhaltsanalyse anwenden. Damit ist er unabhängig vom Experten und kann die knappe Zeit des Experten für die eigentliche Wissenserfassung aufsparen. Durch das Literaturstudium lernt der Wissensingenieur auch umstrittene Meinungen kennen, die er in einem später durchzuführenden Interview nutzbringend anwenden kann. In dieser Phase ist auch das Intensivinterview als Erhebungsmethode anwendbar, hat jedoch den Nachteil, daß wertvolle Zeit des Experten beansprucht wird. Entscheidend ist die Kooperationsbereitschaft und Verfügbarkeit des Fachexperten.

Die Strukturierungsphase ist durch das erstmalige Auftreten des Experten gekennzeichnet. Zuerst erstellt der Wissensingenieur eine Übersicht über die Wissensstruktur des Experten, indem er beispielsweise die wichtigen Konzepte und Attribute des Wissensgebietes erfaßt. Die indirekten Akquisitionsmethoden Heidelberger Strukturlegetechnik und Multidimensional Scaling sind hierfür besonders geeignet, da beide Methoden sowohl die Wissensstruktur, als auch die Beziehungen zwischen den Wissenselementen akquirieren. Hart empfiehlt die Konstruktgitter-Technik (eine Variante der Skalierungstechniken, siehe Kap. 4.1.1.), um allgemeine Prinzipien des Fachgebietes zu erfassen, und um dem Experten einen leichten Einstieg in den Wissensakquisitionsprozeß zu ermöglichen. Obwohl die Methode des Intensivinterviews (Forward Scenario Simulation) als Vorstufe in die Heidelberger Strukturlegetechnik integriert ist, sollte ein Intensivinterview als alleinige Methode nicht angewandt werden, da ein Großteil der Interpretationsleistung des Wissensingenieurs in die Struktur einfließen würde (Kap. 3.2.1.1.). Ein nachfolgendes strukturiertes und standardisiertes Interview, basierend auf dem erhobenen Wissen des Intensivinterviews, kann diesen Mangel zwar ausgleichen, ist jedoch unter Betrachtung von Effizienzkriterien nicht zu empfehlen.

In der Prozeßphase wird das Expertenwissen in Aktion betrachtet. Aufbauend auf der Wissensstruktur wird mit prozeduralen Techniken das angewandte Wissen erhoben, also Regeln, Handlungsanweisungen und Schlußfolgerungsschritte. Mögliche Erhebungsmethoden sind beispielsweise die Protokollanalyse, sowie eine Kombination aus Intensivinterview und strukturiertem Interview.

Bei der automatischen Wissensakquisition am Beispiel KRITON wird das Phasenmodell relativiert, da KRITON die Wissenserhebungsphasen nicht sequentiell abarbeitet, sondern je nach Wissensbedarf, der durch den Knowledge Watcher festgestellt wird, die entsprechende Erhebungsmethode anbietet. Die Wahl der Methode bleibt dem System überlassen, die jedoch durch Kriterien der Wissensart gesteuert wird (Kap. 5.3.3.). Eine andere Methode zur Erstellung eines Expertensystems, die ebenfalls nicht dem Phasenmodell entspricht, ist unter der Bezeichnung rapid prototyping bekannt. Hierbei bearbeitet die, mit einem minimalen Wissenskern versehene, vorläufige Wissensbasis Testfälle unter Aufsicht des Experten und des Wissensingenieurs solange, bis das System zufriedenstellend funktioniert. Auftretende Fehler werden vom Experten analysiert und korrigiert, während der Wissensingenieur die geänderten Regeln oder Fakten einprogrammiert. Anschließend wiederholt sich der Zyklus.

Wird das Expertensystem jedoch auf die Weise konstruiert, daß zuerst das gesamte Expertenwissen vorliegt, bevor die Wissensbasis erstellt wird, empfiehlt sich die Einhaltung des Phasenmodells, um eine problemadäquate Nutzung der Akquisitionstechniken zu ermöglichen.
 
 

6.2. Zusammenfassende Beurteilung

Ziel der Arbeit war es, nicht nur die Erhebungsmethoden auf ihre prinzipielle Objektivität, Reliabilität und Validität hin zu untersuchen, sondern auch eine gezielte Anwendung unter Beachtung von anderen Einflußfaktoren empfehlen zu können. Hierbei hat sich gezeigt, daß die Einflußfaktoren ein erhebliches Gewicht bei der Wahl der Erhebungsmethode darstellen. Eine prinzipiell sehr verläßliche Methode kann bei falschem Einsatz sehr unzuverlässige Daten erheben, genauso wie eine eher schwache Methode, wie beispielsweise die Strukturlegemethode, unter Beachtung des Phasenmodells und im Zusammenwirken mit anderen Techniken gute Ergebnisse zeitigen kann.

Als insgesamt nicht empfehlenswert muß die Methode der Introspektion beurteilt werden. Die mangelnde Qualität ihrer Hauptgütekriterien schließt die Erstellung eines anspruchsvollen Expertensystems aus. Die indirekten Wissensakquisitionsmethoden, die Inhaltsanalyse und das Intensivinterview, haben in den frühen Entwicklungsphasen der Wissensbasis einen akzeptablen Platz erhalten, auf dem sie ihre Stärken zur Geltung bringen können. Als mächtige direkte Wissenserhebungsmethoden können weiterhin Protokollanalyse und strukturiertes, standardisiertes Interview gelten. Die Protokollanalyse ist zur Erfassung prozeduralen Wissens zwar geeignet, hat jedoch den Nachteil einer sehr langwierigen Analyse der aufgezeichneten Protokolle. Außerdem zeigen die bereits erwähnten Laborexperimente von Burton und Anderen, daß die Paralleltest-Reliabilität vergleichsweise gering ist. Die Protokollanalyse sollte daher dann benutzt werden, wenn Forward Scenario Simulation zur Erfassung prozeduralen Wissens nicht anwendbar ist.

Das Interview ist für die Erhebung deklarativen Wissens sehr zu empfehlen, bei prozeduralem Wissen mit geringen Einschränkungen. Introvertierte Personen kommen zwar bei der Erfassung prozeduralen Wissens mit der Interviewvariante Forward Scenario Simulation zu guten Ergebnissen, die übrigen Formen (Intensivinterview und strukturiertes Interview) wurden jedoch empirisch noch nicht auf ihre Reliabilität hin untersucht. Daher führen die, in den Kapiteln 3.2. und 3.3. angeführten, Kritikpunkte zu einer Empfehlung mit Einschränkung bei der Erhebung prozeduralen Wissens. Gleichwohl wird in der Praxis sehr häufig in beiden Fällen mit Interviews gearbeitet, da es ein sehr zeit- und damit kostensparendes Instrument darstellt, im Gegensatz zur Protokollanalyse.

In der nachfolgenden Beurteilungsmatrix werden die in dieser Arbeit näher untersuchten Erhebungsmethoden noch einmal zusammenfassend hinsichtlich ihrer Gütekriterien beurteilt. Dabei bleiben die anderen Einflußfaktoren aus Kapitel 6.1. unberücksichtigt.
 

Methode A B C D E
Introspektion -- -- -- -- --
Intensivinterview O O O O O
strukturiertes, standard. Inter. ++ ++ + ++ O
Protokollanalyse ++ + + + +
Inhaltsanalyse O O O O -
MDS ++ ++ O O O
Heidelberger Strukturanalyse + O ++ + +
               Abb. 3
In der Abb. 3 bedeuten die Buchstaben
A
Durchführungsobjektivität
B
Auswertungsobjektivität
C
Interpretationsobjektivität
D
Reliabilität
E
Validität
 
desweiteren bedeuten:
++
Hohe Güte des Kriteriums
+
akzeptable Güte
O
Güte hängt stark von den Begleitumständen ab, kann bei deren Beachtung jedoch noch steigen
-
geringe Güte 
--
mangelhafte Güte
  Neben diesen "klassischen" Erhebungsmethoden sieht der Verfasser in der semiautomatischen Wissensakquisition, wie sie am Beispiel KRITON vorgestellt wurde, ein hoffnungsvolles Instrument, daß in Zukunft sicherlich an Bedeutung zunehmen wird. Neben dem sehr zu begrüßenden Methoden-Mix und der wissensartrelevanten Wahl der Erhebungsmethode, ist die sehr effiziente Wissenserhebung positiv zu beurteilen. Die Kontrolle und Korrektur der vom System angebotenen Regeln durch einen Experten oder Wissensingenieur, ist mit der zur Zeit noch unzureichenden Verläßlichkeit der auf Wörterbüchern basierenden Analyseprozeduren zu erklären. Es bleibt abzuwarten, ob entscheidende Fortschritte auf dem Gebiet der Künstlichen Intelligenz es erlauben, diese Verläßlichkeit zu erhöhen.

Desweiteren hat diese Arbeit gezeigt, daß die untersuchten Methoden keine absolut zuverlässigen und gültigen Daten erheben können, der Engpaß der Wissensakquisition also weiterhin besteht. Absolute Fehlerfreiheit ist prinzipiell nicht zu erwarten, da auch Experten Fehler machen. Jedoch verhalten sich, durch fehlerbehaftete Wissenserhebung verursachte, Fehler additiv zu den Fehlern des menschlichen Experten. Daher ist ein geplanter Einsatz von Expertensystemen in sicherheitsrelevanten Bereichen sehr kritisch zu beurteilen.