5. Die automatische Wissensakquisition am Beispiel KRITON
5.1. Konzeption und Architektur von KRITON
Das Wissensakquisitions-Werkzeug KRITON gehört zur Gruppe der globalen Systeme, die für sich in Anspruch nehmen, in jedem Wissensbereich Wissen akquirieren zu können. Im Gegensatz dazu sind bereichsspezifische Systeme nur auf einen bestimmten Anwendungsbereich hin ausgerichtet, wie beispielsweise bei dem Wissenserwerbs-Werkzeug OPAL, das speziell für die Krebs-Diagnose und Therapie entwickelt wurde.
In KRITON wird versucht, wesentliche Teile des Wissenserhebungsprozesses im Aufbau von Expertensystemen zu automatisieren und den Wissensingenieur dahingehend zu entlasten. Bei der Konzeption des Systems wurde davon ausgegangen, daß keine Wissensakquisitionsmethode allein mächtig genug ist, das Expertenwissen adäquat zu erfassen. Aus diesem Grund wurde KRITON mit mehreren Wissenserwerbsmethoden ausgestattet.
KRITON kann als interaktives System bei den Wissenserwerbsmethoden Interview und inkrementelle Textanalyse sowohl durch einen Wissensingenieur, als auch durch den Experten benutzt werden. Lediglich die psychologische Kompetenz erfordernde Protokollanalyse und die semi-automatische Wissensbasisgenerierung sollte dem Wissensingenieur mit Kenntnissen in künstlicher Intelligenz vorbehalten bleiben.
Nachdem das deklarative und prozedurale Expertenwissen
durch die geeigneten Methoden erhoben, vervollständigt und auf Konsistenz
überprüft wurde, erfolgt die Übersetzung der Informationen
in eine Zwischenrepräsentationssprache. Anschließend wird die
Wissensbasis durch Frame- und Regelgeneratoren, basierend auf der Zwischenrepräsentationssprache,
aufgebaut. Die Frames und Regeln der so erzeugten Wissensbasis können
bei Bedarf durch Editoren interaktiv korrigiert werden.
5.2. Wissenserwerbsmethoden in KRITON
5.2.1. Interviewmethoden in KRITON
Die Definition des Wissensgebietes und die Aufteilung des umfangreichen Expertenwissens in wohlproportionierte Untergliederungen ist eine wichtige Vorbedingung für die spätere automatische Wissensakquisition. Die grundlegenden Konzepte des Problembereiches werden mit der Technik der forward scenario simulation (siehe Kap. 3.2.1.) erhoben und vom Wissensingenieur in das System eingegeben. Nachdem die Konzepte eingegeben wurden, beginnen die automatischen Interviewtechniken. Automatisch bedeutet in diesem Falle, daß der Experte direkt mit dem System interagiert, also ohne Beteiligung eines Wissensingenieurs. Die Vorgabe-Methode des Systems entspricht dem Konstruktgitteransatz (siehe Kap. 4.1.1., Diederich faßt diese Technik unter den Interviewmethoden zusammen): In einem natürlich-sprachlichen Satz nennt KRITON Tripel semantisch verwandter Konzepte und erwartet vom Experten die Eingabe von Attributen, in denen sich zwei der Elemente gleichen, sich jedoch vom dritten Element unterscheiden. Ist der Experte dazu nicht in der Lage, so nimmt das System an, daß solche Attribute nicht existieren, sondern eine hierarchische Struktur vorliegt. Dementsprechend schaltet KRITON in den Laddering-Modus (siehe Kap. 3.2.1.), um taxonomische Relationen abzufragen.
Das Verfahren ist, abgesehen von dem Intensivinterview zur anfänglichen Konzeptgenerierung, von großer Durchführungsobjektivität. KRITON ersetzt den Wissensingenieur, indem das System dessen Aufgaben übernimmt und gleichzeitig die Subjektivität des Wissensingenieurs durch eine objektive, emotionsfreie Interviewführung ausschließt. Unter der Voraussetzung eines fehlerfrei arbeitenden Systems, kann eine geringfügig erhöhte Zuverlässigkeit erwartet werden. Fehler, die auf mangelnde Konzentration des Wissensingenieurs zurückzuführen sind, wie beispielweise unvollständige Objekt-Attribut-Relationen, werden durch den knowledge-base-watcher (siehe Kap. 5.1.2.3.) vermieden. Die Gültigkeit der Verfahren dürfte durch die Automatisierung nicht beeinflußt werden, da auch bei manueller Ausführung dieser speziellen Techniken der Wissensingenieur keine Kontrollmöglichkeiten besitzt.
Die automatischen Interviewtechniken, die deklaratives
Wissen erfassen, generieren strukturierte Objekte auf der Ebene der Zwischenrepräsentationssprache.
5.2.2. Inkrementelle Textanalyse in KRITON
Phasenmodelle (siehe auch Kap. 6.1.3.) legen es dem Wissensingenieur nahe, seine Arbeit mit der Lektüre der einschlägigen Fachbücher des betreffenden Problembereiches zu beginnen. Diese sehr zeitaufwendige Prozedur kann durch Unterstützung eines Wissensakquisitions-Werkzeuges verkürzt werden. Ziel der automatischen Inhaltsanalyse in KRITON ist es, interessante Textfragmente zu lokalisieren und wichtige Konzepte des Wissensbereiches zu finden (Stichwort-Suche und morphologische Analyse).
Vorbedingung der automatische Inhaltsanalyse ist die maschinenlesbare Aufbereitung der zu analysierenden Texte. Diese Aufbereitung geschieht entweder durch manuelle Eingabe der Texte, oder durch Klarschriftleser (Textscanner), die automatisch maschinenlesbaren Code erzeugen.
In der ersten Phase stellt KRITON statistische
Informationen über die Vorkommenshäufigkeit bestimmter Stichwörter
im Text bereit, wobei unterstellt wird, daß die Häufigkeit einer
Wortnennung etwas über seine Wichtigkeit für den Textinhalt aussagt.
Die potentielle Bedeutsamkeit eines Stichwortes wird durch Lexikonabgleich
ermittelt: In einer Analyse deutschsprachiger Texte mit insgesamt fast
11 Millionen Wortnennungen bei einem Vokabular von ca. 250.000 Wörtern
wurde festgestellt, daß mit nur 200 Wörtern dieses Vokabulars
50% des Textes gebildet wurden. Zu diesen 200 Wörtern zählen
die,
der, und, in, zu. Da diese Wörter für die Analyse irrelevant
sind, werden sie durch Lexikonabgleich herausgefiltert, was den zu untersuchenden
Textumfang merklich reduziert. Der weitere Lexikonabgleich wird auf Nomen
beschränkt, die eventuell relevante Konzepte beschreiben. In einem
Menü- und Fenstersystem werden die so gefundenen Stichwörter
und Phrasen dem Benutzer zur weiteren interaktiven Bearbeitung zur Verfügung
gestellt. Erscheint dem Benutzer die Analyse lohnenswert, so kann er einen
bestimmten, die Stichwörter umgebenden Bereich definieren, der als
Grundlage für die anschließende Generierung der Operator-Argument-Strukturen
dient. Dazu werden die Stichwörter extensional definiert: Der umgebende
Bereich des Begriffes Kommunikation kann beispielsweise durch die
Wörter berichten, diskutieren oder informieren gebildet
werden. Durch den Gebrauch mehrerer Lexika werden schließlich Operator-Argument-Strukturen
gebildet, die dem Benutzer nochmals zur Kontrolle und interaktiven Bearbeitung
angezeigt werden. Durch Auswahl der entsprechenden Konstruktionen wird
die Wissensbasis nach und nach aufgebaut. Zur besseren Dokumentation können
den Konstruktionen bei Bedarf erklärende Kommentare hinzugefügt
werden.
5.2.2.1. Objektivität
Die Durchführungsobjektivität dieser
quantitativen Inhaltsanalyse ist durch das computergestützte, systematisierte
Verfahren als sehr hoch einzuschätzen. Die implementierten Auswahlkriterien
und Lexika kommen bei mehrfacher Analyse desselben Textes prinzipiell immer
auf dasselbe Ergebnis. Erhebliche subjektive Einflüsse machen sich
bei der Beurteilung der, vom Computer erzeugten, Vorschläge bemerkbar.
Die Aufnahme der Operator-Argument-Strukturen in die Wissensbasis oder
deren Verwerfung sollte nicht vom Wissensingenieur, sondern vom Bereichsexperten
entschieden werden, um Fehlinterpretationen auszuschließen. Dadurch
bleibt der Wissensingenieur als weiteres subjektives Moment unbeteiligt.
5.2.2.2. Reliabilität
Fehlerquellen, die die Zuverlässigkeit verringern, können in mehreren Phasen auftreten:
In der Texterfassungsphase treten selbst bei geübten Schreibkräften Fehler auf. Durch das computerbedingte 1:1-matching bei Vergleichsoperationen können Stichworte nur dann als übereinstimmend mit dem Lexikoneintrag erkannt werden, wenn sie maschinenintern identisch dargestellt sind. Auch das automatische Scannen der Texte ist, wegen der noch unvollkommen arbeitenden Texterkennungs-Module, nicht ohne Nachbesserungen durchführbar, wobei wiederum Fehler übersehen werden können.
In der Analysephase wird das Vokabular den verschiedenen Lexika zugeordnet und Stichwörter als potentielle Konzepte vorgeschlagen. Selbst unter der Voraussetzung vollständiger und fehlerfreier Lexikoneinträge, stellt die Mehrdeutigkeit der Begriffe ein großes Problem dar. Lösungsansätze sind mit Kontextroutinen erarbeitet worden, bei denen bis zu 93% aller mehrdeutigen Wörter ihren korrekten Wortsinn zugeordnet bekamen. Dabei wird der Kontext, in dem das mehrdeutige Wort im Text verwendet wird, überprüft und aufgrund bestimmter syntaktischer Kategorien der zutreffende Sinn ermittelt. Festzustellen bleibt jedoch, daß die Fehler in dieser Phase systematischer Natur sind und insofern eine hohe Retest-Reliabilität zu erwarten ist. Diederich und andere bezeichnen die in KRITON integrierte Protokoll- und Inhaltsanalyse als noch fehlerbehaftet, wobei sie eine höhere Reliabilität durch einen Ausbau der Lexika erwarten.
In der Übernahmephase werden die vorgeschlagenen
Operator-Argument-Strukturen bestätigt, editiert oder verworfen und
anschließend in die Wissensbasis übertragen. Da auch der Experte
subjektiven Einflüssen unterworfen ist (Desinteresse, mangelnde Konzentration),
kann es geschehen, daß falsche Strukturen unverändert akzeptiert
und zutreffende Strukturen abgewiesen werden.
5.2.2.3. Validität
Einer der, die Gültigkeit der Ergebnisse beeinflussenden, Faktoren ist die Auswahl der, in maschinenlesbare Codes zu transkribierenden, Literatur. Jedoch können auch hier systematische Kriterien herangezogen werden, beispielsweise die am häufigsten zitierten Quellen bei anderen Autoren (siehe auch Kap. 3.5.1.3.).
Die Unterstellung, daß die Häufigkeit des Auftretens eines Stichwortes etwas über die Wichtigkeit aussagt, muß kritisiert werden. Je nach Textquelle (vor allem in Lehrbüchern) werden ganze Textpassagen als Argumentationskette, unter Verwendung immer wieder anderer Wörter, auf einen Schlüsselsatz mit zentralen Begriffen hin ausgerichtet. In diesen Ausnahmefällen entspricht die Häufigkeit nicht der Bedeutung.
Bei der extensionalen Definition der, die Stichwörter
umgebenden, Bereiche, muß sichergestellt sein, daß die Stichwörter
der Kategorie sinngemäß entsprechen. Das wird um so eher gelingen,
je homogener die Texte nach ihrer sprachlichen Herkunft sind. Fremdsprachliche
Vokabeln werden häufig nicht in ihren breiten Bedeutungsspektren erfaßt.
5.2.3. Protokollanalyse in KRITON
Die Protokollanalyse wird in KRITON zur Erfassung
des prozeduralen menschlichen Expertenwissens benutzt. Diese in Kapitel
3.4.1. beschriebene Methode, liefert beispielsweise Tonbandprotokolle des
"lauten Denkens" des Experten. Bei der schriftlichen Umsetzung in KRITON
werden Sprechpausen des Experten durch Sonderzeichen (**) markiert. KRITON
teilt die Expertenäußerungen in durchnummerierte Segmente auf,
wobei die gekennzeichneten Sprechpausen die Länge der Segmente determinieren.
Nun werden, ähnlich der automatischen Inhaltsanalyse, die in den Segmenten
gefundenen Wörter durch Lexikonabgleich auf ihre Wortart hin untersucht.
So sind z.B. Nomen eventuell relevante Konzepte und können in den
zu erzeugenden Operator-Argument-Strukturen die Argumentpositionen besetzen.
Die Suche nach den dazugehörigen Operatoren (z.B. Adjektive oder Verben)
wird zunächst innerhalb desselben Segments durchgeführt, bei
negativem Ergebnis auch in den benachbarten Segmenten. Zu Dokumentationszwecken
wird zwischen Operator und Argument ein Segmentmarker als Referenz auf
die entsprechende Stelle des Protokolltextes geschrieben. Schließlich
werden die erzeugten Strukturen im Zwischenrepräsentationsmodul zwischengespeichert.
Die dort gespeicherten Strukturen werden dem Wissensingenieur zur interaktiven
Regelgenerierung angeboten.
5.2.3.1. Objektivität
Bei der Durchführungsobjektivität der
Protokollanalyse ist keine Abweichung zu dem in Kapitel 3.4.1.1. Gesagten
feststellbar. Jedoch ist die Auswertungsobjektivität der Tonbandprotokolle
hoch, da die Operator-Argument-Strukturen unbeeinflußt von menschlicher
Subjektivität (z.B. selektive Wahrnehmung), durch den Computer nach
festgelegten Regeln gebildet werden. Die Interpretationsobjektivität
ist geringer als die Auswertungsobjektivität, da der Wissensingenieur
die automatisch erzeugten Regeln akzeptieren, korrigieren oder verwerfen
muß und damit wieder ein subjektives Potential eröffnet wird.
5.2.3.2. Reliabilität
Die Zuverlässigkeit bei der Datenerhebung
entspricht der in Kapitel 3.4.1.2. beschriebenen manuellen Methode. Bei
der Weiterverarbeitung wird auf die Probleme in der Texterfassungs-, Analyse-
und Übernahmephase der inkrementellen Inhaltsanalyse (Kap. 5.2.2.2.)
verwiesen.
5.2.3.3. Validität
Die Gültigkeit der Ergebnisse bei der automatischen
Protokollanalyse unterscheiden sich nicht von der, in Kap. 3.4.1.3. beschriebenen,
manuellen Protokollanalyse.
5.3. Die Zwischenrepräsentation
KRITON benutzt eine Zwischenrepräsentationssprache, um noch unzureichend formalisiertes Wissen abzubilden und zu speichern, und es für den weiteren Erwerbsprozeß zur Verfügung zu halten. Das bedeutet, daß die Zwischenrepräsentationssprache die Zielsprache der Wissenserwerbsmethoden ist. Der Benutzer hat jedoch keine Möglichkeit, hier manuelle Änderungen vorzunehmen, da es sich nicht um eine Programmiersprache handelt, sondern eine systeminterne Sprache zur Verwaltung des erhobenen Wissens.
Die zwischengeschaltete Repräsentationsebene hat überdies den Vorteil, eine größere Offenheit in Bezug auf künftig zu entwickelnde und in das System zu integrierende Wissenserwerbsmethoden zu bieten. Beispielsweise ist die Integration einer grafisch orientierten Networking-Methode (siehe Kap. 4.2.1.) geplant.
Diese Repräsentationssprache besteht aus
zwei Teilen, einem deklarativen und einem prozeduralen Teil:
5.3.1. Deklarativer Teil der Zwischenrepräsentation
Der deklarative Teil ist die Zielsprache für
die Wissenserwerbsmethoden Interview und Textanalyse. Die erfaßten
Konzepte, mitsamt den Attributen und Relationen, sowie die Operator-Argument-Strukturen
bilden in der Zwischenrepräsentation ein semantisches Netz, das später
als Basis für den Frame-Generierungsprozeß dient. In diesem
semantischen Netz bestehen taxonomische und Objekt-Attribut-Relationen.
Taxonomische Relationen beschreiben die hierarchische Struktur der Konzepte,
in Form von Teil-von oder Instanz-von-Beziehungen. Sie werden
von dem Laddering-Modus des Interview-Moduls erhoben. Objekt-Attribut-Relationen
beschreiben die Beziehungen zwischen den Konzepten (Eigenschaft, Keine-Eigenschaft,
Funktion, Keine-Funktion). Die diesbezüglichen Informationen werden
durch die forward-scenario-simulation und den Konstruktgitteransatz
des Interview-Moduls, sowie durch die inkrementelle Textanalyse erhoben.
Zusätzlich besteht die Möglichkeit, freien Text als Kommentar
einzugeben. Bevor der Frame-Generierungsprozeß startet, muß
jedoch der freie Text entweder nach weiteren Relationen analysiert werden,
oder der entsprechende Eintrag wird als Datentyp "Freier Text" unverändert
übernommen.
5.3.2. Prozeduraler Teil der Zwischenrepräsentation
Der prozedurale Teil ist die Zielsprache für die automatische Protokollanalyse. Semantische Primitiva werden benutzt, um die in der Protokollanalyse aufgedeckten Beziehungen zwischen den Konzepten zu beschreiben. Die dabei zur Verfügung stehende Menge des Vokabulars ist unvollständig und muß daher für die jeweiligen speziellen Anwendungsbereiche vervollständigt werden.
Die automatisch eruierten Operator-Argument-Strukturen
erhalten auf der Ebene der Zwischenrepräsentation zusätzliche
Referenzen auf die Segmente des Protokolltextes, für die die erste
Argumentposition der Operator-Argument-Struktur vorbehalten ist. Durch
diesen Index kann bei Bedarf auf das Originalprotokoll des "lauten Denkens"
zurückgegriffen werden.
5.3.3. Der Knowledge-Base-Watcher
Der knowledge-base-watcher (im weiteren "Watcher"
genannt) kontrolliert die deklarative Ebene der Zwischenrepräsentation
auf fehlende Elemente hin. Wurden beispielsweise während der inkrementellen
Textanalyse neue Objekte erzeugt, die in keiner taxonomischen Beziehung
zu den schon vorhandenen Objekten stehen, so bemerkt dies der Watcher,
indem er alle vorhandenen Objekte auf dieser Ebene auf fehlende oder unvollständige
Relationen hin überprüft. Bei Vorliegen einer fehlenden taxonomischen
Beziehung ruft der Watcher die Laddering-Komponente von KRITON auf, bei
fehlender Objekt-Attribut-Beziehung wird die Konstruktgitter-Methode aktiviert.
5.4. Regel- und Frame-Generierung
Die Zwischenrepräsentationssprache, in der
prozedurale und deklarative Elemente zwischengespeichert sind, bildet die
Basis für die Regel- und Frame-Generierung.
5.4.1. Frame-Generierung
Aus den deklarativen Wissenselementen werden Frames
gebildet, die die Informationen aus dem semantischen Netz enthalten. Frames
sind eine andere Methode der Darstellung von Objekt-Attribut-Strukturen
und Relationen: Ein Frame ist die Beschreibung eines Objektes, das sogenannte
Slots
(Abteile) enthält, in denen die mit dem Objekt verbundenen Informationen
gespeichert werden können. Die Slots können aber auch Vorgaben
oder Zeiger auf andere Frames enthalten. Zur Erklärung ein Beispiel:
Slot | Eintragung |
Fahrzeug | Mercedes |
Baureihe | Vorgabe: W 123 |
Leistung | in Tabelle xy nachschauen |
Die Frame-Generierung erfolgt automatisch, da
es sich um einen grundsätzlich einfachen syntaktischen Transformationsprozeß
handelt. Trotzdem haben die Systementwickler die Möglichkeit vorgesehen,
die Übersetzung mit einem Struktureditor interaktiv zu korrigieren.
5.4.2. Regel-Generierung
Operator-Argument-Strukturen, die aus den Segmenten
des Protokolls automatisch extrahiert wurden, werden nach der Aufbereitung
in der Zwischenrepräsentationsebene interaktiv dem Benutzer zur Regel-Generierung
angeboten. Die Bildung der Regeln vollzieht sich über maus-gesteuerte
Menüs, wobei die vorgeschlagenen Strukturen, die nicht vom Benutzer
zurückgewiesen wurden, in den rechten und linken Teil der Wenn-Dann-Strukturen
eingeordnet werden können. Durch einen Regeleditor können eventuelle
Fehler der Protokollanalyse korrigiert werden. Der Wissensingenieur hat
die Aufgabe, bei den Operator-Argument-Strukturen zu entscheiden, was Prämisse
(Wenn) und was Aktion (Dann) ist.