Home Previous Zeitschrift 2005/10 Index
 

 
 
 

 

Das Wissen der Welt

Der USB-Stick von Brockhaus 
 
Die neue Brockhaus-Enzyklopädie umfasst 300 000 Stichwörter auf 24.500 Seiten in 30 Bänden. Wer nicht so viel Platz im Regal hat, kann ab November den kompletten Textinhalt der 30 Bände 
auf einem USB-Stick erwerben. Mit Hilfe des Darmstädter Fraunhofer- Instituts für Integrierte Publikations- und Informationssysteme IPSI hat Brockhaus die Textdaten 
seines voluminösen Nachschlagewerkes für die Speicherung auf einem USB-Stick komprimiert, der an jedem PC ohne Vorinstallation genutzt werden kann. Ein weiteres Novum: die 
natürlichsprachliche Suchfunktion. 
 
Forschungsprojekt zur lexikonbasierten Wissenserschließung 
 
Der Auftrag an das Fraunhofer-Institut, bei der Software- 
Entwicklung mitzuarbeiten, war Teil eines Projekts des Bundesministeriums für Bildung und Forschung zur lexikonbasierten Wissenserschließung. Vorgabe durch den Brockhaus-Verlag war die Entwicklung eines dreidimensionalen Wissensraums, der rund 155.000 Artikel seiner Enzyklopädie thematisch miteinander vernetzt. Das heißt, jeder Artikel sollte Zusammenhänge mit verwandten Artikeln sowie mit Themen aus allen Wissensgebieten aufzeigen. Eine weitere Vorgabe war eine natürlichsprachliche Suchfunktion. Nicht nur die Eingabe eines bestimmten Suchworts sollte den gewünschten Artikel anzeigen, sondern auch die Eingabe ganzer Fragen. Die neue Software kann dadurch mit solchen Fragen wie "Welche Sprache wird in Amerika gesprochen?" umgehen. "Diese Art der Suche ist gerade dann besonders nützlich, wenn der gesuchte Begriff unbekannt ist. und ist bisher einzigartig", so Bernd Kreissig, Geschäftsführer der 
Brockhaus Duden Neue Medien GmbH.  
 
Wissenschaftlich gesehen: 
Extraktion von Fakten aus SGML-Daten 
 
Die Aufgabe des Fraunhofer IPSI war es, eine Taxonomie (ein Klassifikationssystem) der Lexikoneinträge zu erstellen, die die Wissensvernetzung ermöglicht. Dabei wurde automatisch 
möglichst jedem Stichwort ein Oberbegriff zugeordnet. Um dies zu erreichen, mussten aus den Lexikoneinträgen entsprechende Fakten extrahiert und bereitgestellt werden, die dann in die 
Duden-Ontologie importiert werden konnten.
 
Die Arbeitsgruppe "ConTec" im Fraunhofer IPSI konnte - unter der Leitung von Dr. Thomas Kamps - aus den Texten der Lexikonartikel automatisch Hierarchierelationen generieren. Aus 
Benutzersicht lässt sich damit in der neuesten Version der "Brockhaus Enzyklopädie" ein sogenanntes "ontologisches Kontextmenü" aufklappen. Beispielsweise erhält er zu dem Artikel "Franz Grillparzer" nicht nur die Information "österreichischer Dichter", sondern gleichzeitig auch Verweise zu Artikeln höherer Ebenen, etwa über österreichische oder deutschsprachige Literatur.
 

Fraunhofer-Institut für 
Integrierte Publikations- und 
Informationssysteme IPSI 
Darmstadt


Zum Seitenanfang
 

© ADOLPH Verlag GmbH - Letztes Update 11.11.2005