|
Zusammenfassung
Dieser Text befasst sich mit der Bedeutung von Ontologien für
die Weiterentwicklung des World Wide Web zu einem Semantischen Web.
Dabei wird zunächst die Grundidee des Semantic Web erläutert
und dargestellt, wie Ontologien dabei helfen sollen, eine neue Bedeutungsebene
zum Internet hinzuzufügen. Anschließend wird die typische
Struktur von Ontologien beschrieben. Danach muss die Frage aufgeworfen
werden, warum eine Umsetzung der Semantic Web Idee bislang scheiterte.
Das Social Semantic Web wird als ein Lösungsansatz für
diese Problematik vorgestellt.
Abstract
This text deals with the significance of ontologies as a means to
turn the World Wide Web into a Semantic Web. At first, the underlying
idea of the Semantic Web is introduced and we explain the role of
ontologies for adding information about meanings to Websites. It
is also discussed why the Semantic Web has not yet become reality
and how the Social Semantic Web might help to overcome the current
difficulties in Semantic Web research.
1. Einleitung: Die Vision vom Semantic
Web
Die Idee zu einem semantischen Web wurde maßgeblich
geprägt (wenn auch nicht initiiert) durch eine Veröffentlichung
von Tim Berners-Lee, James Hendler und Ora Lassila im Jahre 2001.
Darin skizzieren die Autoren ihre Version von einem erweiterten
und verbesserten World Wide Web: Daten sollen so aufbereitet werden,
dass nicht nur Menschen diese lesen können, sondern dass auch
Computer in die Lage versetzt werden, diese zu verarbeiten und sinnvoll
zu kombinieren. Sie beschreiben ein Szenario, in dem „Web
agents“ dem Nutzer bei der Durchführung komplexer Suchanfragen
helfen, wie beispielsweise „finde einen Arzt, der eine bestimmte
Behandlung anbietet, dessen Praxis in der Nähe meiner Wohnung
liegt und dessen Öffnungszeiten mit meinem Terminkalender zusammenpassen“.
Die große Herausforderung liegt hierbei darin, dass Informationen,
die über mehrere Webseiten verteilt sind, gesammelt und zu
einer sinnvollen Antwort kombiniert werden müssen. Man spricht
dabei vom Problem der Informationsintegration (Information Integration).
Diese Vision der weltweiten Datenintegration in einem Semantic Web
wurde seither vielfach diskutiert, erweitert und modifiziert, an
der technischen Realisation arbeitet eine Vielzahl verschiedener
Forschungseinrichtungen.
Einigkeit besteht dahingehend, dass eine solche Idee
nur mit der Hilfe neuer bedeutungstragender Metadaten verwirklicht
werden kann. Benötigt werden also neue Ansätze zur Indexierung
von Web-Inhalten, die eine Suche über Wortbedeutungen und nicht
über bloße Zeichenketten ermöglichen können.
So soll z.B. erkannt werden, dass es sich bei „Heinrich Heine“
um den Namen einer Person handelt und bei „Düsseldorf“
um den Namen einer Stadt. Darüber hinaus sollen auch Verbindungen
zwischen einzelnen Informationseinheiten festgehalten werden, beispielsweise
dass Heinrich Heine in Düsseldorf wohnte. Wenn solche semantischen
Relationen konsequent eingesetzt werden, können sie in vielen
Fällen ausgenutzt werden, um neue Schlussfolgerungen zu ziehen.
Nehmen wir beispielsweise den Fall, dass eine Person A einen Bruder
(Person B) hat, der wiederum einen Sohn hat (Person C). Mit dem
richtigen Hintergrundwissen lässt sich daraus ableiten, dass
Person B folglich der Onkel von Person C ist (Beispiel modifiziert
nach Daconta et al., 2003).
Derartige Informationen über die Bedeutung einzelner
Worte oder anderer Informationseinheiten und deren Beziehungen untereinander
sollen ergänzend an bestehende Webseiten angefügt werden
und so eine zusätzliche „semantische“ Ebene zum
traditionellen Internet bilden, wie Berners-Lee, Hendler und Lassila
(2001) es beschreiben:
„The Semantic Web is not a separate
Web but an extension of the current one, in which information
is given well-defined meaning, better enabling computers and people
to work in cooperation.“
Den Entwicklern geht es dabei nicht darum, einem Computer
tatsächlich beizubringen, Informationen zu verstehen (wie es
in der Künstlichen-Intelligenz-Forschung oftmals angestrebt
wird), sondern vielmehr darum, Internetdienste für praktische
Anwendungsszenarien zu entwickeln (Hitzler et al., 2008). Computer
sollen also nicht lernen, „normale“ Webseiten zu lesen,
sondern die Webseiten sollen mit zusätzlichen Informationen
versehen werden, die für den Computer interpretierbar sind.
Indexierung im Sinne des Semantischen Webs basiert also auf komplexen
Metadaten oder sogenannten „Semantic Markups“ (Pan,
2007). Das sind maschinenlesbare Index-Terme, welche einer Webseite
(bzw. einzelnen Informationseinheiten innerhalb einer Webseite)
zugewiesen werden. Aus technischer Sicht erfordert diese Idee neue
Entwicklungen im Bereich maschinenlesbarer Auszeichnungssprachen,
die solch eine feingliedrige Indexierung ermöglichen.
Über die technische Ebene hinaus benötigt
das Semantische Web noch etwas anderes: hochwertige Wissensrepräsentationsmodelle,
welche das Wissen eines oder mehrerer Interessensgebiete in einer
allgemein akzeptierten Form verzeichnen. Man braucht ein gemeinsames
kontrolliertes Vokabular für die Indexierung im Sinne eines
Semantic Web, das wesentliche Begriffe und deren Beziehungen zueinander
umfasst, eine Ontologie.
Für die Realisierung der Semantic Web Vision werden also sowohl
standardisierte und kompatible Technologien zur Erstellung und Anwendung
von semantischen Metadaten benötigt als auch Ontologien als
komplexe und ausdrucksstarke Wissensrepräsentationssysteme.
Des Weiteren reicht es nicht, diese Techniken
und Wissensmodelle bereitzustellen, sie müssen darüber
hinaus auch noch auf die bestehenden Internetseiten angewandt werden.
Das alles macht die Idee vom Semantic Web zu einer enormen Herausforderung
für alle Beteiligten – und wirft vielfach Zweifel daran
auf, ob ein solches semantisches Web jemals umfassend realisiert
werden kann. Eine beachtliche Forschergemeinschaft hat diese Herausforderung
angenommen und arbeitet hoch engagiert an den Grundlagen des Semantic
Web. Die Semantic Web Science Association1 (SWSA | www.iswsa.org)
hat sich dabei als eine treibende Kraft etabliert und auch das World
Wide Web Consortium2 (W3C | www.w3.org
bzw.
www.w3.org/2001/sw/) unterstützt die
Entwicklung von Standards. Legg (2007) nennt das Semantic Web auch
„the most ambitious project the W3C has scaffolded so far”.
In Bezug auf die technische Infrastruktur sind dabei
bereits einige wesentliche und grundlegende Innovationen gelungen.
Shadbolt, Berners-Lee und Hall (2006) nennen vor allem die folgenden
Aspekte als bemerkenswerte Meilensteine der Semantic-Web-Forschung:
- Ontologiesprachen zur standardisierten Wissensrepräsentation
(wobei die Web Ontology Language OWL | www.w3.org/TR/owl-guide/
mit ihren drei Dialekten derzeit die wohl bekannteste Ontologiesprache
ist)
- Regelmechanismen und zugehörige Algorithmen
für das automatische Schließen zur Ableitung impliziter
Informationen (Reasoning/ Inferencing Technologies),
- Speichertechnologien für große Ontologien
(insbesondere sogenannte Triple Stores),
- Abfragesprachen, um Informationen in Ontologien
zu suchen, und Methoden, um strukturierte Informationen aus Webseiten
zu extrahieren (Information Extraction).
Hinzu kommen noch zahlreiche Programme, die
bei der Erstellung und Verwaltung von Ontologien helfen, sogenannte
Ontologie-Editoren (das wohl bekannteste Beispiel hierfür ist
Protégé |
http://protege.standford.edu).
2. Ontologien als neue Methode der
Wissensrepräsentation
Diese technologischen Entwicklungen bilden also den
Grundstein für semantische Indexierung im WWW, enthalten jedoch
per se noch keinerlei semantische Informationen. Eine Ontologiesprache
allein macht noch keine Ontologie. Erst wenn mit einer solchen Sprache
Wissensbausteine umgesetzt werden, kann eine semantische Repräsentation
entstehen, die wiederum zur Indexierung des Webs herangezogen werden
kann. Andererseits ist die Formalisierung in einer Ontologiesprache
notwendig, damit ein Wissensmodell auch tatsächlich im Sinne
des Semantic Web eingesetzt wird – um beispielsweise automatische
Schlussfolgerungen und Konsistenzprüfungen zu ermöglichen
(Gómez-Pérez et al., 2004). Ontologien sollen also
die technischen und semantischen Anforderungen an eine zukunftsfähige
Wissensrepräsentationsmethode für das semantische Web
erfüllen.
Die Bezeichnung Ontologie leitet sich ab aus
dem griechischen Ontologia, was in etwa soviel bedeutet wie „Lehre
vom Sein“. Es bezeichnete ursprünglich eine philosophische
Disziplin, die sich mit den Grundstrukturen und dem Wesen allen
Seins befasst. Im Rahmen der Computerwissenschaft wurde der Term
Ontologie aufgegriffen und mit einer eigenen Bedeutung versehen.
Allgemein gefasst bezeichnet Ontologie hier eine formale Konzeptualisierung
eines Wissensbereichs („a formal conceptualization of a knowledge
domain“, mit ihren drei Dialekten
derzeit die wohl bekannteste Ontologiesprache ist), Gruber, 1993).
Zahlreiche weitere Begriffserklärungen wurden und werden in
der Literatur zitiert, eine endgültige und eindeutige Definition,
die von allen beteiligten Forschungsgruppen geteilt wird, gibt es
dabei allerdings bis heute nicht.
Die Formalisierung von Themenbereichen in Ontologien
erfolgt typischerweise in Form von Klassen (bzw. Konzepten)
und Instanzen (bzw. Individuals) – die Terminologie
von Ontologiebestandteilen und deren genaue Ausprägungen können
jedoch von Ontologiesprache zu Ontologiesprache variieren. Klassen
repräsentieren dabei Allgemeinbegriffe, also abstrakte Konzepte
eines Interessensgebiets, und sind hierarchisch über IS-A Beziehungen
strukturiert (im Sinne der Hyponymie); Instanzen repräsentieren
Individualbegriffe, also konkrete Vertreter der einzelnen Klassen,
die in der jeweils untersten Hierarchieebene angesetzt werden.
Beispielsweise könnte es eine Klasse „Personen“
mit einer Unterklasse „Schriftsteller“ geben, welche
wiederum mit einer Instanz „Heinrich Heine“ verbunden
ist. Konzepte bzw. deren Instanzen können weiter in ihrer Bedeutung
spezifiziert werden, oft geschieht dies durch sogenannte Properties,
welche die Konzepteigenschaften über semantische Relationen
darstellen. Zum Einsatz von Properties gibt es verschiedene Möglichkeiten:
entweder erfasst die Property eine Beziehung zwischen zwei Konzepten/Instanzen
(z.B. „ist_verwandt_mit“ oder „ist_ein_Teil_von“)
oder die Property weist einem Konzept/ einer Instanz eine Eigenschaft
mit einem gewissen Wert zu (z.B. „hat_Geburtsjahr“ mit
einer Jahreszahl als Wert, ohne dass alle denkbaren Jahreszahlen
als Instanzen in die Ontologie aufgenommen werden müssen).
Auf diese Weise können Fakten aus dem betrachteten Themengebiet
in der Ontologie gespeichert werden. Die Ontologie ist nicht mehr
nur Indexierungsvokabular, sondern wird selbst zu einer Wissensbasis.
Abbildung 1 zeigt, wie diese Ontologiebausteine mit Hilfe des Ontologie-Editors
Protégé erstellt werden. Anschließend werden
die Daten z.B. als OWL-Datei ausgegeben und weiterverarbeitet.
|
 |
Abb. 1: Ein Beispiel für
typische Ontologie-Elemente in der Benutzeroberfläche
des Ontologie-Editors Protégé. |
|
|
Schließlich besteht in formalen Ontologien noch
die Möglichkeit, Klassen mit Hilfe von Restrictions
(oder Axiomen) formal fest zu definieren. Diese fixieren
Aussagen, die generell für die betrachtete Domäne gültig
sind. Gehen wir davon aus, dass in einer Ontologie bereits eine
Klasse „Schriftsteller“ mit verschiedenen Schriftstellern
als Instanzen sowie eine Property „hat_Nationalität“
mit den verschiedenen Nationalitäten, die den Schriftstellern
zugewiesen werden, verfügbar sind. Eine neue Klasse „deutsche
Schriftsteller“ könnte dann formal so definiert werden,
dass es sich dabei um die Untermenge der Klasse „Schriftsteller“
handelt, für die die Property „hat_Nationalität“
auf jeden Fall den Wert „deutsch“ annimmt. Ein Reasoner
kann dann eine Instanz der Klasse „Schriftsteller“,
die diese Bedingung erfüllt, automatisch der Klasse „deutsche
Schriftsteller“ zuweisen. Je nach Ontologiesprache stehen
unterschiedlich ausdrucksstarke Restrictions für die formale
Definition von Klassen zur Verfügung.
Eine Ontologie, die all diese Möglichkeiten ausschöpft,
unterscheidet sich deutlich von klassischen Methoden der Wissensrepräsentation
wie Thesauri und Klassifikationen. Mit Klassenhierarchien und Properties
können Ontologien nicht nur das Standard-Repertoire semantischer
Relationen abdecken (Hyponymie, Meronymie, Synonymie und Assoziationsrelation)
(Peters & Weller, 2008a), sie ermöglichen auch den Einsatz
weiterer spezifizierter Verbindungen zwischen den Konzepten eines
Interessensgebietes und bilden so die Grundlage für verfeinerte
semantische Repräsentationen. Der Einsatz von Datatype Properties
eröffnet weitere Möglichkeiten für die präzise
Definition einzelner Konzepte und die Einbindung von Fakteninformationen
über Instanzen. Die formale Unterscheidung zwischen Klassen
und Instanzen ist so bislang in keinem klassischen Wissensrepräsentations-Typus
realisiert. Darüber hinaus wird eine Ontologie durch den Einsatz
einer standardisierten Ontologiesprache maschinenlesbar und interpretierbar.
Mit der Ausdrucksmächtigkeit von Ontologien
ist umgekehrt jedoch auch ein Problem verbunden: Diese detaillierte
Darstellung lässt sich in der Praxis oft nur für eng begrenzte
Themenbereiche umsetzen. Nur wenige Projekte wie die Cyc Ontologie
(www.cyc.com)
versuchen sich daran, detailliert universelles Weltwissen abzubilden.
Andere Ontologieprojekte befassen sich eher mit der Erstellung von
Wissensmodellen für spezialisierte, eng abgegrenzte Themengebiete,
wie etwa verschieden Ontologien im Bereich der Life Sciences (Bodenreider
& Stevens, 2006). Dies liegt zum einen an dem hohen Aufwand,
den die Erstellung eines feingliedrigen Wissensrepräsentationssystems
mit sich bringt. Zum anderen liegt es bis zu einem gewissen Grad
auch noch an Schwierigkeiten in der Handhabung der großen
Datenmengen, die hinter einem Wissensmodell stecken, das in einer
formalen Ontologiesprache verfasst ist. Die praktische Umsetzung
von Ontologien unter Ausnutzung des Modellierungsspektrums von Properties
und Restrictions erfordert Fachkenntnisse und einige Übung.
Mit der Vision eines neuen, komplexeren und hoch-ausdrucksstarken
Begriffssystems können aktuelle Ontologieprojekte so auch oftmals
noch nicht mithalten. Viele Ontologien, die derzeit für den
Einsatz im Semantic Web entwickelt und diskutiert werden, übertreffen
kaum die Ausdrucksfähigkeit traditioneller Thesauri. Oft zeichnen
sie sich vor allem dadurch aus, dass sie in einer Ontologiesprache
wie OWL abgespeichert wurden – ohne jedoch die formalen Möglichkeiten
auszuschöpfen. Die aktuelle Lage von Ontologien als Mittel
zur semantischen Anreicherung des WWW sieht also noch recht verhalten
aus.
3. Die Umsetzung der Semantic Web
Idee
Trotz zahlreicher ambitionierter Forschungsprojekte
ist das Semantic Web insgesamt noch deutlich davon entfernt, weltweit
Realität zu werden und das „herkömmliche“
Internet abzulösen. Doch woran liegt das? Verschiedene Erklärungsversuche
wurden und werden diskutiert – ebenso wie einzelne Lösungsansätze.
Der Mangel an verfügbaren, ausdrucksstarken Ontologien hängt
wechselseitig zusammen mit dem Fehlen eines publikumswirksamen Semantic-Web-Dienstes:
Solange eine überzeugende Muster-Anwendung fehlt, sind wenige
bereit, Zeit und Aufwand in die Erstellung von Ontologien zu investieren.
Umgekehrt können semantische Dienste ohne zu Grunde liegende
Ontologien nicht flächendeckend in Kraft treten. So bleiben
Anwendungen wie ontologie-basierte Sucherweiterungen oder automatische
Faktenextraktion aus Texten bislang begrenzt auf spezialisierte
Einzelanwendungen für eng begrenzte Fach-Communities. Gesucht
wird jedoch die sogenannte „Killer App“ des Semantic
Web, ein Dienst, der gleichzeitig überzeugend effektiv und
einfach nutzbar ist und so große Teile der Internetnutzerschaft
einbezieht und ein Leitbild für nachfolgende Dienste werden
kann. Bislang scheiterte die Praxis an einem solchen Angebot.
Der wohl am leichtesten nachvollziehbare Grund für
den ausbleibenden Durchbruch des Semantic Web ist die enorme Größe
des World Wide Web. Die Anreicherung des gesamten WWW mit semantischen
Metadaten ist eine schier endlose Aufgabe. Das bedeutet einerseits,
dass ein riesiger (und stetig wachsender) Indexierungsaufwand zu
bewältigen ist, und andererseits, dass eine Vielzahl von Themenbereichen
durch Ontologien erfasst und abgedeckt werden muss. Ein umfassendes
Semantic Web wird daher in direkter Zukunft sicherlich noch keine
Realität.
Von semantischen Technologien werden wir aber dennoch
im Internet profitieren können. Der Forschungsschwerpunkt hat
sich von einem einzigen, allumfassenden semantischen WWW weg verlagert,
hin zu einzelnen semantischen Diensten (Semantic Applications)
für den normalen Internetnutzer, also nicht nur für spezielle
Expertengruppen. Immer mehr Internetdienste nutzen technische Grundlagen
des Semantic Web innovativ aus (Carstens, 2008), auch für Einsatzbereiche
in geschlossenen Systemen wie Intranets werden Anwendungen erarbeitet.
Einige der jüngsten Entwicklungen konnten beispielsweise als
Demos auf den letzten International Semantic Web Conferences begutachtet
werden (siehe z.B. Bizer & Joshi, 2008), darunter neue semantische
Recommender-Systeme, Systeme für semantische Bildersuche oder
die Verknüpfung typischer Computerprogramme des täglichen
Lebens zum „semantischen Desktop“. Die Entstehung einer
Semantic Web Killer Application ist damit möglicherweise schon
deutlich näher gerückt.
Mit der Fokussierung auf ein dezentralisiertes Semantic
Web bestehend aus verschiedenen Einzeldiensten, die sich der gleichen
semantischen Technologien bedienen, gehen einige weitere Herausforderungen
einher. Wesentlich wird sein, dass diese Einzeldienste letztlich
sinnvoll miteinander interagieren können. Die Verbindung von
Datenbeständen wird derzeit zu einem der Schwerpunktthemen
der Semantic-Web-Forschung, damit einzelne isolierte „Data
Silos“ verhindert werden (Bizer et al., 2007). Aber auch die
Möglichkeiten zur Verbindung verschiedener Ontologien müssen
noch stärker in den Blickpunkt rücken, als es bislang
der Fall ist. Hier werden derzeit zwar zahlreiche Techniken und
Algorithmen für das Verknüpfen (Mapping) und
Verschmelzen (Merging) von Ontologien entwickelt, es fehlen
jedoch noch Ideen, wie dies im Rahmen der tatsächlichen Nutzung
des Internets praktisch umgesetzt werden kann. Welche Konsequenzen
ergeben sich, wenn zahlreiche kleine Einzelontologien miteinander
interagieren müssen?
Insgesamt wurde bisher bei der Semantic-Web-Forschung
der Schwerpunkt vor allem auf technologische Entwicklungen gesetzt.
So fand auch eine Standardisierung bislang auf technischer Ebene
statt, insbesondere bezogen auf Ontologiesprachen als standardisierte
Austauschformate. Auf semantischer Ebene fehlen jegliche Standardisierungen
bislang: Darüber, wie bestimmte Bedeutungen einheitlich repräsentiert
werden sollen, wird nur am Rande der Semantic Web Community diskutiert.
Das heißt vor allem, dass beim Aufbau einer Ontologie keinerlei
Vorgaben verfügbar sind, wie bestimmte Zusammenhänge abzubilden
sind. Klassendefinitionen werden von jedem Ontologie-Entwickler
selbst gewählt und in der Regel höchstens in kleinen Teams
diskutiert. Auch kann derzeit jeder, der eine Ontologie aufbaut,
beliebige Properties zur Verbindung von Ontologie-Klassen erstellen
und einsetzen. Gemeinsame, gar weltweit gültige Vereinbarungen
z.B. bezüglich der Formulierung von Teil-Ganzes-Beziehungen
zwischen Konzepten fehlen.
Mit der Wende in Richtung einzelner Semantic Applications scheint
auch der Ansatz einer gemeinsamen Wissensrepräsentation zunächst
aus dem Blick verloren. Dabei gilt die Idee einer Konsens-Abbildung
im Sinne der „Shared Conceptualization“ eigentlich als
eine der Grund-Definitionen für Ontologien (Borst, 1997). In
einem Semantic Web, das aus zahlreichen Einzelontologien in verschiedenen
Anwendungen besteht, ist das sinnvolle Verknüpfen von Ontologien
anhand gleicher bedeutungstragender Elemente entscheidend.
Das Fehlen von Standardisierungen setzt sich auf der
Ebene der ontologie-basierten Indexierung fort. Strategien für
das tatsächliche Indexieren von Web-Inhalten mit Ontologien
sind generell noch nicht ausreichend entwickelt, so fehlen auch
Richtlinien für ein einheitliches Vorgehen. Experimentiert
wird derzeit vor allem mit verschiedenen automatisierten und semi-automatischen
Verfahren. Zur Qualitätssicherung muss hier jedoch auch der
Nutzer stärker mit in den Prozess einbezogen werden. Ansätze
aus dem Bereich des Nutzer-fokussierten Web 2.0 könnten hier
wertvolle Impulse liefern.
4. Folksonomy trifft Ontologie: Ein Ausblick auf das Social Semantic
Web
Als ein Lösungsansatz für die Probleme des
Semantic Web zeichnet sich derzeit die Verbindung von semantischen
Technologien mit Web 2.0 (bzw. Social Web) Strategien ab. Man spricht
hier von einem Social Semantic Web als neue Zielrichtung. Web 2.0
bezeichnet dabei eine in jüngster Vergangenheit stark zunehmende
Tendenz im Internet, Dienste bereitzustellen, die maßgeblich
von der aktiven Beteiligung ihrer Nutzer leben. Internetnutzer kommentieren
beispielsweise das Tagesgeschehen, schreiben Nutzerberichte oder
Lexikonartikel, teilen private Fotos und Videos mit anderen, legen
Steckbriefe über sich an und vernetzen sich mit Freunden und
Bekannten – und die Internetnutzer indexieren selbst ihre
auf den verschiedenen Plattformen eingestellten Inhalte mit Hilfe
freier Keywords, sogenannten Tags. Mit dem Social Tagging,
dem unkontrollierten Verschlagworten durch Nutzer-Communities ist
somit ein neues Indexierungsmodell geboren: die Folksonomie
(Peters, 2009).
Durch das völlige Fehlen einer Vokabularkontrolle
sowie jeglicher Regeln kann die Folksonomy als Gegenpol zu klassischen
Methoden der Wissensrepräsentation aufgefasst werden. Und auch
im Vergleich mit Ontologien als Semantic-Web-Indexierung erscheint
sie zunächst als völlig konträre Herangehensweise.
Letztlich wird jedoch auch das Semantic Web nicht ohne die Einbeziehung
von Nutzer-Beiträgen zustande kommen können – und
muss sich daher auch mit solchen Alternativlösungen zunehmend
auseinandersetzen. Sowohl bei der Erstellung umfassender Ontologien
als auch bei ihrer Anwendung auf Dokumente ist die Mithilfe einer
interessierten Nutzergemeinschaft von großer Bedeutung. Die
Semantic-Web-Forschergemeinschaft befasst sich bereits seit einiger
Zeit mit Werkzeugen zum gemeinschaftlichen Ontologieaufbau. Derartige
Ansätze werden nun massiv ausgebaut und in verschiedener Hinsicht
durch Kombinationen von Semantic und Social Web erweitert werden
(Ankolekar et al., 2007; Blumauer & Pellegrini, 2008; Greaves,
2007; Hotho & Hoser, 2007), darunter beispielsweise semantische
Wikis (Buffa et al., 2008; Lange et al., 2008) oder Software für
semantisches Blogging (Bojars et al., 2008). Die Forschungsfragen
sind dabei sinngemäß vor allem ‚Was kann das Semantic
Web vom Erfolg des Web 2.0 lernen?’ und ‚Wie können
semantische Technologien den Wert von Web 2.0 Angeboten noch steigern?’
(Mika & Greaves, 2008).
Für das Semantic Web-Ziel der Annotation von
Webseiten mit semantischen und maschinenlesbaren Metadaten kann
das Web 2.0 durch die Einbeziehung der Nutzer dabei vor allem zwei
Aspekte beisteuern: Arbeitskraft und das gesammelte Wissen der Community.
Die Einbeziehung von großen Internet-Nutzergruppen ist sowohl
für den Aufbau von Ontologien als auch in der Indexierung denkbar.
Auch die Pflege von Ontologien (z.B. das langfristige Einpflegen
neuer Instanzen) kann hierdurch auf einer umfassenden Ebene realisiert
werden. Folksonomy-Nutzer haben den Sinn von inhaltsbeschreibenden
Metadaten für die Organisation ihrer eigenen Dokumente (darunter
auch viele nicht-textuelle Dokumente wie Fotos und Videos) erkannt
und wenden Tags zum persönlichen Informationsmanagement an.
Wenn es gelingt, den Nutzern auch die Vorteile kontrollierter Vokabulare
und ontologie-basierter Schlussfolgerungsmechanismen spielerisch
näher zu bringen, ist ein großer Schritt in Richtung
des Semantic Web getan. Dies ist natürlich auch nicht ohne
Aufwand möglich, insbesondere für die Gestaltung ansprechender
Nutzer-Schnittstellen liegen hier einige Herausforderungen. Erste
Ansätze finden sich vor allem im Bereich des Tag Gardening
(Peters & Weller, 2008b).
Durch die Einbeziehung einer Community kann auch die
Vision einer gemeinsam akzeptierten Bedeutungsebene wieder aufgenommen
werden. Durch die direkte (über Diskussionen) und indirekte
(z.B. über die Auswertung nutzergenerierter Tagging-Daten)
Nutzer-Interaktion kann eine neue Form von „shared conceptualization“
definiert werden.
Die praktische Umsetzung ist auch hier natürlich noch mehr
Vision als Realität, rückt aber zunehmend in das Bewusstsein
der Forschung.
Fazit
Das Semantic Web ist die Vision eines erweiterten
World Wide Web, in dem inhaltsbeschreibende, computerlesbare Metadaten
eine neue Bedeutungsebene erschließen. In technischer Hinsicht
ist das Semantic Web mit verschiedenen Ontologiesprachen, Ontologieeditoren
und Reasonern bereits gut ausgestattet. Dennoch fehlt der entscheidende
Punkt: ausgereifte, bedeutungstragende Ontologien sowie Strategien
für ihre flächendeckende Anwendung im WWW.
Ontologien als Methoden der Wissensrepräsentation
bieten zwar eine reiche semantische Grundstruktur, doch ihre weitreichende
Anwendung auf das WWW wird derzeit noch durch zahlreiche Schwierigkeiten
behindert. Dazu zählen insbesondere der enorme Aufwand, der
für die Erstellung komplexer Wissensrepräsentationsmodelle
aufgebracht werden muss und die Schwierigkeiten bei der Einigung
auf eine gemeinsame Darstellungsform für eine große Nutzer-Community.
Auf viel weniger kontrolliertem Wege hat das Web 2.0 mit seinen
Folksonomy-basierten Social-Software-Diensten bereits für eine
neue Bedeutungsebene im WWW gesorgt. Social Tagging ist der erste
Schritt in Richtung einer neuen Web-Navigation basierend auf Wortbedeutungen.
Die automatische Integration verschiedener Informationseinheiten
z.B. für semantische Suchsysteme kann damit jedoch nicht realisiert
werden. Langfristig muss sich das Soziale mit dem Semantischen Web
in verschiedener Hinsicht verbinden, so dass nutzergenerierte Basis-Metadaten
durch Ontologien in maschinenlesbare Semantik umgewandelt werden
können.

Literatur
Ankolekar, A., Krötzsch, M., Tran, T., &
Vrandecic, D. (2007). The Two Cultures: Mashing Up Web 2.0 and the
Semantic Web. In 16th International World Wide Web Conference (WWW
2007). Banff, Alberta, Canada (pp. 825–834). Red Hook, NY:
Curran.
Berners-Lee, T., Hendler, J., & Lassila, O. (2001).
The Semantic Web. Scientific American, 284(5), 34–43.
Bizer, C., Heath, T., Ayers, D., & Raimond, Y.
(2007) Interlinking Open Data on the Web. In Proceedings of the
Demonstrations Track 4th European Semantic Web Conference (ESWC2007).
Innsbruck, Austria. Retrieved November 10, 2008, from http://www.eswc2007.org/demonstrations.cfm.
Bizer, C., & Joshi, A. (Eds.) (2008). ISWC2008
Posters and Demonstrations: Proceedings of the Poster and Demonstration
Session at the 7th International Semantic Web Conference (ISWC2008).
Karlsruhe, Germany. CEUR Workshop Proceedings, 401.
Blumauer, A., & Pellegrini, T. (Eds.) (2008).
Social Semantic Web: Web 2.0 – Was nun? Berlin: Springer.
Borst, W. (1997). Construction of Engineering Ontologies
for Knowledge Sharing and Reuse. PhD Thesis, University of Twente,
Nederlands. Retrieved November 18, 2008, from University of Twente,
Nederlands: http://doc.utwente.nl/17864/.
Bodenreider, O., & Stevens, R. (2006). Bio-Ontologies:
Current Trends and Future Directions. Briefings in Bioinformatics,
7(3), 256–274.
Bojars, U., Breslin, J. G., & Finn, A. Decker
S. (2008). Using the Semantic Web for Linking and Reusing Data Across
Web 2.0 Communities. Journal of Web Semantics, 6(1), 21–28.
Buffa, M., Gandon, F. L., Sander, P., Faron, C., &
Ereto, G. (2008). SweetWiki. Journal of Web Semantics, 6(1), 84–97.
Carstens, C. (2008). Semantic Web Applications In-
and Outside the Semantic Web. In S. Auer, S. Schaffert, & T.
Pellegrini (Eds.). Proceedings of I-SEMANTICS’08. International
Conference on Semantic Systems. Graz, Austria (pp. 25–33).
Graz: J.UCS.
Daconta, M. C., Obrst, L. J., & Smith, K. T. (2003).
The Semantic Web. A Guide to the Future of XML, Web Services and
Knowledge Management. Indianapolis, Indiana: Wiley.
Gómez-Pérez, A., Fernández-López,
M., & Corcho, O. (2004). Ontological Engineering: Advanced Information
and Knowledge Processing (3rd Print). London: Springer.
Greaves, M. (2007). Semantic Web 2.0. IEEE Intelligent
Systems, 22(2), 94–96.
Gruber, T. (1993). A Translation Approach to Portable
Ontology Specification. Knowledge Acquisition, 2(5), 199–220.
Hitzler, P., Krötzsch, M., Rudolph, S., &
Sure, Y. (2008). Semantic Web. Berlin, Heidelberg: Springer.
Hotho, A., & Hoser, B. (Eds.) (2007). Bridging
the Gap between Semantic Web and Web 2.0: Workshop located at the
European Semantic Web Conference (ESWC 2007). Innsbruck, Austria.
Retrieved November 13, 2008, from http://www.kde.cs.uni-kassel.de/ws/eswc2007/program.html.
Lange, C., Schaffert, S., Skal-Molli, H., & Völkel,
M. (Eds.) (2008). The Wiki Way of Semantics: Proceedings of the
3rd Semantic Wiki Workshop (SemWiki 2008) at the 5th European Semantic
Web Conference (ESWC 2008), Tenerife, Spain. CEUR Workshop Proceedings,
Vol. 360.
Legg, C. (2007). Ontologies on the Semantic Web. Annual
Review of Information Science and Technology, 41, 407–451.
Pan, J. Z. (2007). OWL for the Novice: A Logical Perspective.
In C. J. O. Baker & K.-H. Cheung (Eds.), Semantic Web: Revolutionizing
Knowledge Discovery in the Life Sciences (pp. 159–182). Boston,
MA: Springer.
Peters, I. (2009). Folksonomies: Indexing and Retrieval
in Web 2.0. (Knowledge and Information. Studies in Information Science;
Vol. 1). München: Saur.
Peters, I., & Weller, K. (2008a). Paradigmatic
and Syntagmatic Relations in Knowledge Organization Systems. Information
- Wissenschaft & Praxis, 59(2), 100–107.
Peters, I., & Weller, K. (2008b). Tag Gardening
for Folksonomy Enrichment and Maintenance.Webology, 5(3).
Shadbolt, N., Berners-Lee, T.,
& Hall, W. (2006). The Semantic Web Revisited. IEEE Intelligent
Systems, 21(3), 96–101.

Katrin Weller ist wissenschaftliche Mitarbeiterin der Abteilung
für Informationswissenschaft an der Heinrich-Heine-Universität
Düsseldorf. Ihr Forschungsschwerpunkt liegt im Schnittbereich
von Web 2.0 und Semantic Web, derzeit arbeitet Sie an ihrer Dissertation
zum Thema "Knowledge Representation in the Social Semantic
Web".
|