Suche

» erweiterte Suche » Sitemap

Informatik

André Langer

Projektmanagement mit SemProj

Kollaboratives Arbeiten im Semantic Web

ISBN: 978-3-8366-6260-4

Die Lieferung erfolgt nach 5 bis 8 Werktagen.

EUR 58,00Kostenloser Versand innerhalb Deutschlands


» Bild vergrößern
» Blick ins Buch
» weitere Bücher zum Thema


» Buch empfehlen
» Buch bewerten
Produktart: Buch
Verlag: Diplomica Verlag
Erscheinungsdatum: 06.2008
AuflagenNr.: 1
Seiten: 200
Abb.: 35
Sprache: Deutsch
Einband: Paperback

Inhalt

Mit mehr als 120 Millionen registrierten Internetadressen (Stand: März 2007) symbolisiert das Internet heutzutage das größte Informationsmedium unserer Zeit. Täglich wächst das Internet um eine unüberschaubare Menge an Informationen. Diese Informationen sind häufig in Dokumenten hinterlegt, welche zur Auszeichnung die Hypertext Markup Language verwenden. Seit Beginn der Neunziger Jahre hat sich dieses System bewährt, da dadurch der einzelne Nutzer in die Lage versetzt wird, auf einfache und effiziente Weise Dokumentinhalte mit Darstellungsanweisungen zu versehen und diese eigenständig im Internet zu veröffentlichen. Diese Layoutinformationen können bei Abruf der entsprechenden Ressource durch ein Computerprogramm leicht ausgewertet und zur Darstellung der Inhalte genutzt werden. Obwohl sowohl die Layoutinformationen als auch die eigentlichen Dokumentinhalte in einem textuellen Format vorliegen, konnten die Nutzertextinhalte durch eine Maschine bisher nur sehr eingeschränkt verarbeitet werden. Während es menschlichen Nutzern keinerlei Probleme bereitet, die Bedeutung einzelner Texte auf einer Webseite zu identifizieren, stellen diese für einen Rechner prinzipiell nur eine Aneinanderreihung von ASCII-Zeichen dar. Sobald es möglich werden würde, die Bedeutung von Informationen durch ein Computerprogramm effizient zu erfassen und weiterzuverarbeiten, wären völlig neue Anwendungen mit qualitativ hochwertigeren Ergebnissen im weltweiten Datennetz möglich. Nutzer könnten Anfragen an spezielle Agenten stellen, welche sich selbstständig auf die Suche nach passenden Resultaten begeben Informationen verschiedener Informationsquellen könnten nicht nur auf semantischer Ebene verknüpft, sondern daraus sogar neue, nicht explizit enthaltene Informationen abgeleitet werden. Ansätze dazu, wie Dokumente mit semantischen Metadaten versehen werden können, gibt es bereits seit einiger Zeit. Lange umfasste dies jedoch die redundante Bereitstellung der Informationen in einem eigenen Dokumentenformat, weswegen sich keines der Konzepte bis in den Privatbereich durchsetzen konnte und als Endkonsequenz in den vergangenen Monaten besonderes Forschungsinteresse darin aufkam, Möglichkeiten zu finden, wie semantische Informationen ohne großen Zusatzaufwand direkt in bestehende HTML-Dokumente eingebettet werden können. Im Rahmen der vorliegenden Publikation werden diese neuen Möglichkeiten im Bereich des kollaborativen Arbeitens näher untersucht. Ziel ist es dazu, eine Webapplikation zur Abwicklung typischer Projektmanagement-Aufgaben zu entwickeln, welche jegliche Informationen unter einem semantischen Gesichtspunkt analysieren, aufbereiten und weiterverarbeiten kann und unabhängig von der konkreten Anwendungsdomain und Plattform systemübergreifend eingesetzt werden kann. Die Konzepte Microformats und RDFa werden dabei besonders herausgestellt und nach Schwächen und zukünftigen Potentialen hin analysiert.

Leseprobe

Kapitel 3.1,Was bedeutet Semantik?: Soll im Weiteren ein semantikbasiertes Projektmanagementsystem mit den Grundvorstellungen des Semantic Web entworfen werden, so steht am Beginn zunächst die Frage, was unter dem Begriff Semantik” eigentlich zu verstehen ist. Für einen menschlichen Benutzer ist die Bedeutung eines Konzeptes intuitiv erfassbar. So können strukturelle Informationen wie in der Zeichenkette 01.11.2007 direkt dazu benutzt werden, abzuleiten, dass damit wahrscheinlich eine Datumsangabe ausgedrückt wird. Die Zeichenfolge Diplomarbeit innerhalb eines Textes wird direkt mit einer wissenschaftlichen Ausarbeitung assoziiert, welche meist um die 100 Seiten umfasst und sich mit einer Thematik kontrovers auseinandersetzt. Automatisch werden damit weitere Konzepte der realen Welt assoziiert, sodass die Begriffe Paper oder Thesis in eine ähnliche Relation zu dem Begriff Ausarbeitung gesetzt werden können und entsprechend gleiche oder ähnliche Eigenschaften zugeschrieben bekommen, welche von der abstrakten Gesamtgruppe bekannt sind, und entsprechend dann auch im gleichen Kontext verwendet werden können. Warum ist diese Vorgehensweise nicht direkt auf eine rechnergestützte Verarbeitung übertragbar? Ein Computerprogramm ist prinzipiell genauso in der Lage, einzelne Buchstaben als zusammenhängende Zeichenkette zu erkennen und bestimmte Anforderungen an die Struktur und das erlaubte Verwendungsumfeld zu stellen (vgl. Datentyp). So kann ein Typ date definiert werden, der nur aus Ziffern zwischen 0-9 sowie zwei Punkten nach dem zweiten und vierten Zeichen besteht, wobei die Gesamtlänge der Zeichenkette 10 Zeichen nicht übersteigen darf und weitere Bedingungen an die erlaubten Zahlenwerte je Position existieren. Wird dieses Muster beispielsweise auf einer Webseite gefunden, könnte eine Applikation diese Datumsangaben auslesen, weiterverarbeiten oder für einen Export bereitstellen. Eine alternative Möglichkeit wäre, ein Datum explizit auszuzeichnen (bspw. <date>01.11.2007</date>). Das Problem besteht darin, dies auf alle anderen Konzepte der realen Welt zu übertragen, wie das Diplomarbeits-Beispiel recht gut darstellt. Ohne große Probleme könnte ein XML Schema entworfen werden, welches syntaktisch korrekt die Bestandteile eines einzelnen Objektes sowie gültige Eigenschaftswerte definiert und einzuschränken vermag. Erfüllen die angegebenen Daten in einer vorhandenen XML-Datei diese Schemadefinition, so werden diese unter der durch den Programmierer angegebenen Struktur weiterverarbeitet. Ob der angegebene Inhalt einen Sinn ergibt, ist dabei der Deutung durch den menschlichen Benutzer überlassen. Die Ursache dafür ist, dass eine Computeranwendung nur vorhandene Daten verarbeiten kann, der Transformationsschritt der Daten in eine Information jedoch ohne weiteres nicht durchführbar ist. Definition 7: Syntax: Syntax ist die Lehre vom strukturellen Satzbau und umfasst ein System an Regeln, wie aus einer Menge von Grundsymbolen durch spezifische syntaktische Mittel gültige und wohlgeformte Worte, Wortgruppen und Sätze einer Sprache abgeleitet werden können. Definition 8: Semantik: Semantik ist die Lehre von der inhaltlichen Bedeutung sprachlicher Ausdrücke, sowie deren Beziehungen untereinander. Definition 9: Kontext: Kontext kennzeichnet den Zusammenhang oder die Bedingung, unter dem eine Aussage Gültigkeit erlangt. Daten werden nach definierten Syntaxregeln aus Zeichen eines bestimmten Zeichenvorrats gebildet. Informationen werden aus Daten unter einer bestimmten Bedeutungszuordnung gewonnen. Die Bedeutung der Daten ist dabei von einem verwendeten Kontext abhängig. Informationen können anschließend als eine Repräsentationsform für Konzepte der realen Welt verwendet werden. Abbildung 18 verdeutlicht diese Begriffshierarchie, wobei die suggerierte scharfe Trennung zwischen den Begriffswelten nach Bodendorf in der Realwelt nicht immer zu finden, sondern eher als kontinuierlicher Übergang zu verstehen ist. Die Herausforderung ist es also, syntaktisch korrekte Daten so mit weiteren Angaben zur Bedeutung der Daten zu versehen, dass die daraus abgeleitete Information rechnergestützt weiterverarbeitet werden kann. Interessant ist dabei die Grundannahme, dass dies ohne eine direkte Beteiligung einer intelligenten Prozessorinstanz vonstatten gehen kann, was in direktem Widerspruch zu dem Ansatz aus dem Bereich der künstlichen Intelligenz steht, welche die Entwicklung intelligenter Agenten anstrebt. Praktisch bedeutet dies das Ziel, Informationen zueinander in Beziehung setzen zu können, semantische Widersprüche auflösen zu können und aus den zugrunde liegenden Daten Informationen so extrahieren zu können, dass sie einer bestimmten Fragestellung genügen und diese semantisch korrekt beantworten. Ein Computerprogramm muss dazu nicht wissen, wie ein Diplomarbeit in der Realwelt aussieht, sondern muss in die Lage versetzt werden, hierarchische Beziehungen zwischen verschiedenen Konzepten herstellen zu können und in der Lage sein zu entscheiden, ob eine konkrete Information einem Konzept angehört oder nicht. Gelingt dies, so wird entsprechend Abbildung 16 dadurch der Schritt in eine darüber liegende Ebene des Wissens möglich. Definition 10: Wissen: Wissen kann beschrieben werden als in einen bestimmten Kontext gestellte Information, die für denjenigen, der über diese Information verfügt, von Wert ist und ihn dazu befähigt, etwas zu tun, wozu er ohne dieses Wissen nicht in der Lage gewesen wäre. Wissen entsteht durch dabei durch die Verknüpfung und Interpretation von Informationen. Ohne Einordnung in einen bestimmten Problemkontext bzw. eine bestimmte Fragestellung, welche durch ein Individuum unter Rückgriff auf eine bestimmte Wissensbasis versucht wird zu beantworten, ist der Wissensbegriff inhaltsleer. Übertragen auf das Internet mit den darin enthaltenen Millionen von Daten und daraus ableitbaren Informationen stellt dies die Motivation dar, warum eine Vernetzung und domainübergreifende Auswertung der Daten in einem Semantic Web weitreichende positive Ergebnisse hätte. Der Bereich des Wissensmanagements beschäftigt sich darüber hinausgehend mit vielen weiteren Fragestellungen, inwieweit Wissen veraltern, neu generiert oder verfälscht wird kann, was an dieser Stelle aber nicht weiter vertieft werden soll. Wichtig ist, dass allein durch die Vernetzung verschiedener Aussagen, die in unterschiedlichen Ressourcen enthalten sind, neue Informationen so abgeleitet und aggregiert werden können, dass sie dem Fragesteller eine zweckgerichtete Antwort auf eine konkrete Problemstellung geben können (Pragmatik). Diese Ableitung aus partiell vorhandenem Wissen wiederum erfordert kein vollständiges Weltbild, sondern lediglich ein Wissen über bestimmte Zusammenhänge und kann strukturell abgebildet werden, wodurch bisher individuell durchgeführte Suchaufträge automatisiert werden können. Wissensbeschreibung: Bevor Techniken zur informationstechnischen Beschreibung der Bedeutung von Daten vorgestellt werden können, ist noch eine prinzipielle Fragestellung zu klären, wie Bedeutungen generell beschrieben werden können, nachdem in Kapitel 3.1. bereits gezeigt wurde, dass zu einer Wissensanalyse der Rückgriff auf grundlegende Zusammenhänge zwischen Konzepten der realen Welt ausreicht. Damit diese allgemeingültig verstanden, aber auch zwischen verschiedenen Individuen ausgetauscht werden können ( Begriffsverständigung ), definiert Bodendorf drei wesentliche Anforderungen an eine Wissensbeschreibung zur Auflösung semantischer Konflikte und zur Sicherung von Wiederverwendbarkeit des Wissens: (1) Symbole: Es muss zur Referenzierung das gleiche Begriffssymbol verwendet werden (es wird von einem Objekt mit der Bezeichnung Diplomarbeit gesprochen) - Terminologie nötig (2) Zuordnungen: Unter einem konkreten Kontext muss das Begriffssymbol von jeder Verarbeitungsinstanz den gleichen Konzepten zuordbar sein (eine Diplomarbeit ist eine wissenschaftliche Ausarbeitung ) - semantische Schemata nötig (3) Konzepte: Jede der Verarbeitungsinstanzen muss einem gewissen Konzept die gleiche Bedeutung zumessen (Eine wissenschaftliche Ausarbeitung umfasst mehere hundert Seiten und beschäftigt sich mit einer konkreten Fragestellung.) - Ontologien nötig Dies bedeutet jedoch nicht, dass keine Umbenennungsoperationen existieren können (bspw. Eine Diplomarbeit ist eine Abschlussarbeit ). Es wird lediglich die Forderung aufgestellt, dass der Verarbeitungsinstanz zum jeweiligen Analysezeitpunkt die verwendeten Symbole des Ursprungssystems bekannt sein müssen. Wurde Wissen durch Verwendung von Symbolen formuliert, deren Bedeutung zum aktuellen Zeitpunkt nicht hergeleitet werden kann, so kann dieses Wissen nicht benutzt werden. Um eine Verständigung auf symbolischer Ebene erreichen zu können, werden von Anwendungen Terminologien benutzt. Definition 11: Terminologie: Eine Terminologie ist die Gesamtheit aller gültigen Bezeichnungen in einer Anwendungsdomain. Mit Terminologien können beispielsweise alle gültigen Eigenschaftswerte aufgelistet werden, die eine konkrete Objekteigenschaft annehmen kann. Da diese Auflistung applikationsabhängig lokal innerhalb der Systemgrenzen definiert ist, birgt diese eine Gefahr bei zukünftiger Anpassung oder Änderung der Symbolmenge. Wird beispielsweise für gültige Werte eines Projektstatus die Menge {nicht begonnen, laufend, abgeschlossen} definiert und später der Wert {abgebrochen} hinzugefügt, so wird dieser von Anwendungen, welche die alte Terminologie verwenden, nicht verstanden. Eine Terminologie definiert damit eine syntaktische Norm auf Symbolebene, der semantische Aspekt hingegen wird mithilfe weitreichenderer Repräsentationen dargestellt. Definition 12: Semantisches Schema: Ein semantisches Schema stellt die systemweit einheitliche Zuordnung von Symbolen zu Konzepten sicher, indem eine Menge von Konzepten definiert und aufgezählt wird. Semantische Schemata dienen der Zuordnung von Begriffen zu Konzepten, wobei damit auch unterschiedliche Bezeichnungen, die das gleiche Objekt repräsentieren, in das gleiche Konzept eingeordnet werden können. Praktisch kann dies so aussehen, dass einem Konzept dc:language beispielsweise die Symbole german , english , ger , en , de oder deutsch zugeordnet werden können. Dadurch wird eine bedeutende Interoperabilität in verteilten Systemen ermöglicht, da diese eine Norm auf Zuordnungsebene definieren. Ohne eine entsprechende Zuordnungsvorschrift könnte ein beliebiges System das vorangestellte Konzept ebenso als dc:lang, dc:sprache oder dc:verfasstin kennzeichnen, wodurch kein Gewinn auf Bedeutungsebene im Gegensatz zur Symboldefinition zu erkennen wäre. Symbole erhalten durch die Zuordnung eine semantische Identität, indem sie in Mengen mit gleichen Grundbedeutungen gruppiert werden. Um nun auf der obersten Abstraktionsebene der Wissensbeschreibung eine Aussage über die Bedeutung der Konzepte treffen zu können, werden Ontologien verwendet. Die Bezeichnung Ontologie stammt aus dem Griechischen (ontos-Lebenwesen, logos-Wort) und wurde ursprünglich in der Philosophie des Neunzehnten Jahrhunderts von Rudolf Gockel dazu verwendet, die Untersuchung des Wesens von existierenden Objekten von der biologischen Untersuchung von Lebewesen abgrenzen zu können. Im Mittelpunkt steht die Erforschung von Objektkategorisierungen einer bestimmten Domain, primäres Hilfsmittel dazu is a catalogue of the types of things that are assumed to exist in a domain of interest D from the perspective of a person who uses a language L for the purpose of talking about D [Sow03]. Im Grunde genommen verbirgt sich dahinter die Klassifizierung von Objekten einer bestimmten Umgebung sowie deren Beziehungen untereinander. Im Gegensatz zu einer Taxonomie sind diese Beziehungen jedoch nicht auf eine streng hierarchische Struktur begrenzt. Definition 13: Ontologie: Eine Ontologie ist eine formale, explizite Spezifikation eines gemeinsam verwendeten, abstrakten Modells zur Repräsentation des darin enthaltenen Wissens. Eine Ontologie leistet damit zwei Dinge: Zum Einen wird explizit ein Vokabular (d.h. eine Liste an Begriffen) bereitgestellt, welches systemübergreifend verstanden und benutzt werden und damit eine Kommunikation ohne Mehrdeutigkeiten zwischen diesen Systemen ermöglicht wird. Zum anderen wird die Bedeutung eines Konzeptes eingegrenzt, indem typische Eigenschaften der zugeordneten Objektinstanzen des Konzeptes benannt und zu anderen Konzepten in Beziehung gesetzt werden. Diese Beschreibung basierend auf Beziehungen zwischen verschiedenen Konzepten kann unterschiedlich komplex sein und sich je nach Anwendungsfall einer informellen Komplettbeschreibung mehr oder weniger stark annähren, wodurch die Bedeutung eines Konzeptes mit Schwerpunkt auf die wesentlichen, innerhalb einer Anwendungsdomain zu betrachtenden Aspekte, eindeutig und maschinell verarbeitbar dargestellt werden kann. Die durch ein semantisches Schema definierten Konzepte können unter Zuhilfenahme einer Ontologie miteinander verknüpft werden, wobei dabei eine Computeranwendung in die Lage versetzt wird, unter Zuhilfenahme der Konzeptdefinition innerhalb einer Ontologie festzustellen, ob eine gewisse Beziehung zwischen zwei Konzepten gültig ist und welche Bedeutung dieser zukommt. Ontologien werden dazu unter dem Anspruch entworfen, innerhalb einer bestimmten Problemdomain unabhängig von einem konkreten Anwendungsfall nutzbar zu sein und darin vorhandene Konzepte allgemeingültig zu beschreiben. Die Idee dahinter ist, bereits vorhandene Ontologien für ähnliche Problemstellungen weiternutzen zu können. Die Feingranularität einer Ontologiebeschreibung kann dabei stark variieren es darf nur nicht möglich, unter der Verwendung einer Ontologie eine Aussage zu formulieren, welche dem durch die Ontologie modellierten Weltbild direkt widerspricht. So entstanden neben einfachen bis komplexen Domain-spezifischen Ontologien ebenso Versuche, generalistische Ontologien zu entwickeln, welche den Anspruch erheben, eine allumfassende Weltbeschreibung (Top Level Ontologies) bereitzustellen. Bekannte Vertreter davon sind die Suggested Upper Merged Ontology (SUMO) sowie die CYC-Ontologie. Abbildung 19 illustriert das Trade-Off-Problem zwischen Verwendbarkeit und Wiederverwendbarkeit von Ontologien, weswegen die Entwicklung von Top-level/Upper Ontologies von vielen Forschern momentan eher der Grundlagenforschung zugeschrieben wird, und sich um den Aufbau eines allumfassenden Begriffkataloges bemüht.

Über den Autor

André Langer, Studium der Angewandten Informatik an der Technischen Universität Chemnitz mit Vertiefung Medieninformatik ab 2002, Studienaufenthalt an der University of California, Santa Barbara / USA im Bereich Mobile Computing 2006 mit Spezialisierung Mobile Computing, Weiterarbeit im Bereich Verteilte und Selbstorganisierende Rechnersysteme an der TU Chemnitz, erste Studie zum Thema Evaluierung von AJAX-basierten frameworks für das Web 2.0, Abschluss 2007 als Diplom-Informatiker mit der Arbeit Semantic Web-basiertes System zur Unterstützung von Workflow- und Projektmanagement mit Prädikat sehr gut.

weitere Bücher zum Thema

Bewerten und kommentieren

Bitte füllen Sie alle mit * gekennzeichenten Felder aus.