Suche

» erweiterte Suche » Sitemap

Informatik

Björn Knebel

Data Profiling mit Eclipse

Von den Grundlagen zum Prototypen

ISBN: 978-3-8366-7122-4

Die Lieferung erfolgt nach 5 bis 8 Werktagen.

EUR 48,00Kostenloser Versand innerhalb Deutschlands


» Bild vergrößern
» Blick ins Buch
» weitere Bücher zum Thema


» Buch empfehlen
» Buch bewerten
Produktart: Buch
Verlag: Diplomica Verlag
Erscheinungsdatum: 04.2009
AuflagenNr.: 1
Seiten: 116
Abb.: 47
Sprache: Deutsch
Einband: Paperback

Inhalt

Der erste Teil des Buches hat zum Ziel, eine Einführung in die Datenqualitätsanalyse zu geben und die Materie Data Profiling fundiert zu erläutern. Die zweite Hälfte beschäftigt sich mit der Konzeption und prototypischen Implementierung eines Data-Profiling-Werkzeugs auf Grundlage des Eclipse Modeling Frameworks. Die zentrale funktionale Eigenschaft der Lösung soll ein generiertes grafisches Datenmodell sein, das den Ausgangspunkt für typische Data-Profiling-Funktionen bildet. Aber auch der Entwicklungsprozess soll innovativen Charakter haben. So wird das Domänenmodell der Anwendung mithilfe des Eclipse Modeling Frameworks entworfen und in Programmcode transformiert. Der Diagrameditor wird über das Graphical Modeling Framework von Eclipse modelliert und generiert. Die Data-Profiling-Methoden werden per deskriptiver Schnittstellenerweiterung eingebunden. Die Lösung, der eher technisch/methodisch orientierten Problemstellung, wird mit den theoretischen Grundlagen der Datenqualität, einer ökonomischen Betrachtung und den potentiellen Anwendungsgebieten eingeleitet. Data-Profiling bildet dann den Schwerpunkt des zweiten Kapitels. Nachdem die Definition aus diversen Literaturquellen hergeleitet ist, wird das Vorgehensmodell dargestellt und die einzelnen Analysemethoden beschrieben und systematisiert. Anschließend wird die Systemumgebung thematisiert. Das Kapitel ist in eine Beschreibung der Eclipse-Plattform, eine Darstellung des modellbasierten Entwicklungsansatzes mit Eclipse und eine Analyse des Eclipse Modeling Frameworks unterteilt. Als Inspirationsquelle für das Werkzeugkonzept wurde eine Evaluation existierender Data-Profiling-Tools vorgenommen. Die letzten beiden Kapitel beschäftigen sich mit dem Entwurf und der Implementierung des Data-Profiling-Tools. Dargestellt sind unter andrem die modellgetriebene Entwicklung des Diagrammeditors, die Komponentenarchitektur, Aspekte der Pluginentwicklung unter Eclipse und die Implementierung ausgewählter Data-Profiling-Analysemethoden.

Leseprobe

Kapitel 4.2.4 Zukunft der Modellierung in Eclipse Bis zum heutigen Tag wurde eine Vielzahl an modellbasierten Werkzeugen, Plattformen und Prozessen veröffentlicht, die leider in den meisten Fällen zueinander inkompatibel sind und sich erst recht keinem ganzheitlichen integrativen Standardprozess verschreiben. Viele Projekte befassen sich nur mit einem Teilbereich der modellgetriebenen Softwareentwicklung und entwickelten sich im Laufe der Zeit ausschließlich im eigenen Umfeld weiter. Die Eclipse Organisation versucht nun die internen Projekte zu vereinheitlichen und neu auszurichten, um sie in einem allumfassenden Top-Level-Projekt namens Eclipse Modeling Project zu bündeln. Weiterhin werden Vorschläge für eine bessere Integration externer Tools gemacht. Die folgenden Punkte beschreiben Inhalte des Projekts und stellen die wichtigsten Teilprojekte vor: ? Abstrakte Syntaxentwicklung (Metamodellierung): Definition einer abstrakten Syntax für die Modellierung von Geschäfts-, System- und Softwaremodellen. Teilweise wird dies schon durch EMF bereitgestellt. ? Konkrete Syntaxentwicklung: Unterstützung für textuelle und grafische Syntaxstandards. Neben der grafischen Bearbeitung der UML könnte das Modell z.B. auch textuell definiert werden. ? Modelltransformation: Das zentrale Teilprojekt ist das Generative Model Transformer (GMT) Projekt, welches Transformationsdefinitionen und entsprechende Werkzeuge bietet.Model-to-Text Generierung: Typischerweise wird Programmcode aus Modellen generiert. Eclipse-Vertreter für diesen Bereich sind das Java Emitter Template (JET) und Teile des JMerge aus EMF. ? Industriestandards: Unterstützung einer Vielzahl weit verbreiteter Standards, wie z.B. UML, MDA, XSD oder SDO (Service Data Objects). ? Domänenspezifische Sprachen: Eclipse unterstützt die domänenspezifische Modellierung mit dem beschriebenen Projekt GMF. Ein entscheidender Bestandteil ist die automatisierte Produktion entsprechender Editoren für ein Fachmodell. Ein interessanter Ansatz für die Integration dieser Teilschritte ist das Eclipse-Projekt Model Driven Development Integration. MDDi soll eine Plattform für verschiedenste Modellierungstools unterschiedlicher Hersteller bereitstellen. Die erweiterbare Umgebung soll den einheitlichen Austausch von Semantiken über diverse Modellstandards hinweg ermöglichen, die Interoperabilität zwischen den verschiedenen Werkzeugen verbessern und klare Prozessabläufe definieren. MDDi liefert für die Erreichung dieser Ziele konkrete technische Lösungen, wie einen ModelBus, der eine transparente Interaktion ermöglicht und das Semantic Binding, welches die Modellsemantik durch formale Metamodelle austauschbar machen soll.

Über den Autor

Björn Knebel, Master of Science, Wirtschaftsinformatik-Studium an der FHTW Berlin und der Queensland University of Technology in Australien, Abschluss 2008. Derzeit tätig als Consultant im Bereich Business Intelligence.

weitere Bücher zum Thema

Bewerten und kommentieren

Bitte füllen Sie alle mit * gekennzeichenten Felder aus.