Suche

» erweiterte Suche » Sitemap

Gesundheitswissenschaften


» Bild vergrößern
» Blick ins Buch
» weitere Bücher zum Thema


» Buch empfehlen
» Buch bewerten
Produktart: Buch
Verlag: Bachelor + Master Publishing
Erscheinungsdatum: 07.2012
AuflagenNr.: 1
Seiten: 44
Abb.: 26
Sprache: Deutsch
Einband: Paperback

Inhalt

‘Die Arznei macht kranke, die Mathematik traurige und die Theologie sündhafte Leute’ (Martin Luther). So wie Martin Luther schon vor mehr als 500 Jahren gewusst hat, dass die medizinische Versorgung Einfluss auf den Menschen hat, so liegt er mit seiner zweiten Aussage vielleicht daneben. Die Mathematik, speziell die (multivariate) Statistik mit ihren strukturentdeckenden Methoden, sorgt dafür, dass wir heute dank der elektronischen Informationsverarbeitung erkenntnisreiche Aussagen über Probleme und Strukturen in unserer Welt bekommen. Daher soll unter Anwendung clusteranalytischer Verfahren die Situation im Gesundheitswesen betreffend der medizinischen Versorgung in Landkreisen sowie in kreisfreien Städten der Bundesrepublik Deutschland untersucht werden. Diese Arbeit beschränkt sich auf die Untersuchung der Krankenhaus-, Pflege- sowie Reha- und Vorsorgesituation, ohne Berücksichtigung der Verfügbarkeit von Ärzten. Im zweiten Kapitel erfolgt die Erstellung der Datenbasen. Darauffolgend wird im dritten Kapitel eine Vorabanalyse der Gesamtheit der Clustermerkmale gemacht, die die Struktur der Merkmale beschreibt. Im vierten Kapitel erfolgen dann die eigentliche Clusteranalyse hinsichtlich der Erkundung von Ausreißern und eine Gruppierung der Landkreise und kreisfreien Städte. Hier wird untersucht, ob die Landkreise zu Gruppen zusammengefasst werden können, um eine allgemeingültige Aussage über die medizinische Versorgung der Regionen zu treffen. Im fünften Kapitel erfolgt abschließend eine Analyse zur Zusammenfassung der Merkmale mittels einer Faktorenanalyse.

Leseprobe

Textprobe: Kapitel 4.1, Clusterstrategie: In der Praxis haben neben den hierarchisch-agglomerativen Verfahren, die partitionierten Verfahren (k-Means) eine große Bedeutung in der Wirtschaftswissenschaft gewonnen. Die hierarchisch-agglomerativen Verfahren neigen zu einer Ein-Clusterlösung und bieten hierzu verschiedene Methoden an. Voraussetzung ist, dass Merkmale metrisch skaliert vorliegen, da hier mit Proximitätsmaßen und/oder Varianzen die Distanzen unter den Objekten berechnet werden. Die partitionierten Verfahren versuchen die Lösungen der hierarchisch-agglomerativen Verfahren, durch die Neuberechnung der Clusterzentren, zu optimieren. Zur Clusteranalyse dieser Arbeit wurde in folgenden Schritten vorgegangen: Zuerst werden mittels Single-Linkage-Verfahren mögliche Ausreißer entdeckt und aus dem Datensatz eliminiert (Kapitel 4.2). Die Single-Linkage-Methode fasst Objekte mit der kleinsten Distanz zusammen. Dadurch, dass es immer den nächstgelegenen Nachbarn zu einem größeren Cluster zusammenführt (Kettenbildung), ist das Verfahren anfällig gegenüber Ausreißern. Das aber wiederum kann durch Beobachten eines sprunghaften Anstiegs des Fusionskoeffizienten dazu genutzt werden, um Ausreißer ausfindig zu machen. Nach dem die Ausreißer eliminiert und die z-Werte neu berechnet wurden, wird im nächsten Schritt das Ward-Verfahren ausgewählt. Das Ward-Verfahren fordert u.a. standardisierte metrisch skalierte, nicht dichotome, Merkmale, da anhand des geringsten Zuwachses des Heterogenitätsmaß, auch Fehlerquadratsumme (SSQ), Objekte oder Cluster, die die Streuung im Cluster am wenigsten erhöhen, zu einem Cluster zusammengeführt werden. Somit bleibt die Streuung innerhalb der Cluster gering (Homogenität) und unter den Clustern groß (Heterogenität). Die Fehlerquadratsumme wiederum beschreibt die Heterogenität der Partition, die sich im Kern aus der Summe der quadratisch euklidischen Abstände zwischen den Objekten bildet, das beim Ward-Verfahren als Distanzmaß gilt. Das Verfahren wird daher zu den Varianz-Methoden gezählt und ist bestrebt, gleich große Cluster zu bilden. Im ersten Schritt des Ward-Verfahrens wird die optimale Partition, also die Anzahl der Cluster, ermittelt (Kapitel 4.3) um im zweiten Schritt die Startpartition und die Clusterzentren für das partitionierte Verfahren (k-Means) zu erzeugen. Als letzter Schritt der Clusteranalyse erfolgt die Erzeugung der finalen Partition mittels k-Means-Verfahren. Das k-Means-Verfahren ist eine partitionierte Methode und zählt zu den iterativen Minimaldistanz-Verfahren, die versucht, die Clusterzentren, die Zentroide in ihrer Lage, (hier gegenüber dem Ward-Verfahren) zu verbessern. Dadurch werden Objekte zwischen den Clustern verschoben, um so die Gesamtgüte einer vorhandenen Clusterlösung, in diesem Fall des Ward-Verfahrens, zu optimieren. Als Gütemaß der Clusterlösungen zählt das eta-quadrat, ein Homogenitätsmaß. Es ergibt sich aus dem erklärten Teil der Gesamtvarianz der Partition zur Gesamtstreuung der Clustermerkmale in einer bestimmten Fusionsstufe und gibt an, zu wie viel Prozentpunkten sich die Streuung der Clusterlösung erklären lässt. 4.2, Ausreißer finden und eliminieren: Ausreißer werden mittels Single-Linkage-Verfahren durch den größten Sprung des Koeffizienten der letzten Fusionsstufen identifiziert, unter Berücksichtigung, dass die zuletzt fusionierten Objekte noch zu keinem weiteren Cluster fusionierten. Werden Ausreißerobjekte gefunden, werden entweder diese mit in die Clusteranalyse inkludiert oder die Objekte werden eliminiert. Bei der Inklusion der Ausreißer besteht die Gefahr, dass Cluster nicht homogen gebildet werden, beziehungsweise sie durch Ausreißer eine ungewollte Gewichtung erhalten. Bei der zweiten Variante müssen die standardisierten Merkmale (z-Werte) wegen der Abhängigkeit zum Mittelwert des Merkmals, neu berechnet werden. In meiner Arbeit werden die Ausreißer eliminiert und somit die z-Werte neu berechnet, um bei der ersten Clusterstufe möglichst homogene Cluster zu bilden. Zum Ergebnis: Die Ausreißer werden mit Hilfe der Fusionstabelle (Tabelle 21 im Anhang C) aus den noch vorhandenen 405 Datensätzen ermittelt und deren Verlauf, übersichtshalber, über die letzten zehn Fusionsstufen mittels Screeplot grafisch dargestellt (Abbildung 1). Als Koeffizient dient hier das quadratisch euklidische Distanzmaß als Unähnlichkeitsmaß, wobei auch das einfache euklidische Distanzmaß hier zum selben Resultat hinsichtlich der Ausreißer führen würde. Eine Identifikation mittels Dendogramm wird wegen dessen ungenauen und normierten Darstellung nicht in Betracht gezogen. In den letzten zehn Fusionsstufen wird der größte Sprung (delta_f) des Koeffizienten (df oder Fusionskoeffizienten) zwischen der 398 und 399 Fusionsstufe (f) beobachtet. Waren hier vorher geringe Sprünge zwischen 0,2 bis 0,4 oder weniger beobachtet worden, wird nun ein Sprung von 1,206 beobachtet, was einen relativen Anstieg zur vorigen Stufe um 16,62 % bedeutet. Die Abbildung macht dieses noch einmal durch den Anstieg des Fusionskoeffizienten der letzten sechs Fusionsstufen (cf) von 6 und weniger deutlich.

Über den Autor

Jens Schröder, B.Sc. in Wirtschaftsinformatik, wurde 1977 in Sulingen geboren. Nach langjähriger Tätigkeit als IT-Führungskraft in einer Bank und einem Automobilzulieferer in den USA hat er umfassende Erfahrungen im Bereich des Business Analytics und als Entscheidungsträger im IT-Management sammeln können. Neben seinem aufbauenden Masterstudium, vertiefte er seine Kenntnisse als Research Project Assistant im Forschungsprojekt GoOLAP.info der TU Berlin. Dieses Werk des Autors entstand im Rahmen des Aufbaustudiums und vertiefte sein Verständnis der multivariaten Datenanalyse.

weitere Bücher zum Thema

Akademisierung in der Pflege. Aktueller Stand und Zukunftsperspektiven

Unveränderte Neuausgabe

ISBN: 978-3-95935-596-4
EUR 49,90


Bewerten und kommentieren

Bitte füllen Sie alle mit * gekennzeichenten Felder aus.