Data Mining

Prof. Dr. Oliver Schöffski, MPH, Lehrstuhl für Gesundheitsmanagement, Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU):

Hintergrund und Ziel

Der Begriff Data Mining existiert bereits seit den 60er Jahren und wurde in der Statistik für eine hypothesenfreie Suche nach Mustern in Daten verwendet. Doch erst Anfang der 90er Jahre, als es darum ging, die immer größer werdenden Datenbestände in möglichst einfacher, aber dennoch umfassender Weise zu untersuchen und bessere datentechnische Möglichkeiten gegeben waren, wurden Data Mining-Systeme für die praktische Anwendung in Unternehmen entwickelt. Auch im Gesundheitswesen lassen sich diese Methoden anwenden. Gerade Einrichtungen wie Krankenkassen oder Krankenhäuser, aber auch Ministerien oder Verbände verfügen teilweise über große Datenbestände, die durchforstet werden könnten. Gerade unter dem Aspekt von Versorgungskosten oder Public Health Ansätzen wäre es möglich diese Datensätze systematisch zu nutzen, um wichtige Informationen, wie z.B. Prädiktoren für das Eintreten von bestimmten Ereignissen oder bedeutende Kostentreiber, zu genieren. Es werden am Lehrstuhl die strukturierten Qualitätsberichte nach § 137 SGB V verarbeitet und ausgewertet.

Methodik

Data Mining ist ein computerbasiertes Analyseverfahren, dessen Vorteile in der Hypothesenfreiheit liegen, das automatisch nach auffälligen Mustern in Datensätzen sucht und diese hervorbringt. Seine Stärke entwickelt es erst in Kombination mit den Konzepten des Data Warehouse und Online Analytical Processing (OLAP). Da Data Mining-Auswertungen sehr rechenintensiv sein können, ist es sinnvoll, die Daten von den operativen Systemen zu entkoppeln. Für die Auswertung der SQB verwendet der Lehrstuhl verschiedene Programme: Zum Überführen der Daten aus den Rohdatenbeständen in das Datenbanksystem MS SQL Server 2008 wurde Phyton verwendet. Anschließend wurde DeltaMaster Modeler eingesetzt, um im MS Analysis Services 2008 eine multidimensionale Datenbank zu erstellen. Anschließend wurde DeltaMaster eingesetzt, um deskriptive Auswertungen, Geoanalysen aber auch Data Mining-Untersuchungen durchzuführen.

Projektfortschritt und wissenschaftlicher Beitrag

Die ersten Analysen der strukturierten Qualitätsberichte nach § 137 SGB V versprechen interessante Informationen für unterschiedliche Interessensgruppen. Sowohl Patienten als auch niedergelassene Ärzte oder konkurrierende Krankenhäuser können wertvolle Informationen für sich herausziehen. Während für Patienten vor allem die Qualitätsindikatoren von Interesse sind, können Krankenhäuser, in der Rolle von Wettbewerbern, wichtige Hinweise bekommen, wie sich Konkurrenten aufstellen, um sich am Markt am besten und vielversprechendsten positionieren zu können. Die aufwendigen Data Mining-Verfahren werden in naher Zukunft eingesetzt, um Prädiktoren zu ermitteln, die einen Einfluss auf das Ergebnis der Qualitätsindikatoren haben. Sowohl für die Krankenhäuser selbst als auch für Entscheidungsträger im Gesundheitswesen kann die umfassende Auswertung der SQB wichtige Informationen hervorbringen.