Die Gesundheitsbranche ist eine Branche, die ein großes Potenzial für Big Data Anwendungen bietet. Mit dem Begriff Big Data stehen große, heterogene und schnell wachsende Datenmengen im Zusammenhang, die sich mit herkömmlichen Technologien nur schwer speichern, analysieren und nutzen lassen. Angetrieben wird Big Data durch die voranschreitende Digitalisierung, die elektronische Unterstützung von Geschäftsprozessen und die Zunahme von digitalen Inhalten wie z.B. in den sozialen Medien wodurch die Nachfrage nach schnellen Internetverbindungen steigt. Folglich arbeitet die Bundesregierung an der digitalen Agenda, mit der bis zum Jahre 2018 eine flächendeckende Breitbandinfrastruktur entstehen soll, die eine Downloadgeschwindigkeit von 50Mbit/s gewährleistet. Der Trend Big Data spiegelt sich in der Medizin wieder. Hier ergeben sich neue Datenquellen sowie neue Szenarien für die Analyse. Dazu gehören elektronische Patientenakten, öffentlich zugängliche Daten und der Quantified Self Trend, bei dem das eigene Verhalten gemessen wird. Allerdings ist im medizinischen Bereich die Verbreitung von Big Data noch nicht so ausgeprägt wie in anderen wirtschaftlichen Bereichen. Ein Grund ist hierfür sind die vorherrschenden rechtlichen Rahmenbedingungen im Umgang mit sensiblen und personenbezogenen Daten. Hingegen bietet Big Data Ärzten und Patienten die Möglichkeit durch Analysen des Erbguts (Genom) Krankheiten vorherzusagen oder Therapien für die Heilung individuell abzustimmen und somit die Effektivität zu steigern. Weitere Möglichkeiten ergeben sich in der Ausschaltung unerwünschter Nebeneffekte oder der Dosierung von unwirksamen Medikamenten.
Ziel dieses Artikels ist es, die zugrundeliegende Problematik von Big Data in der Medizin, deren Wirkungsbereiche, die Chancen und Herausforderungen näher zu erläutern sowie einen Überblick über die Erhebung von Daten und den sicherheitsrelevanten Betrachtungsweisen zu geben.
Begriffsbestimmung
Der Artikel befasst sich grundlegend mit den Begriffen Big Data im Zusammenhang mit der Medizin. Beide Begriffe finden sich häufig in der Literatur oder Presse wieder, ohne ausreichende Erklärung. Zudem können sie kaum unterschiedlicher sein. Big Data ist ein eher technischer Begriff aus der heutigen Zeit, während der Begriff Medizin wesentlich älter ist und sich mit der Heilkunde beschäftigt. In den nachfolgenden Unterkapiteln werden die Begrifflichkeiten näher erläutert.
Big Data
Der Begriff Big Data gehört laut Gesellschaft für deutsche Sprache zu den Wörtern des Jahres 2013 in Deutschland, die den Diskurs wesentlich geprägt sowie das politische, wirtschaftliche und gesellschaftliche Leben sprachlich begleitet haben. Dabei formuliert der Begriff selbst ein Phänomen, welches im Zusammenhang mit der fortschreitenden Digitalisierung in vielen Bereichen steht. Geformt hat er sich in den 1990er Jahren von einem Mitarbeiter der Firma Silicon Graphics, welche Computer hergestellt hat. Zu dieser Zeit waren Datenmengen, im Vergleich zu heute, eher gering. Heute soll Big Data die wirtschaftlich sinnvolle Gewinnung und Nutzung entscheidungsrelevanter Informationen unterstützen, die qualitativ verschieden und unterschiedlich strukturiert sind und zudem einem schnellen Wandel unterliegen sowie im unbekannten Umfang zur Verfügung stehen. Big Data weist demnach verschiedene Merkmale, wie Datenmenge, Datenvielfalt, Geschwindigkeit und Analytik auf und bietet Entscheidern eine angereicherte Grundlage, um so besser Entscheidungen mit gesteigerter Komplexität treffen zu können. Ferner beinhaltet Big Data Strategien, Technologien, IT-Architekturen, Methoden und Verfahren und spiegelt den technologischen Fortschritt der letzten Jahre wider.
Medizin
Unter dem Begriff Medizin ist die Lehre zur Erkennung, Behandlung und Vorbeugung unterschiedlicher Krankheiten von Lebewesen zu verstehen. Dazu gehören viele verschiedene Bereiche, wie die Humanmedizin, welche sich mit dem menschlichen Körper beschäftigt. Die Medizin wird von Ärzten, von Angehöriger anerkannter Heilberufe und von Therapeuten ausgeübt und verfolgt dabei das Ziel, die Gesundheit der Patienten wiederherzustellen oder zu wahren. Im Wesentlichen wird zwischen der Schulmedizin und der Alternativmedizin als Heilungstheorien unterschieden. Die Schulmedizin betrachtet krankhafte Störungen anatomisch, während bei der Alternativmedizin die individuellen Wesensmerkmale und Krankheitsempfindungen im Vordergrund stehen. Zudem geht die Alternativmedizin davon aus, dass der menschliche Organismus über Selbstheilungskräfte verfügt, die mit Individuellen erfahrungsbezogenen Ansätzen aktiviert und unterstützt werden. Bezeichnend für die Alternativmedizin ist, dass kein Wirksamkeitsnachweis erbracht werden kann. Die Schulmedizin hingegen beruht auf einem naturwissenschaftlichen Verständnis und strebt nach Objektivierbarkeit, Messbarkeit und Reproduzierbarkeit und verlangt Wirksamkeitsbelege.]
Big Data im Kontext Medizin
Robert Koch entdeckte im Jahr 1882 den Erreger für die bakterielle Infektionskrankheit Tuberkulose durch ein Mikroskop und erfand zugleich Tuberkulin als Gegenmittel. Als neues Wundermittel angepriesen gelang es mit Tuberkulin jedoch nicht, infizierte Menschen zu heilen. Vor der Einführung wurden keine klinischen Tests durchgeführt, sondern es wurde davon ausgegangen, das es helfen muss. Das war schlicht falsch. Vorher keine Daten zu erheben, um u.a. die Wirksamkeit zu bestätigen oder Nebenwirkungen zu erforschen, wurde zu dieser Zeit als Warnung begriffen und heute so nicht mehr praktiziert. Big Data kann durch die Auswertung von Daten dahingehend unterstützen, sie besser zu interpretieren und die richtigen Schlüsse daraus zu ziehen. Aktuell wird Big Data in der Medizin noch nicht so ausgiebig verwendet, wie in anderen wirtschaftlichen Bereichen. In den folgenden Absätzen wird auf die Vor- und Nachteile von Big Data eingegangen, Handlungsfelder aufgezeigt, wie Daten erhoben werden können und welchen Gewinn sie darstellen sowie sicherheitsrelevante Aspekte aufgezeigt.
Nutzen von Big Data
Mit der Zunahme von Datenmengen steigt ebenfalls die Bedeutung dieser und regt an, diese zu verarbeiten und zu analysieren, um so einerseits die Effizient zu steigern und andererseits neue und wichtige Erkenntnisse zu gewinnen, welche wiederum bei der schnelleren Entscheidungsfindung hilfreich sind. Was für Unternehmen einen strategischen Vorteil gegenüber dem Wettbewerb darstellt, lässt sich in der Medizin gezielt für bspw. die Heilung von Krankheiten, den Einsatz von Medikamenten oder für Therapien verwenden. Dabei lassen sich bei der Behandlung eines Patienten die Daten mit dem eines ähnlichen Patienten vergleichen und Muster ableiten. Zudem werden Studien oder gewonnene Feststellungen durch Mediziner, Institute oder pharmazeutische Unternehmen für weitere Personenkreise transparenter und lassen sich so für neue Forschungsfelder oder Medikamente verwenden. Auch die Früherkennung von Krankheiten lässt sich somit beschleunigen, da eine epidemiologische und genetische Evidenz eines Patienten unter der Berücksichtigung eines bestimmten Risikos im Zusammenhang für das Auftreten einer chronischen Erkrankung steht. In einer Veröffentlichung der Harvard School of Public Health wurde bekannt, das 63 Prozent aller Todesfälle weltweit sich aus nicht übertragbaren Krankheiten, vor allem Herz-Kreislauf-Krankheiten, Krebs, chronische Atemwegserkrankungen und Diabetes, ergeben.
Herausforderungen von Big Data
Die großen Mengen an Daten, welche vielfältig und eine immer kürzere Aktualität aufweisen, stellt Big Data Strategien vor neue Herausforderungen. Hinzu kommt, dass diese Daten auf unterschiedlichen dezentralisierten Repositorien, Datenbanken oder speziellen IT-Systemen liegen, welche sich wiederum in verschiedenen Organisationen wie Krankenhäusern, Krankenkassen, Arztpraxen, Forschungseinrichtungen oder pharmazeutischen Unternehmen, befinden. Es herrscht demnach eine absolute Heterogenität. Eine wesentliche Voraussetzung für die Analyse ist, das alle Daten in elektronischer Form vorliegen müssen. Ist dies nicht der Fall, müssen diese zuerst in elektronische Dokumente umgewandelt werden, um sie mit ontologischen und semantischen Techniken analysieren zu können. Mit dem Aufkommen neuer Technologien und Werkzeuge setzt Big Data auch entsprechendes Wissen voraus, nicht nur im Bereich der Implementierung und Wartung solcher Lösungen, sondern auch im Umgang. Hinzu kommen bei der Einführung von Big Data Lösungen ein hoher Kostenaufwand in verschiedenen Bereichen, was wiederum eine umfangreichende Planung voraussetzt. Ein nicht unerhebliches Problem stellt die Datenqualität dar. Es ist Fraglich, inwieweit erhobene Daten authentisch und repräsentativ sind. Durch das endlose Sammeln steigt nicht zwingend die Qualität und damit die Aussagekraft einer Analyse. Weitere Schwierigkeiten bestehen hinsichtlich der Ethik sowie Rechtslage, auf die in Absatz “Sicherheitsrelevante Aspekte bei Big Data” näher eingegangen wird.
Handlungsfelder in der Medizin
Genauso wie andere wirtschaftliche Bereiche kann auch die Medizin einiges von dem technologischen Fortschritt lernen. Die folgende Grafik (Abbildung 1) nach Langkafel zeigt einige wichtige Handlungsfelder von Big Data in der Medizin auf. Auf der linken Seite sind die verschiedenen Akteure zu sehen, auf der rechten Seite die Szenarien, welche den Schwerpunkt der einzelnen Bereiche angeben, ohne weitere Querverweise auszugrenzen.
Aus der Grafik ergeben sich folgende Handlungsfelder:
- Health Education und Information: Umfasst alle Bereiche, welche Daten für unterschiedliche Akteure aufbereiten, erweitern oder neu aufbereiten wie bspw. von Disease Management Programmen (Krankheitsmanagement).
- Finanzielle Ressourcenoptimierung: Durch Analysen eingehender Informationen aus Ressourcen entstehen Optimierungsoptionen die Auswirkungen auf die Effektivität oder medizinische Qualität haben können.
- Public Health Monitoring: Schnellere und gezieltere sowie individuellere Reaktionen auf Gesundheitsmaßnahmen durch neue Erkenntnisse.
- Produktentwicklung: Anhand von umgehender Rückmeldung von subjektiven oder objektiven Daten können neue Produkte entstehen im Bereich der Betreuung oder Medizingeräten.
- Prognose: Mit der Erhebung von Daten aus dem Alltag entsteht ein besseres Verständnis für Krankheiten und wirkt sich ebenso auf die Prognose aus.
- Prävention: Die Analyse von Daten aus unterschiedlichen Datenquellen ermöglichen gezieltere Formen der Prophylaxe, gerade auch bei Epidemien.
- Disease Management: Können zukünftig spezifischer angepasst werden.
- Klinische Studien: Rekrutierung für Studien oder Simulation von Daten ermöglichen neue Studienformen und verbessert die Interaktion von Forschung und Anwendung.
- Konsumentenverhalten: Durch die Analyse des Konsumentenverhalten entstehen neue Produkte oder Dienstleistungen bspw. für die Bereiche Ernährung, Fitness oder Regenerierung.
- Medizinische Performance-Optimierung: Ermöglicht die einfachere Implementierung von neueren Leitlinien oder eine transparentere Ergebnis-Messung.
- Informationsaustausch (p2p): Kann über Internetplattformen, wie www.patientslikeme.com erfolgen, indem sich Patienten mit anderen Patienten (p2p) ähnlicher Krankheitszeichen austauschen.
- Kommunikation: Hilft bei der Überwindung von Silos in Institutionen und so einer neuen Form der Planung und Durchführung von Gesundheitsleistungen.
- Adhärenz: Steht für das Einhalten oder Befolgen von bspw. der Medikamenteneinnahme und beinhaltet Szenarien, die besser mit den vereinbarten Empfehlungen des Therapeuten übereinstimmen.
- Neue Geschäftsfelder: Ergeben sich für Anbieter, die vorher nicht im medizinischen Umfeld tätig waren, wie bspw. die Post, die Pflegeservices übernimmt oder der Telekommunikationskonzern, der medizinische Online Services anbietet.
- Entscheidungsunterstützung: Durch die Digitalisierung entstehen u.a. neue Visualisierungsmöglichkeiten oder eine bessere Integration genetischer, klinischer Forschungsdaten. Zudem können Handlungs-Algorithmen bereitgestellt werden.
- Behandlungsfelder: Besserer Schutz vor Behandlungsfehlern durch Big Data Anwendungen.
- Kontrollszenarien: Generierung von neuen Kennzahlen für individuelle oder geografische Komponenten.
- Schnellere Implementierung von Evidenz: Anhand von fortlaufenden Analysen und neuen Erkenntnissen wird der empirische Nachweis der Wirksamkeit erbracht.
- Informationsaustausch (d2p): Auswertung von Sensorik oder Echtzeitanalysen über bspw. Online Services zwischen Arzt und Patient (d2p). Denkbar wäre ein Diabetes-Monitoring, um so Daten besser kumulieren und analysieren zu können.
Big Data und die Daten
Um die Medikamentenentwicklung aus Sicht eines pharmazeutischen Unternehmens kosteneffizienter und zielorientierter zu gestalten, ist es nötig, auf klinische Daten zurückzugreifen. Mit Hilfe dieser lassen sich Probanden einfacher rekrutieren oder Machbarkeitsstudien durchführen. In Europa schließen nur ca. 18 Prozent aller klinischen Studien den Rekrutierungsprozess rechtzeitig ab, wohingegen es in den USA nur noch 7 Prozent sind. Das hat Folgen für die Einführung eines neuen Medikaments und kann ein pharmazeutisches Unternehmen für die Verzögerung um einen Tag bis zu 8 Millionen US-Dollar kosten. In den folgenden Absätzen wird deshalb dargelegt, wo und wie Daten erfasst oder generiert werden können und welchen Gewinn sie darstellen.
Datenerfassung im Allgemeinen
Abgesehen von datenschutzrechtlichen und ethischen Gründen gibt es für die datenintensive Wissenschaft vielerorts große Datenmengen, welche sich für Big Data Anwendungen eignen. Mit Hilfe dieser gesammelten Daten lassen sich komplexere Phänomene besser untersuchen, da die verarbeiteten Datenmengen sich mit statistischen Methoden auswerten und so auf der Basis der vorhandenen Daten Vorhersagen treffen können. Zudem können datenintensive Algorithmen eine größere Anzahl an Parametern berücksichtigen. Das können bspw. Erbanlagen eines Patienten oder unterschiedliche Umwelteinflüsse sein. Arztpraxen und Charité-Institute (Krankenhäuser, Pflegeanstalten) sammeln jede Menge Daten über ihre Patienten, Behandlungsergebnisse, Sensorik oder durchgeführte Forschungen und Studien, welche in unterschiedlicher Form vorliegen. Alleine durch den Kontakt mit den Patienten wird dessen Krankenkassen-Chipkarte eingelesen, der Patient digital verwaltet und nach jeder Sprechstunde bzw. Visite ein Vermerk in seiner Akte hinterlegt. Diese strukturierten sowie unstrukturierten Daten werden in Datenbanken, auf Papier, in elektronischen Dokumenten oder in speziellen IT-Systemen vorgehalten. Gerade Daten in elektronischer Form können mit Big Data Anwendungen einfacher gesammelt und ausgewertet werden. Mit der Inanspruchnahme von Gesundheitsdienstleistungen, wie Rezepten und Therapien, entstehen weitere Daten bei Apotheken und Krankenversicherungen. Gerade letztere sammeln überdies hinaus umfangreiche Daten ihrer Mitglieder, die Krankengeld beziehen. Dabei werden diese umfassend zu der Auswirkung ihrer Krankheit und ihrer persönlichen Lebenssituation befragt, um eine bessere Versorgung zu gewährleisten. Medizintechnikhersteller und pharmazeutische Unternehmen generieren durch Forschung und Studien ebenfalls große Datenmengen. Hierzu gehören Wirkungsweisen von medizinischen Geräten, Medikamenten oder bestimmter Inhaltsstoffe, wie auch Verhaltensauffälligkeiten. Forschungsdaten haben daher spezielle Ausprägungen und unterliegen datenschutzrechtlichen Anforderungen. Mit Gesundheitsämtern, Ministerien, Gemeinden oder nationale und internationale Hilfsorganisationen kommen weitere medizinisch verwertbare Daten hinzu. Einrichtungen, wie Ärzte ohne Grenzen, die sich in Krisengebieten aufhalten und hier zusätzliche ärztliche Versorgung leisten, sammeln ebenfalls unterschiedlich Patientendaten, die sich für Analysen eignen. Darüber hinaus gibt es immer noch Möglichkeiten Daten zuzukaufen.
Datenerfassung mittels mobilen Geräten und Apps
Neben der Datenerfassung rund um den Patienten ist die Selbsterfassung heutzutage leichter geworden. Durch die große Verbreitung von Smartphones und der zunehmenden Bedeutung vom Internet der Dinge steigt u.a. die Verbreitung von tragbaren Sensoren, sogenannten Wearables, zu denen bspw. Smartwatches oder Activity-Tracker gehören. Smartwatches sind Uhren, die einen Mikroprozessor besitzen und neben der Anzeige der Uhrzeit mit unterschiedlichen Funktionen und Anwendungen (englisch: Apps), ähnlich denen auf Smartphones, ausgestattet sind. Darüber hinaus besitzen einige Modelle Sensoren, wie Pulsmesser, Beschleunigungsmesser, Lagemesser (Gyroskop), Magnetometer oder einen Luftdrucksensor. Anhand dieser Sensoren können sie detaillierte Informationen über die Gesundheit oder das Verhalten von Menschen liefern. Die Zahl der verkauften Smartwatches betrug im Jahr 2015 laut IDC ca. 5 Millionen Einheiten, wovon die Apple Watch das erfolgreichste Modell ist und laut eigenen Angaben weltweit den zweiten Platz bei den Uhrverkäufen, hinter Rolex, belegt. Dieser anhaltende Trend spiegelt sich in der weltweiten Quantified Self Bewegung wieder und führt dazu, dass immer mehr Menschen personenbezogene Daten sammeln und für eigene Analysen verwenden. Dazu gehören bspw. zurückgelegte Schritte, verbrauchte Kalorien oder eine Schlafanalyse. Der Begriff „Quantified Self“ steht hierbei für die Möglichkeit, unterschiedliche Eigenschaften über sich selbst zu messen und zu beobachten, um Zusammenhänge zu erkennen und Veränderungen zielgerichtet umzusetzen. In Deutschland ist die AOK Nordost die erste Krankenkassen, die ihren Mitgliedern einen Zuschuss von bis zu 50 Euro für den Kauf von Quantified Self Hardware anbietet. Die Anbieter von Smartwatches erleichtern somit Patienten, Ärzten oder Forschung die Erhebung von Daten. Apple, als Beispiel, bietet mit den Open Source Frameworks ResearchKit und CareKit Erweiterungen in diesem Bereich für sein mobiles Betriebssystem iOS an. Mit ResearchKit können medizinische Forscher zuverlässige und aussagekräftige Daten sammeln, CareKit hilft beim Verstehen und Kontrollieren von Krankheiten. Einige Universitäten und Krankenhäuser bieten für Apple’s Plattform Apps für die Erforschung verschiedener Krankheiten an. Dazu gehören bspw. das Boston Children’s Hospital, welches mit der App „C-Tracker“ in den USA die Erforschung des Hepatitis C Virus vorantreiben möchte. Wearables eignen sich außerdem für die Verwendung in Arztpraxen und Charité-Instituten. Das Smartphone als solches wird häufig für die Erfassung von Fitnessdaten, wie bspw. beim Joggen sowie Radfahren oder darüber hinaus für die Vernetzung mit weiteren Sensoren benutzt. Die dabei gewonnenen Daten von unterschiedlichen Geräten eignen sich ideal als Datenquelle für Big Data Anwendungen und tragen ihren Anteil für die Medizin bei.
Open Data
Die Idee von Open Data Initiativen ist, Daten ohne Einschränkung frei verfügbar und nutzbar zu machen. Dabei sollten offene Daten strukturiert und maschinenlesbar zur Verfügung stehen, um somit eine bessere Weiterverarbeitung zu gewährleisten. Offene Daten können aus Studien, Patientenakten, Forschung, öffentlichen Einrichtungen, Quantified Self Plattformen oder allgemeinen Internetplattformen stammen. Beispielsweise lassen sich Informationen aus einem Medizinforum, wie www.patientslikeme.com, sozialen Netzwerken oder Suchanfragen nutzen. Google Flu Trends war ein Frühwarnsystem, welches Suchanfragen analysierte und aus diesen Rückschlüsse zog. Wenn viele Menschen in einer Region nach einem Medikament gegen Grippe oder den Wörtern „Husten“ oder „Fieber“ suchen, könnte dies auf eine Grippewelle hinweisen. Aufgrund dieser Informationen können öffentliche Einrichtungen mögliche Epidemien erkennen. Jedoch lag die Zahl der Vorhersagen von Infektionen durch Flu Trends weit über den tatsächlichen Werten, weshalb Google den Dienst im Jahr 2015 vorläufig einstellte. Für die Medizin stehen des Weiteren öffentliche Datenbanken, wie HapMap, Krebs-Genom-Atlas, PubMed oder Wirkstofflisten, zur Verfügung. Das Ziel des internationalen HapMap Projekts ist es, gemeinsame Muster von DNA-Sequenz-Variationen im menschlichen Genom zu bestimmen und diese Informationen der Öffentlichkeit über ein Internetportal zugänglich zu machen. Ein internationales Konsortium entwickelt hierzu eine Karte über die Muster anhand der Bestimmung der Genomtypen von mehr als einer Million Sequenzvarianten, deren Frequenzen und der Grad der Assoziationen zwischen ihnen in DNA-Proben aus Afrika, Asien und Europa. Ein ähnliches Projekt stellt der Krebs-Genom-Atlas (TCGA – The Cancer Genome Atlas) dar, der Gendefekte aller bekannter Krebsarten in einer Bibliothek sammelt und über ein Internetportal zur Verfügung steht. PubMed ist eine Meta-Datenbank mit medizinischen Artikeln im Bereich der Biomedizin der US National Library of Medicine.
Welchen Gewinn stellen die Daten dar
Die Datenquellen von Big Data Anwendungen sind hinsichtlich ihres Umfangs, ihrer Qualität, ihrer Sensibilität und letztlich ihrer Aussagekraft sehr vielfältig. Der Datenumfang, gerade im Bereich Wearables bzw. Quantified Self, ist enorm. Fraglich ist jedoch, ob die Qualität dieser Daten auch wissenschaftlich und medizinisch wertvoll sind. Grundsätzlich gilt, die Quantität von Daten ersetzt nicht die Qualität. Analysen durch Suchmaschinen und Daten aus soziale Medien sind nicht für medizinische Datensammlungen konzipiert, da die Krankheitssuche im Internet als kritisch angesehen wird, da derjenige, der sucht, nicht selbst von einer Krankheit betroffen sein muss. Fraglich ist auch die Qualität der Daten, die in einer Arztpraxis anfallen. Dort wird nicht immer sofort die richtige Diagnose gestellt, zudem kann ein Facharzt für weitere Diagnosen hinzugezogen werden, weshalb der Krankheitsverlauf in unterschiedlichen Informationssystemen, Dateiformaten oder sogar auf Papier dokumentiert ist. Soll aufgrund dieser Daten eine Analyse durchgeführt werden, müssen zuvor sämtliche Daten zusammengeführt und ggf. digitalisiert werden, wodurch neue Herausforderungen in Bezug auf die Qualität entstehen. Hinzu kommen Daten von Sensoren aus bspw. Wearables. Hier gibt es keine Gewissheit, dass die erhobenen Daten den reellen Werten entsprechen, da Smartwatches oder Activity-Tracker in der Regel für den Massenmarkt und nicht für medizinische Zwecke entwickelt werden. Dem stehen Daten aus Studien oder allgemein der Forschung gegenüber. Die so erhobenen Daten verfügen über detailliertere Informationen und erfüllen einen wissenschaftlichen Zweck. Anhand der Algorithmen lassen sich die Informationen filtern, die Einordnung und das Verständnis des Ergebnisses erfordern nach wie vor die Expertise eines Arztes. Es ist daher vor einer Analyse abzuwägen, welche Daten als Grundlage dienen und welche Aussagekraft erwartet wird. Dabei kann es hilfreich sein, kleine Datenmengen denen großer zu bevorzugen.
Der Fall des Genetik-Professors Michael Snyder der Universität von Standord/USA zeigt, wie wirkungsvoll Big Data Anwendungen in der Biomedizin gegenüber einer herkömmlichen medizinischen Untersuchung sein können. Als Snyder begann, seine eigenen Blutproben im Rahmen einer Studie in der Genomforschung auszuwerten, stellte er dabei fest, dass es ein hohes Risiko für Typ2-Diabetes bei ihn gibt. Die Krankheit konnte noch erfolgreich vor dem Ausbruch behandelt werden. Dabei gab es keinerlei Anzeichen bei Snyder für Diabetes, auch nicht in der Familie. Mittlerweile hat er seine Ernährung umgestellt und überwacht regelmäßig seinen Blutzuckerspiegel. Zudem treibt er mehr Sport. Die Kosten für eine solche Untersuchung einschließlich Analyse sind zwar noch hoch, werden aber in Zukunft sinken.
Sicherheitsrelevante Aspekte bei Big Data
Das erklärte Ziel der Wissenschaft im heutigen Zeitalter ist es, große Datenmengen zum einen zu beherrschen und zum anderen den Herausforderungen zu stellen bzw. deren Chancen zu nutzen. In der Medizin wird eine Verbesserung in den Bereichen Forschung, Prävention und Behandlung erwartet, während sich zudem Kosten sparen lassen. Doch im Kontext mit der Medizin betrifft das ebenso sicherheitsrelevante Aspekte, wie bspw. den Datenschutz und die Politik. Die angestrebten Ziele lassen sich allerdings nur erreichen, wenn die Akzeptanz gegenüber Datenanalysen bei den betreffenden Personen steigt. Daher ist es wichtig, die Erwartungshaltung an Vertraulichkeit im Umgang mit Gesundheitsdaten zu erfüllen.
Datenschutz
Medizinische Daten unterliegen dem Datenschutzrecht, soweit personenbezogene Daten erhoben oder verwendet werden sowie der ärztlichen Schweigepflicht, resultierend aus dem Eid des Hippokrates, welcher seit über 2000 Jahren allgemeingültig ist. Gefestigt wird dies durch § 203 Strafgesetzbuch (StGB), welcher den Patienten vor der unbefugten Weitergabe von Privatgeheimnissen durch Ärzte und anderen Berufsgruppen schützt. Liegt allerdings ein Rechtfertigungsgrund vor oder besteht Gefahr für Leib und Leben, darf von einer Schweigepflicht abgesehen werden. Unabhängig davon können entsprechende Angaben persönlichkeitsrechtlich von höchster Sensibilität sein und den Betroffenen im sozialen Kontext in eine Situation hoher Verletzlichkeit bringen. Daher schützt das Datenschutzrecht solche Daten im besonderen Maße und macht zudem die Zulässigkeit einer Verarbeitung grundlegend von einer Einwilligung abhängig. Geregelt ist dies u.a. im § 3 Abs. 9, § 28 Abs. 6 bis 9 Bundesdatenschutzgesetz (BDSG) sowie im § 7 Abs. 12 Sozialgesetzbuch (SGB) X. Weitere Anwendung findet dieser Schutz in den Normen zur gesetzlichen Krankenversicherung im SGB V, Krankenhausgesetzen, Gesundheitsdienstgesetzen, Krebsregistergesetzen, Gendiagnostikgesetz (GenDG), Infektionsschutzgesetz (InfSchG), Arzneimittelgesetz (AMG) und weiteren spezifischen Normen des Medizinrechts. Hinzu zählt auch das Prinzip der Datenvermeidung und der Datensparsamkeit nach § 3a BDSG. Der Zugriff und die Verarbeitung von Daten findet allerdings seine Grenzen, wenn Aspekte der Privatsphäre und der Sicherheit betroffen sind. Um Datenmengen statistisch auszuwerten, ist es im Grundsatz des Datenschutzrechts nötig, diese frühestmöglich zu anonymisieren bzw. zu pseudonymisieren. Im BDSG sind nur die Daten geschützt, welche die Identität einer Person nach § 3 Abs. 1 BDSG verraten und gelten als anonym, wenn die Herstellung des Personenbezuges ohne unverhältnismäßigen Aufwand nicht mehr möglich ist. Zudem ist die Reidentifizierung der Daten nach § 43 Abs. 2 BDSG strafbar. Eine Pseudonymisierung von einzelnen Datensätzen, die einer Person zugeordnet werden können, reicht für den Ausschluss einer Reidentifizierung regelmäßig nicht aus. Das ist gerade dann der Fall, wenn Pseudonyme längerfristig zur Zuordnung von Individualdatensätzen genutzt werden. Laut § 3 Abs. 6a BDSG versteht man unter Pseudonymisierung das Ersetzen von Namen und weiteren Identifikationsmerkmalen durch Kennzeichen zu dem Zweck, die Bestimmung des Betroffenen auszuschließen oder zu erschweren. Trotzdem können Verfahren der Pseudonymisierung ausreichen, um eine datenschutzkonforme Analyse zu ermöglichen. Allerdings setzen diese die Pseudonymisierung von Patientendaten und den Angaben der Datenquellen, wie Ärzte, Helfer, Krankenhäuser, Apotheken oder Dienstleister, voraus. Sobald keine personenbezogenen Daten betroffen sind, die einer bestimmten oder bestimmbaren Person zuzuordnen sind, greifen datenschutzrechtliche Grundsätze nicht. Dies fördert die Akzeptanz und legalisiert Big Data Anwendungen. Darüber hinaus ist es förderlich, Daten zu verschlüsseln, um sie so vor Missbrauch zu schützen. Verschlüsselung sind Verfahren, die zur Sicherstellung der Vertraulichkeit von Nutzdaten wie auch der Verkehrsinformationen dienen. Fehler bei der Anonymisierung und Pseudonymisierung können den Rohdatensatz verändern und Auswertungsergebnisse verfälschen. Die gesammelten Gesundheitsdaten unterliegen nach § 9 BDSG den allgemeinen Datenschutzzielen, wie Vertraulichkeit, Integrität und Verfügbarkeit. Vertraulichkeit ist gegeben, wenn keine unautorisierte Informationsgewinnung möglich ist. Integrität bedeutet, die zu schützenden Daten vor unautorisierter und unbemerkter Manipulation abzusichern. Unter Verfügbarkeit ist die Verhinderung von Systemausfällen zu verstehen. Bei der Erhebung von Daten sind Betroffene zu unterrichten, welche Daten erhoben werden und wofür und unterliegen einer Zustimmung. Die Aufbewahrungsfristen sind abhängig von der Art der Information und gesetzlich geregelt. Hierbei ist das Recht auf informationelle Selbstbestimmung nicht auf bestimmte Daten beschränkt und gewährleistet den Schutz vor unbegrenzter Erhebung, Verarbeitung und Nutzung der personenbezogenen Daten.
Herausforderungen für die Politik ergeben sich im Umgang mit Krankenversicherungstarifen, welche für die Weitergabe von Gesundheitsdaten durch bspw. Activity-Tracker oder Smartphone-Apps einen Bonus offerieren. So bietet z.B. die Versicherung Generali ihren Versicherten die Möglichkeit an, über einen speziellen Tarif „Vitality“ durch die Preisgabe solcher Informationen einen Bonus auf den Mitgliedsbeitrag zu erhalten. Jedoch kann dieser auch steigen. Allerdings lassen sich mit den erhobenen Daten Rückschlüsse auf den Gesundheitszustand des Versicherers ableiten. Gesunde Menschen werden vermutlich mit der Preisgabe kein Problem haben. Jedoch könnten Versicherungen Mitgliedsanträge derjenigen ablehnen, die der Datensammlung nicht zustimmen.
Fazit
In der Medizin gibt es hinreichend Einsatzmöglichkeiten für den Einsatz von Big Data, die nicht nur in der Forschung hilfreich sein können, sondern auch im Alltag von Krankenhäusern oder Arztpraxen und in der Individualmedizin helfen. Die Analyse der menschlichen Anatomie unterstützt die Entscheidungsfindung für die Heilung mit einer individuellen Therapie. In der Genetik besteht großes Potenzial bei der Entschlüsselung und Auswertung des Erbguts, wie der Fall von Michael Snyder zeigt. Potenzial besteht ebenfalls bei der finanziellen Optimierung von Ressourcen hinsichtlich der Behandlung von Patienten, wodurch medizinische Einrichtungen und Krankenkassen profitieren. In Forschungseinrichtungen, Instituten oder pharmazeutischen Unternehmen kann Big Data zur Vereinfachung der Probandengewinnung beitragen. Mit der Veröffentlichung von Daten aus Projekten, wie HapMap oder dem Krebs-Genom-Atlas, stehen öffentliche Datenbanken zur Verfügung, die den Ärzten und den Forschern neue Einblicke ermöglichen. Doch mit Big Data besteht die Gefahr der massiven Datenvorhaltung, welche Analysen erschwert bzw. die Qualität der Aussagekraft beeinträchtigt. Grundsätzlich unterliegt die Verwendung von Daten im medizinischen Bereich rechtlichen Rahmenbedingungen und müssen daher vor Missbrauch geschützt werden, was wiederum den Gesetzgeber in die Pflicht nimmt. Das Beispiel von Krankenkassen, die ihren Mitgliedern durch die Preisgabe von Gesundheitsdaten einen Bonus in Aussicht stellen, ist gesondert zu betrachten, gerade dann, wenn Mitglieder benachteiligt oder ganz ausgeschlossen werden. Die technologischen Einsatzmöglichkeiten in der Medizin sind vielfältig und machen Ärzte nicht überflüssig, helfen jedoch der medizinischen Versorgung allgemein und machen Innovationen zugänglicher.