Daten gelten als das „neue Öl“ oder „neue Gold“ – doch so verlockend diese Vergleiche klingen, so wenig helfen sie bei der konkreten Frage: Was sind Daten eigentlich wert? Während bei Rohstoffen weltweit geregelte Handelsplätze, Qualitätsstandards und transparente Preise existieren, bleiben Datentransaktionen oft undurchsichtig. Gerade im Unternehmensumfeld – sei es in der Pharma-Branche, im Finanzwesen oder im Bereich KI – stellen sich dieselben Herausforderungen: Wie lässt sich ein Daten-Asset bepreisen? Wer braucht welche Daten, wie dringend und in welcher Form? Und wie legt man einen fairen Preis fest, wenn der Datensatz theoretisch beliebig kopiert werden kann, sein Wert aber extrem von Exklusivität, Qualität und Verwendungszweck abhängt? Dieser Artikel liefert Denkanstöße zu diesen Fragen. Er erläutert Grundlagen, zeigt typische Fallstricke und stellt praxisnahe Modelle vor, um Daten besser zu bewerten und zu bepreisen.
1. Daten haben keinen intrinsischen Wert
Der erste und vielleicht wichtigste Grundsatz lautet: Daten haben keinen innewohnenden Wert. Ihr Nutzen – und damit ihr Preis – bemisst sich stets daran, was man mit ihnen tut. Für Pharma-Unternehmen bedeutet dies konkret: Eine umfassende Datenbank zu seltenen Erkrankungen kann für ein Unternehmen, das gerade ein entsprechendes Medikament entwickelt, von unschätzbarem Wert sein. Für ein anderes, das sich auf gängige Krankheiten fokussiert, dagegen nur bedingt. Nicht nur der Zweck, sondern auch die Größe und Kompetenz des datenverarbeitenden Unternehmens spielen beim Preis eine Rolle. Ein Pharmariese mit eigener KI-Infrastruktur kann aus denselben Patient:innenakten mehr Erkenntnisse ziehen als ein mittelständisches Biotech-Start-up. Außerdem ist die Bereitschaft und Fähigkeit, für Daten zu zahlen, bei größeren Unternehmen tendenziell höher. Das ist keineswegs bloß eine Frage „tiefer Taschen“, sondern rationales Verhalten: Wer aus einem Datensatz zehnmal so viele relevante Erkenntnisse generieren kann, ist üblicherweise bereit, mehr dafür zu bezahlen.
Konsequenz: Bevor man ein Datenpaket erwirbt oder veräußert, muss geklärt sein, welchen konkreten Anwendungsfall (engl. „Use Case“) die Daten haben sollen. Reine Datensammlung ohne klares Ziel bleibt in der Pharma-Welt finanziell riskant – zumal regulatorische Auflagen hoch und Haftungsrisiken nicht unerheblich sind.
2. Daten sind rivalisierender, als man denkt
In letzter Zeit tun sich große Universitätskliniken damit hervor, dass sie gegen 6- bis 7-stellige Dollarbeträge Zugang zu gut strukturierten Patientendaten ermöglichen. Oftmals bekommt man keinen direkten Zugang zu den Daten, sondern nur die Möglichkeit, eine KI anhand der Daten zu trainieren. Überraschenderweise geben Pharma-Konzerne wie auch Medizintechnik-Unternehmen bereitwillig viel Geld für einen nicht-exklusiven Datenzugang aus. Doch in der Praxis hängt der Wert von Daten stark davon ab, ob nur ein Unternehmen sie hat oder auch andere.
In der Pharma-Industrie sind exklusive Daten ein entscheidender Faktor, zum Beispiel Studienergebnisse oder Patient:innendaten, die nur einer Firma zur Verfügung stehen. Dieses Alleinstellungsmerkmal schafft einen Vorsprung: Wer einzigartige Informationen über eine bestimmte Patient:innengruppe, Biomarker oder Wirkungsweise besitzt, kann damit Medikamente und KI-Modelle gezielter entwickeln und schneller zur Zulassung bringen. Sobald jedoch andere Unternehmen dieselben Daten erwerben, schmilzt der Vorsprung dahin. Was vorher ein seltenes Gut war, verliert an Besonderheit – und damit sollte auch der Preis fallen.
Geteilte Daten, geteilte Wirkung. Daten mögen kopierbar sein, doch der Nutzen, den sie erzeugen, lässt sich oft nicht unendlich vervielfachen. Wer als Erster exklusive Daten analysiert, kann daraus Maßnahmen ableiten – etwa für die Planung klinischer Studien oder die Identifikation geeigneter Patient:innen. Sobald ein Mitbewerber dieselben Informationen hat, bringt sie nicht mehr denselben Vorteil. Der Wert eines Datensatzes liegt damit nicht nur in seiner Existenz, sondern in seiner Einzigartigkeit.
Fazit: Daten sind nicht deshalb rivalisierend, weil sie „aufgebraucht“ werden, sondern weil ihr Wettbewerbswert schwindet, sobald sie nicht mehr exklusiv sind. Wer exklusive Daten besitzt, kann einen Vorsprung erzielen – doch mit jeder weiteren Kopie sinkt dieser Wettbewerbsvorteil und damit oft auch der Preis. Gerade in der Pharma-Branche, wo Innovationsvorsprünge entscheidend sind, ist es daher wichtig, an proprietäre, exklusive Datensätze zu gelangen oder sich zumindest einen zeitlichen Vorsprung zu verschaffen.
3. Einzigartige Daten sind besonders wertvoll
Warum ist es für Unternehmen so erstrebenswert, wirklich einzigartige Datensätze zu besitzen? Es gibt drei Hauptgründe:
- Universelle Additivität
Einzigartige Daten lassen sich fast immer mit vorhandenem Wissen kombinieren und dadurch in ihrem Nutzen steigern. Ob KI-Modelle, klinische Studien oder Marktanalysen – zusätzliche, exklusive Informationen „oben drauf“ erhöhen fast immer die Treffer- und Erfolgschancen. - Lebenszyklus-Kontrolle
Wer Daten besitzt, die sonst niemand hat, kann deren Verbreitung steuern und so den Preisverfall (Kommodifizierung) hinauszögern. Das Unternehmen entscheidet, ob es Datenauszüge nur einem kleinen Kreis zugänglich macht (hohe Preise, exklusive Nutzung) oder ob es ab einem bestimmten Zeitpunkt eine breitere Verfügbarkeit anstrebt (geringerer Stückpreis, aber größerer Markt). - Monopolstellung bei „Table Stakes“
Sollte ein einzigartiger Datensatz so wichtig werden, dass er in einer Branche zum unverzichtbaren Standard avanciert, verwandelt sich der Datenbesitzer nahezu in eine Art Monopolisten (was durchaus auch verheerende Konsequenzen für den Markt und die Gesellschaft haben kann und ein Einschreiten der Behörden erforderlich machen kann). Wer dann in diesem Markt agieren will, muss auf diesen Datensatz zugreifen – ein wenig wie eine „Steuer“ auf die gesamte Branche.
Vorsicht vor funktionalen Substituten
Allerdings ist „Einzigartigkeit“ manchmal trügerisch. Unterschiedliche Datenquellen können dieselbe Frage beantworten und damit funktional substituierbar sein. So sind etwa Kredikartendaten, Fußgängerzählungen und E-Commerce-Suchvolumen auf den ersten Blick grundverschieden – geben aber allesamt Auskunft über Konsumentenverhalten.
- Additiv und doch konkurrierend
Solche funktional ähnlichen Daten lassen sich zwar kombinieren (und werden dadurch noch aussagekräftiger), wettbewerben aber gleichzeitig um denselben Nutzen. Ein vermeintlich „einzigartiger“ Datensatz verliert an Wert, wenn es eine einfach zugängliche Alternative gibt. - Hierarchie der Signale
Häufig gibt es eine Rangfolge: Je näher ein Datensatz am eigentlichen Ereignis ist (z. B. direkt beim Kaufakt), desto wertvoller gilt er – denn hier ist die Signalstärke am höchsten. Weiter entfernte (z. B. demografische) Daten können ähnlich nützlich sein, liefern jedoch nicht dieselbe Trefferwahrscheinlichkeit. Auch in der Medizin gilt meistens dass je länger der zeitliche Abstand zwischen einer Exposition und ihrer gesundheitlichen Auswirkung, desto schwieriger wird es, adäquater für ‘Confounder’ zu kontrollieren.
4. Daten durchlaufen Lebenszyklen – und ihre Preise auch
Ein Datensatz besitzt eine Art „Lebenszyklus“. Zunächst ist er meist unvollständig oder unsicher („Frühes Stadium“). Hier kann er günstig sein, bietet aber auch wenig Mehrwert. Dann entwickelt er sich zu einem hoch begehrten Nischenprodukt für Spezialist:innen („Alpha-Phase“), in der sein Preis exponentiell steigen kann – beispielsweise seltene Genomik-Daten für die Entwicklung eines Orphan-Drug. Sobald jedoch mehrere Anbieter ähnliche Daten liefern, beginnt der Wert zu sinken („Konsolidierung“). Letztlich avanciert ein Datensatz manchmal zu „Basiswissen“, das alle haben müssen („Table Stakes“). Hier steigt der Preis oft noch einmal – nicht auf das Alpha-Niveau, aber doch signifikanter, weil der Datensatz zum Standard geworden ist. Daten haben auch unterschiedliche Halbwertszeiten, Krankheitsprävalenzen können sich beispielsweise ändern. Wenn große Migrationsströme eintreten, ein neues Medikament wie GLP-1 sich auf verschiedene Risikofaktoren (von Diabetes über Rückenschmerzen bis hin zu Alkoholkonsum) auswirken oder Pandemien wie Covid chronischen Erkrankungen führen, können Datensätze, die vor diesen Ereignissen entstanden sind, je nach Anwendungsfall möglicherweise deutlich an Wert verlieren. Im Kern geht es immer primär um die Frage, welchen Grenznutzen neue Daten bringen.
5. Wie kann man Daten konkret bepreisen?
5.1 Warum Standard-Software-Pricing bei Daten nicht funktioniert
Die meisten von uns sind an traditionelle Lizenzmodelle aus der Softwarewelt gewohnt: Abrechnungen pro Nutzer („Seat-Lizenz“), gestaffelte Abovarianten („Bronze, Silber, Gold“) oder Volumen-Tarife nach Speichernutzung. Doch diese Modelle greifen bei Daten häufig zu kurz:
Kein linearer Skalierungsfaktor
Ein zusätzlicher „Nutzer“ eines Datensatzes steigert nicht unbedingt den Wert so wie eine zusätzliche Software-Lizenz. Daten werden in Teams genutzt und basieren auf kollektiven Auswertungen, sodass eine rein nutzerbasierte Metrik wenig Sinn ergibt.
Unklare Funktionsabgrenzung
Software lässt sich nach Features staffeln. Bei Daten ist oft unklar, welche „Funktion“ man einschränken sollte. Eine simple Aufteilung wie „Basic“ vs. „Premium-Datensatz“ lässt sich selten sauber definieren.
API-Aufrufe sind schwer zu bewerten
Während bei SaaS-Lösungen häufig nach Anzahl der API-Calls abgerechnet wird, ist bei Daten wichtig zu wissen, worum es in diesen Calls geht und ob sich der Datensatz über längere Zeit verändert. Dauerhafte Zugriffe auf immer dieselben (statischen) Daten lassen sich kaum mit einem Nutzungszähler monetarisieren.
5.2 Andere Ansätze, die funktionieren
Stattdessen haben sich in der Praxis einige Spezifika bei Daten etabliert, die sich sinnvoll bepreisen lassen:
- Strukturierte Volumina
Werden Daten tabellarisch oder gut klassifiziert angeboten, kann man nach Datensätzen, Attributen, Historientiefe oder Granularität abrechnen. Beispielsweise zahlt ein Unternehmen für 1 Million Patient:inneneinträge mit jeweils 20 Merkmalen deutlich mehr als für 100.000 Einträge mit nur 5 Merkmalen. - Zugriffsrechte und Exklusivität
Wer Daten früher (z. B. in Echtzeit) oder exklusiv (z. B. in einer Branche nur an einen Player) erhält, kann mehr dafür verlangen. Auch individuelle Nutzungsrechte (z. B. interne Verwendung vs. Weiterverkauf) sind ein Hebel für Preisstaffelungen. - Preis nach Use Case
Daten können für einen Konzern hochrelevant sein, während ein KMU keinen vergleichbaren Nutzen hat. Eine Staffelung nach Verwendungszweck, Teamgröße oder Geschäftsbereich berücksichtigt den tatsächlichen Mehrwert für den Käufer. - Qualität, Coverage & Aktualität
Wenn Daten überdurchschnittlich akkurat, vollständig und aktuell sind, steigt ihr Wert. Genauso, wenn sie seltene, aber relevante Merkmale enthalten (etwa spezielle Biomarker). Dieser Qualitätsaspekt lässt sich gesondert bepreisen. - KI-spezifische Mengenmodelle
Im Kontext großer KI-Modelle kann auch ein reines Mengenmodell funktionieren – etwa „X Euro pro n Millionen Datenpunkte/Tokens“ – da hier die Masse selbst ein wichtiger Treiber der Modellgüte ist.
6. Wie Nutzungsrechte den Preis beeinflussen
Daten haben nur den Wert, der aus ihrem Einsatz resultiert. Entsprechend spielen Vertragsklauseln zu Nutzungsrechten eine zentrale Rolle beim Preis:
- Nutzung intern oder extern
Darf der Käufer die Daten nur für interne Zwecke nutzen (z. B. Forschungsprojekte), oder auch in Kundenprodukten integrieren? Erweiterte Nutzungsrechte bedeuten meist einen höheren Preis. - Exklusivität und Weitergabe
Wird dem Käufer erlaubt, die Daten an Partner oder Tochtergesellschaften weiterzugeben, oder bleibt deren Nutzung streng auf eine Einheit beschränkt? Mit jedem weiterreichenden Recht steigt der potenzielle Nutzen – und damit auch der Preis. - Derived-Data-Rechte
Darf der Käufer aus den lizenzierten Daten abgeleitete Produkte (z. B. Analysen, Vorhersagemodelle) frei vertreiben? Uneingeschränkte Derived-Data-Rechte erhöhen den Wert erheblich, denn so lassen sich aus dem Ursprungspaket skalierende Erträge erzielen. - Konformität & Haftung
In stark regulierten Bereichen (Pharma, Finanzwesen) sind Datenschutz und Compliance essenziell. Wer rechtssichere Nutzungsrechte samt Garantien und Auditmöglichkeiten bietet, kann höhere Preise verlangen.
7. Was macht hochwertige und wertvolle Daten aus?
Die Qualität eines Datensatzes ist ein zentraler Faktor für dessen Marktwert – doch „Qualität“ hat viele Facetten:
- Genauigkeit und Korrektheit
Präzise Messdaten oder akribisch gepflegte Patient:innenakten minimieren das Fehlerrisiko in downstream-Anwendungen. Für Branchen mit hohen Standards (z. B. klinische Forschung) ist das ein großer Vorteil. - Vollständigkeit und Abdeckung („Coverage“)
Ein Datensatz mit breiter Abdeckung (z. B. viele Länder, lange Historie, große Varianz in den Fällen) ist mehr wert als ein Datensatz mit Lücken. Besonders in Pharma, wo seltene Krankheitsbilder oder diversifizierte Patient:innengruppen relevant sind, kann eine umfassende Coverage entscheidend sein. - Struktur und Annotation
Daten werden wertvoller, wenn sie gut aufbereitet sind – etwa durch einheitliche Formate, klare Kategorisierungen und Meta-Informationen. Für KI-Modelle gewinnt zudem die Annotation (z. B. genaue Labels) immer mehr an Bedeutung. - Aktualität
In vielen Use Cases verlieren Daten rasch an Relevanz, wenn sie nicht laufend aktualisiert werden (z. B. Echtzeit-Daten zu Infektionsgeschehen). Ein regelmäßiges Update macht sie wertvoller. - Provenance und Compliance
Je sicherer die Herkunft und je rechtskonformer der Datensatz (Datenschutz, Einwilligungen, Ethik), desto geringer das Risiko für den Käufer – und umso höher der mögliche Preis. Dies ist leider viel zu oft ein Nachgedanke und oft ist im Nachgang eine korrekte Patienteneinwilligung unmöglich zu gewinnen, was viele Daten nicht verwertbar macht.
Hochwertige Daten zeichnen sich durch eine sorgfältige Mischung aus Genauigkeit, Vollständigkeit, Struktur, Aktualität und legaler Absicherung aus. Je besser ein Datensatz diese Dimensionen bedient und je relevanter er für den konkreten Anwendungsfall ist, desto größer sein Wertpotenzial.
8. Table Stakes Data comes in different flavours
Der Begriff „Table Stakes“ beschreibt Datensätze, an denen kein Weg vorbeiführt, wenn man in einer bestimmten Branche konkurrenzfähig bleiben möchte. Ist ein Datensatz erst einmal unverzichtbarer Standard, müssen praktisch alle relevanten Akteure ihn lizenzieren. Das führt zu einem stabilen, oft hohen Preisniveau und langfristigen Einnahmen für den Anbieter. Es gibt unterschiedliche Wege, wie Daten zum „Table Stake“ werden:
- Industriestandard
Manche Datensätze etablieren sich als gemeinsames „Grundgerüst“ für den Austausch, beispielsweise einheitliche Klassifikationen (SNOMED-CT) oder Interoperabilitätsstandards (z.B. HL7/FHIR). Auch hier hilft es, möglichst früh Standards sehr breit einzusetzen. - Benchmark-Funktion
Daten, die als Messlatte für Leistungen dienen – zum Beispiel klinische Vergleichswerte oder offizielle Qualitätsstandards – werden häufig zu Table Stakes. Wer früh beginnt, Daten so aufzubauen, dass sie einen Referenz-Charakter haben können, baut sich langfristig große Werte auf. - Quasi-Monopol durch Daten-Flywheel
Manche Unternehmen entwickeln einen Daten-Flywheel-Effekt, indem Nutzeraktivität oder Partnernetzwerke ständig neue Daten generieren. Google und Meta im Werbemarkt oder spezialisierte Anbieter in Pharma, die über Jahre Patient:innendaten sammeln, bauen so eine fast unantastbare Führungsposition auf. Der US-Investor Andreessen-Horowitz geht einen Schritt weiter und spricht vom ‘Clinical Rigour Flywheel’ — indem durch Daten zunehmend bessere Behandlungsergebnisse nachweislich erzielt werden, was dazu führt, dass diese bessere Lösung kaum durch neue Wettbewerber ersetzt werden kann.
Fazit
Daten zu bepreisen ist komplexer, als einfache Analogien („Daten sind das neue Öl“) vermuten lassen. Rivalisierende Effekte durch Exklusivität, fehlende Standardisierung und die Vielfältigkeit der Anwendungsfälle machen es notwendig, individuelle Bewertungs- und Geschäftsmodelle zu entwickeln.
- Exklusivität vs. Reichweite: Wer Daten besitzt, muss entscheiden, ob er wenige Kunden hochpreisig bedient oder einen größeren Markt zu einem günstigeren Tarif erschließt.
- Echtes Verständnis für den Use Case: Ein Datensatz ist nur so viel wert wie sein Nutzen in der spezifischen Anwendung. Eine präzise Bedarfsermittlung ist deshalb Pflicht.
- Qualität, Struktur, Compliance: Je höher die Datenqualität und je transparenter die Herkunft, desto größer der Wert.
- Table Stakes als Königsdisziplin: Wird ein Datensatz zum Branchenstandard, winken langfristig konstante Einnahmen.
Unternehmen – ob im Pharma-Bereich, im Finanzsektor oder im KI-Umfeld – sollten sich der besonderen Merkmale von Daten bewusst sein: ihrer Rivalität durch Exklusivität, ihrer Abhängigkeit vom Verwendungszweck und ihrer enormen Wertsteigerung durch Kombination und Qualitätssicherung. Nur wer diese Faktoren konsequent berücksichtigt, findet den angemessenen Preis für den Datenhandel und kann langfristig von seinen Daten profitieren.
9. Fazit: Eine neue Ära für Datenwert in der Pharma-Branche
Die Pharmaindustrie wird immer stärker zum Datenmarkt: Ob beim Entwickeln neuer Therapien, dem Beobachten von Real-World-Evidence in Patient:innengruppen oder dem Training von KI-Modellen. Zugleich verlangt die Branche nach klaren und fairen Pricing-Strukturen, um Datenhandel seriös und gewinnbringend zu gestalten.
Fünf kurze Lehren für die Praxis:
- Use Case klar definieren: Welchen konkreten Nutzen stiften die Daten?
- Kundenprofil schärfen: Wie groß ist das Unternehmen? Wie professionell nutzt es Daten?
- Qualität und Aktualität: Welchen Mehrwert haben genauere, frischere und besser annotierte Datensätze?
- Exklusivität bedenken: Wie kann man den Datenvorsprung schützen, um den Wert hochzuhalten?
- Langfristige Modelle anstreben: Wo möglich, sollten Daten kontinuierlich aktualisiert werden, um konstante Einnahmen zu sichern.
Die Preise für ein Barrel Öl werden weiter täglich an Rohstoffbörsen notiert. Der Wert medizinischer Daten jedoch bleibt komplexer und dynamischer. Umso mehr kommt es für Pharma-Firmen darauf an, datengetriebene Geschäftsmodelle nicht nur technisch, sondern auch ökonomisch und regulatorisch präzise zu planen. Denn wer den Wert seiner Daten – oder der Daten, die er kauft – unterschätzt, verpasst womöglich den entscheidenden Wettbewerbsvorteil in einer immer stärker auf Informationen angewiesenen Gesundheitsindustrie.