Big Data – Ein allgemeiner Hintergrund

Verfolgt man die Diskussionen in unserer Gesellschaft und in unserer Wirtschaft, dann ist vermehrt zu sehen, dass das Schlagwort „Big Data“ (auch: „Massendaten“) kein vorübergehender Trend ist, sondern zu einem Hype geworden ist, der sich auf Verbraucherinnen bzw. Verbraucher auswirkt. Dieser Artikel beschreibt generelle Hintergründe zu Big Data.

Big Data ist in unserer fortschreitenden Digitalisierung allerdings nicht nur ein Trend, sondern vielmehr eine wesentliche Grundlage für die Schaffung neuer, innovativer – vorwiegend digitaler – Produkte und wird als Sammelbegriff für Informations- bzw. Datenmanagement eingesetzt, das in großen Mengen erfolgt, wobei die Grenzen konventioneller Computer-Systeme überschritten werden.

Big Data schafft zusätzliche Werte

Weil Big Data eine wichtige Grundlage für innovative Produkte ist, stiftet Big Data vor dem Hintergrund einer großen Reichweite der Datennutzung und dem anzapfen interner bzw. externer Datenquellen immer größeren Wert für Nutzerinnen und Nutzer bzw. für Unternehmen. Das gilt insbesondere deswegen, weil auch die Einsatzbereiche von Big Data quasi nicht limitiert sind. Daher sind die damit verbundenen Wertschöpfungspotentiale beinahe unbegrenzt sind.

Trotzdem handelt es sich nicht um eine Software-Lösung die man einfach kaufen kann, sondern um eine weitreichende Kombination verschiedener Technologien und Konzepte, um den Wert von Daten anzureichern.

Verwendete Datenstrukturen

Im Zuge der Digitalisierung sind sowohl strukturierte Daten (z.B.: Geburtsdatum, Geschlecht, Kontonummer, PAN einer Kreditkarte) als auch in der Besonderheit bei Big Data ebenfalls auch unstrukturierte (z.B.: E-Mail, Social-Media-Beiträge) bzw. semi-strukturierte Daten (z.B.: Excel-Tabellen, JSON, XML) als weitere Produktionsfaktoren zunehmend in Erscheinung getreten.

Daten- und Analysefunktionen im IT-Bereich haben in den letzten Jahren einen großen Sprung nach vorne gemacht, wodurch über bestehende Datensätze - insbesondere für unstrukturierte Daten - zu späteren Zeitpunkten neue Analysen durchgeführt und somit auch neue Zusammenhänge oder sonstige Informationen herausgelesen werden können. Dadurch sind aufgewertete Daten mittels der Kombination verschiedener Datenquellen für eine Vielzahl von Anwendungsfällen nutzbar und dank intelligenter Algorithmen interpretierbar.

Verbinden von internen bzw. externen Datenquellen

Um die Nutzungspotentiale zu realisieren werden immer mehr unternehmensinterne Datenquellen (z.B.: Kundendaten, Lieferantendaten, Logistikdaten) in Verbindung mit der Einbeziehung externer Datenquellen (z.B.: externe Webseiten, Social Media) verknüpft. Dadurch ist ein Brückenschlag zur Monetarisierung von immateriellen Ressourcen – den Daten – aus unterschiedlichen Datenquellen durchführbar. Diese immateriellen Ressourcen werden nach mehrfacher Verwendung nicht verbraucht. Das bedeutet, Informationsbenutzerinnen und -benutzer erhalten somit eine Kopien der Daten für die Verwendung.

Als Kehrseite werden umfangreiche Datenmengen gewonnen wobei teilweise im Vorhinein noch nicht feststeht wofür sie künftig verwendet werden. Oft geht dies auch mit einem regen Datenaustausch einher.

Die zur automatisierten Datengewinnung zusätzlich integrierten Informations- bzw. Kommunikationskanäle (z.B.: Apps, Blogs, externe Webseiten, Social Media) führen dazu, dass weitere Repositories (sog. Sammelcontainer für Daten) für die Daten erstellt, integriert, bewirtschaftet und genützt werden müssen. Dabei unterscheiden sich jedoch die enthaltenen Datenformate und auch die verwendete Datenstruktur. Darüber hinaus steigt das Datenvolumen was in weiterer Konsequenz auch die Auswertegeschwindigkeit beeinflusst. Diese Eigenschaften von Big Data sind charakteristisch.

Fundamentale Eigenschaften von Big Data

Big Data umfasst quasi die Verarbeitung, die Speicherung bzw. die Übertragung von großen Datenmengen (auch sog. „Massendaten“) wobei diese Daten spezifische Eigenschaften haben um Schwächen konventioneller Anwendungen zu bewältigen:

Die Barrieren zur Nutzung von Daten, die aufgrund ihrer (1) Datenmenge (große Mengen im Bereich von TB, ZB), der (2) Datenvielfalt (strukturiert, semi-strukturiert, unstrukturiert – z.B.: Medien wie: Text, Grafik, Bilder, Audio und Video), der Anforderungen an die (3) Widerspruchsfreiheit (etwa: trotz Ungenauigkeiten oder Unvollständigkeiten), dem zugrundeliegenden (4) Wert (Informationsgehalt bzw. Zusatznutzen) und der darüber hinaus mit den zuvor genannten Eigenschaften einhergehenden Forderungen nach hohen (5) Verarbeitungsgeschwindigkeiten (quasi in Echtzeit), die Möglichkeiten konventioneller Hardware übersteigen, sind mit Technologien aus dem Big-Data-Bereich in wert-stiftende Anwendungen überführbar.

Die 5 zuvor genannten Eigenschaften stellen wesentliche Merkmale von Big Data dar.

Fazit

Big Data erlaubt durch die Verknüpfung einer Vielzahl von unterschiedlichen Datenquellen neue Chancen wahrzunehmen und bietet großartige Möglichkeiten, um nie dagewesene Erkenntnisse abzuleiten. Allerdings ist damit leider auch oft ein nicht erwünschter Eingriff in Ihre Persönlichkeitsrechte verbunden. Darüber hinaus bleiben häufig auch Fragen zum Datenschutz wegen der vielseitigen Anwendbarkeit von Big Data leider unbeantwortet.

Letzte Aktualisierung: 1. August 2019

Für den Inhalt verantwortlich: A-SIT Zentrum für sichere Informationstechnologie – Austria