SAP Data Hub
Was ist SAP Data Hub?
Der SAP Data Hub dient als Brücke, die eine Vielzahl von Daten aus diversen Ursprungspunkten geschickt miteinander verknüpft. Sie wirkt wie ein effizienter Datenkanal, der Flüsse aus ERP-Systemen, großen Datenspeichern und sogar Data Warehouses nahtlos miteinander verbindet. Innerhalb dieses Systems werden alle Daten, unabhängig von ihrer Herkunft, auf einer einheitlichen Ebene behandelt. Diese Plattform ist nicht nur für die Integration und Verwaltung dieser Daten zuständig, sondern leitet sie auch zu weiterführenden Anwendungen, beispielsweise Analyse-Tools, weiter. Eine besondere Rolle spielt dabei die Fähigkeit zur Handhabung von Metadaten. In unserer digitalisierten Welt, besonders im Zeitalter der Industrie 4.0, wird die nahtlose und intelligente Datenverarbeitung immer relevanter.
Inhaltsverzeichnis
Einsatzzwecke von SAP Data Hub
Unternehmensdatenlandschaften werden heute immer vielfältiger und verteilter. Das Datenvolumen nimmt insbesondere durch unstrukturierte Daten exponentiell zu, die z.B. aus Grafiken und Sprachaufzeichnungen stammen, aus dem Internet of Things oder aus sozialen Netzwerken. Die Daten sind dabei an verschiedenen Orten gespeichert – lokal, in Clouds und auf mobilen Endgeräten. Beim Zugriff und bei der Verarbeitung sind zudem Unternehmens- und gesetzliche Datenrichtlinien zu gewährleisten.
Transparenz
SAP Data Hub schafft Transparenz, macht zuvor unstrukturierte Daten strukturiert zugänglich und extrahiert daraus geschäftsdienliche Informationen. Dadurch ergibt sich eine gute Sicht auf alle Datenquellen der Datenlandschaft eines Unternehmens unabhängig davon, ob sich die Daten in der Cloud oder “on premise” vor Ort befinden, in Big Data Systemen oder Unternehmensanwendungen von SAP oder anderen Herstellern. Mitarbeiter haben über Self-Service–Schnittstellen Zugriff und können z.B. Anomalien feststellen und Entwicklungen vorhersagen. SAP Data Hub sorgt ferner dafür, dass gegebene Compliance-Richtlinien für die verschiedenen Datenquellen automatisch gewahrt bleiben.
Funktionsweise von SAP Data Hub
Data Warehousing Integration
SAP Data Hub erweitert das traditionelle Date Warehousing, indem es die Anreicherung beliebiger darüber hinausreichender Ressourcen ermöglicht. Strukturierte und unstrukturierte Daten können kombiniert und durch sog. Datenpipelines verarbeitet werden. Neue Datenquellen können leicht in die Datenlandschaft des Unternehmens integriert werden. SAP Data Hub ist seinerseits eng in Unternehmensanwendungen wie SAP S/4HANA und SAP S/4BW integrierbar. Die Bereitstellung von SAP Data Hub kann on-premise, in einer privaten Cloud oder als extern verwalteter Cloud-Service erfolgen.
Daten-Orchestrierung
Interpretationsregeln sorgen für die automatische Verarbeitung von strukturierten und bislang unstrukturierten Daten. Diese Regeln werden Metadaten genannt. SAP Data Hub verfügt über derartige Metadaten für eine Vielzahl von Datentypen und Datenquellen. Diese Interpretationsvorschriften können mit SAP Data Hub umfassend verwaltet und angepasst werden. SAP Data Hub bereitet die vielfältigen Daten, die im Unternehmen zusammenkommen, für einen stets aktuellen Überblick auf.
Intelligent interpretierte Daten werden durch Datenpipelines effizient bereitgestellt. SAP Data Hub reichert Rohdaten effektiv mit Kontext an und liefert die interpretierten Daten an Anwendungen oder Mitarbeiter zur Weiterverarbeitung. Der Datenpipeline-Flow wird einfach über eine grafische Nutzeroberfläche modelliert. Daten können von ihrer Erzeugung bis zum Ende der Verarbeitung durchgängig orchestriert, d.h. zueinander in Bezug gesetzt und bearbeitet werden. Das ist in beliebig skalierbarem Umfang möglich. Dies erlaubt eine erheblich schnellere Bereitstellung vorverarbeiteter Daten, als dies manuell möglich wäre. Unternehmen können durch die Optimierung der Geschäftsprozesse schneller auf neue Informationen und Ereignisse reagieren.
Data Science
Daten aus beliebigen Quellen können durch SAP Data Hub mittels moderner Data-Science-Methoden aufbereitet werden. Die gewonnenen Informationen, wie z.B. vorausschauende Analysen fließen in die Geschäftsprozesse ein. Der Informationsgehalt von Big Data-Quellen inner- und außerhalb des Unternehmens wird identifiziert und nutzbar gemacht. SAP Data Hub bietet dazu ein einheitliches Tool für die Nutzung verschiedener Machine Learning-Modelle und Analysealgorithmen. Diese können mit externen Modellen kombiniert werden, z.B. mit der Predictive Analysis Library der SAP HANA-Geschäftsdatenplattform, mit SAP Leonardo Machine Learning Funktionen oder Big Data Frameworks und Plattformen wie TensorFlow und Spark.
Die Data Discovery-Funktionen von SAP Data Hub ermöglichen die intelligente Ermittlung von Datenbeziehungen. Datenkorrelationen zwischen Datenquellen im Unternehmen werden grafisch dargestellt. Der Fluss von Daten in Systemen und durch verbundene Systeme wird einschließlich der Berührungspunkte zu anderen Prozessen sichtbar. SAP Data Hub korreliert dabei beispielsweise strukturierte Daten mit unstrukturierten Sprach- und Textinformationen. Daten werden im Sinne der Datenqualität bereinigt und für die Analyse und Weiterverarbeitung vorbereitet.
Operatoren und Datenpipelines
Die Datenverarbeitung mit SAP Data Hub ermöglicht effiziente Datenanreicherung durch verteilte Datenpipelines. Ein sog. Operator ist das Grundelement einer Datenpipeline. Daten am Eingabeport des Operators werden transformiert und an seinem Ausgabeport ausgegeben. Eine Operation kann auch eine Verbindung zum Lesen aus einer Quelle bzw. zum Schreiben in eine Quelle sein. Datenflüsse von einer Quelle in eine andere werden ebenfalls über einen Operator gesteuert.
Eine Gruppe verbundener Operatoren wird als Pipeline bezeichnet. Eine Datenpipeline ist ein Netzwerk von Operatoren, die über typisierte Eingabe- und Ausgabeports für die Datenübertragung und Datenverarbeitung miteinander verbunden sind. Die Funktionen jedes Operators können über Parameter konfiguriert werden. Operatoren und Pipelines können für verschiedene Anwendungen wiederverwendet werden.
Mit dem Operatoren- und Pipelinekonzept von SAP Data Hub lassen sich Flow-basierte Anwendungen erstellen, die aus wiederverwendbaren Komponenten bestehen. Mit einem Tool namens Modeler können flussbasierte Datenpipelines erstellt werden. Daten können so mit einer Vielzahl von Berechnungstechniken und maschinellem Lernen verfeinert werden. Systeme von Drittanbietern sind für Analysen und Anreicherungen der Daten integrierbar.
SAP Data Hub Features
SAP Data Hub ermöglicht automatische intelligente Erkennung von Datenbeziehungen. Datenkorrelationen und -herkünfte werden grafisch angezeigt. Neu eingebundene Datenquellen werden mittels Metadatenerkennung durchsucht, um künftig automatisch interpretiert werden zu können. IoT-Ereignisströme werden beispielsweise in unternehmensfähige Daten gewandelt. Die Daten werden dabei auf den Speichermedien verarbeitet, auf denen sie sich befinden, um unnötige Datenverschiebungen zu vermeiden.
Workflows
Workflows, d.h. Verknüpfungen von Daten aus beliebigen Quellen in der verbundenen Datenlandschaft, können mit einem sog. Modeler grafisch intuitiv modelliert werden. Ihre Ausführung wird hier geplant, überwacht und analysiert. Für komplexe Analysen und Anreicherung von Daten können Drittanbieter-Dienste, z.B. standortbezogene Systeme hinzugezogen werden.
Metadaten-Assets
SAP Data Hub verwaltet die Metadaten-Assets des Unternehmens. Metadaten dienen der Interpretation von Daten, die damit automatisch intelligent analysiert und verarbeitet werden können. Anpassbare Validierungsregeln sichern die Datenqualität. Mängel in der Dateninterpretation können leicht nachvollzogen und behoben werden. Die traditionelle Datenverwaltung wird dadurch erweitert um semantische Analysen, automatisierte Zuordnungen und Bewertungsvorschläge, um schneller zu neuen Erkenntnissen zu kommen.
Berechtigungsmanagement
SAP Data Hub erlaubt die Rechteverwaltung für Nutzer innerhalb der gesamten Datenlandschaft und sichert damit Datenintegrität und Datensicherheit durch einen konsistenten ordnungsgemäßen Umgang mit den Daten ab. SAP Data Hub optimiert damit die Compliance und Daten Governance der IT. Sicherheitsrichtlinien für alle Datenquellen können an einem Ort zentral verwaltet werden.
Vorteile von SAP Data Hub
SAP Data Hub optimiert durch zentralisierte Datenintegration, Datenorchestrierung und Datengovernance die Wertschöpfung in einer heterogenen, fragmentierten Datenlandschaft. Der Datenfluss zwischen verschiedensten Datensystemen lässt sich dadurch leichter verwalten und Nutzern und Anwendungen zur Weiterverarbeitung zur Verfügung stellen.
Detaillierte Übersicht
SAP Data Hub bietet eine leicht verständliche und beliebig detaillierte Sicht auf die gesamte Datenlandschaft. Unternehmen können dadurch die Zusammenhänge der Daten besser verstehen. Daraus lassen sich neue Geschäftschancen identifizieren und Risiken früher erkennen.
Big Data
Mit SAP Data Hub kann die Lücke zwischen strukturierten Unternehmensdaten und unstrukturiertem Big Data geschlossen werden. Auf der Basis der Datenaufbereitung durch SAP Data Hub können Anwendungen entwickelt werden, die das Potenzial der Daten aus verschiedensten Quellen ausschöpfen: aus SAP- und Non-SAP-Systemen, aus der Cloud oder von lokalen Systemen.
Compliance und Daten-Governance
SAP Data Hub sorgt für Compliance und Daten Governance im gesamten Unternehmen. Sicherheitsrichtlinien (inkl. Zugangskontrolle zu Daten) werden an einem Ort verwaltet, um gesetzliche und unternehmensweite Anforderungen jederzeit zu erfüllen.
SAP Data Hub kommt dem Bedarf nach, der einer SAP Studie nach besteht, wonach 74 % der IT-Entscheidungsträger die Datenlandschaft ihres Unternehmens für so komplex halten, dass die Flexibilität beeinträchtigt sei; 86 % der Entscheidungsträger sehen Potenzial, eine wesentlich höhere Wertgewinnung aus den Daten erreichen zu können, wenn sie besseren Zugriff darauf hätten.
Fazit
SAP Data Hub unterstützt die Datenverwaltung in Unternehmen durch die Data Warehouse Integration und Daten-Orchestrierung. Mit Hilfe von IoT und Machine Learning werden dabei viele Vorteile ermöglicht, welche Unternehmen bessere Einblicke in ihre Daten bieten und ein tieferes Verständnis für diese ermöglichen. Auch Compliance-Richtlinien werden mit der SAP Data Hub berücksichtigt.
FAQs
Was ist SAP Data Hub?
SAP Data Hub integriert die unterschiedlichen Datenquellen auf der SAP Data Hub Plattform. So kommen beispielsweise Daten von Nachrichtensystemen, hochvolumigen Cloud-Speicherdiensten und verschiedenen Datenverwaltungs- und Unternehmensanwendungen zusammen.
Was sind die Vorteile von SAP Data Hub?
SAP Data Hub sorgt insgesamt für mehr Übersicht über alle Daten und erleichtert damit die Compliance sowie die Daten-Governance. Dabei spielt es keine Rolle, ob die Daten aus SAP- und Non-SAP-Systemen, aus der Cloud oder von lokalen Systemen kommen.