Knowhow »

SAP Data Hub
SAP Data Hub ist eine Komplettlösung zur Daten-Orchestrierung in Unternehmen. Sie dient der intelligenten Interpretation und Aufbereitung der verschiedensten Daten, die in einem Unternehmen anfallen. SAP Data Hub durchdringt die komplexe Datenlandschaft eines Unternehmens, stellt sie übersichtlich dar und extrahiert daraus geschäftsrelevante Informationen zur Weiterverarbeitung.
Dazu werden die unterschiedlichen Datenquellen auf der SAP Data Hub-Plattform integriert. SAP Data Hub führt beispielsweise Daten von Nachrichtensystemen, hochvolumigen Cloud-Speicherdiensten und verschiedenen Datenverwaltungs- und Unternehmensanwendungen zusammen.
Inhaltsverzeichnis
Einsatzzweck
Unternehmensdatenlandschaften werden heute immer vielfältiger und verteilter. Das Datenvolumen nimmt insbesondere durch unstrukturierte Daten exponentiell zu, die z.B. aus Grafiken und Sprachaufzeichnungen stammen, aus dem Internet of Things oder aus sozialen Netzwerken. Die Daten sind dabei an verschiedenen Orten verteilt gespeichert – lokal, in Clouds und auf mobilen Endgeräten. Beim Zugriff und bei der Verarbeitung sind zudem Unternehmens- und gesetzliche Datenrichtlinien zu gewährleisten.
Transparenz
SAP Data Hub schafft hier Transparenz, macht zuvor unstrukturierte Daten strukturiert zugänglich und extrahiert daraus geschäftsdienliche Informationen. Dadurch ergibt sich eine konsolidierte Sicht auf alle Datenquellen der Datenlandschaft eines Unternehmens – unabhängig davon, ob sich die Daten in der Cloud oder “on premise” vor Ort befinden, in Big Data-Systemen oder Unternehmensanwendungen von SAP oder anderen Herstellern. Mitarbeiter haben über Self-Service–Schnittstellen Zugriff und können z.B. Anomalien feststellen und Entwicklungen vorhersagen.
SAP Data Hub sorgt ferner dafür, dass gegebene Compliance-Richtlinien für die verschiedenen Datenquellen automatisch gewahrt bleiben.
Funktionsweise
Data Warehousing Integration
SAP Data Hub erweitert das traditionelle monolithische Data Warehousing, indem es die Orchestrierung beliebiger darüber hinausreichender Ressourcen ermöglicht. Strukturierte und unstrukturierte Daten können kombiniert und durch sog. Datenpipelines verarbeitet werden. Neue Datenquellen können leicht in die Datenlandschaft des Unternehmens integriert werden. SAP Data Hub ist seinerseits eng in Unternehmensanwendungen wie SAP S/4HANA und SAP S/4BW integrierbar. Die Bereitstellung von SAP Data Hub kann on-premise, in einer privaten Cloud oder als extern verwalteter Cloud-Service erfolgen.
Daten-Orchestrierung
Interpretationsregeln sorgen für die automatische Verarbeitung von strukturierten und bislang unstrukturierten Daten. Diese Regeln werden Metadaten genannt. SAP Data Hub verfügt über derartige Metadaten für eine Vielzahl von Datentypen und -quellen. Diese Interpretationsvorschriften können mit SAP Data Hub umfassend verwaltet und angepasst werden. SAP Data Hub bereitet die vielfältigen Daten, die im Unternehmen zusammenkommen, für einen stets aktuellen Überblick auf.
Intelligent interpretierte Daten werden durch Datenpipelines effizient bereitgestellt. SAP Data Hub reichert Rohdaten effektiv mit Kontext an und liefert die interpretierten Daten an Anwendungen oder Mitarbeiter zur Weiterverarbeitung. Der Datenpipeline-Flow wird einfach über eine grafische Nutzeroberfläche modelliert. Daten können durchgängig – von ihrer Erzeugung bis zum Ende der Verarbeitung – orchestriert, d.h. zueinander in Bezug gesetzt und bearbeitet werden, und das in beliebig skalierbarem Umfang. Dies ermöglicht eine erheblich schnellere Bereitstellung vorverarbeiteter Daten, als dies manuell möglich wäre. Durch diese Optimierung von Geschäftsprozessen können Unternehmen schneller auf neue Informationen und Ereignisse reagieren.
Data Science
Daten aus beliebigen Quellen können durch SAP Data Hub mittels moderner Data Science-Methoden aufbereitet werden und die gewonnenen Informationen (z.B. vorausschauende Analysen) in die Geschäftsprozesse einfließen. Der Informationsgehalt von Big Data-Quellen inner- und außerhalb des Unternehmens wird identifiziert und nutzbar gemacht. SAP Data Hub bietet dazu ein einheitliches Tool für die Nutzung verschiedener Machine Learning-Modelle und Analysealgorithmen. Diese können mit externen Modellen kombiniert werden, z.B. mit der Predictive Analysis Library der SAP HANA-Geschäftsdatenplattform, mit SAP Leonardo Machine Learning-Funktionen oder Big Data-Frameworks und -Plattformen wie TensorFlow und Spark.
Die Data Discovery-Funktionen von SAP Data Hub ermöglichen die intelligente Ermittlung von Datenbeziehungen; Datenkorrelationen zwischen Datenquellen im Unternehmen werden grafisch dargestellt. Der Fluss von Daten in Systemen und durch verbundene Systeme wird sichtbar, einschließlich der Berührungspunkte zu anderen Prozessen. SAP Data Hub korreliert dabei beispielsweise strukturierte Daten mit unstrukturierten Sprach- und Textinformationen. Daten werden im Sinne der Datenqualität bereinigt und für Analyse und Weiterverarbeitung vorbereitet.
Operatoren und Datenpipelines
Die Datenverarbeitung mit SAP Data Hub ermöglicht effiziente Datenanreicherung durch verteilte Datenpipelines. Ein sog. Operator ist das Grundelement einer Datenpipeline. Daten am Eingabeport des Operators werden transformiert und an seinem Ausgabeport ausgegeben. Eine Operation kann auch eine Verbindung zum Lesen aus einer Quelle bzw. zum Schreiben in eine Quelle sein. Datenflüsse von einer Quelle in eine andere werden ebenfalls über einen Operator gesteuert.
Ein Gruppe verbundener Operatoren wird als Pipeline bezeichnet. Eine Datenpipeline ist ein Netzwerk von Operatoren, die über typisierte Eingabe- und Ausgabeports für die Datenübertragung und Datenverarbeitung miteinander verbunden sind. Die Funktion jedes Operators können über Parameter konfiguriert werden. Operatoren und Pipelines können für verschiedene Anwendungen wiederverwendet werden.
Mit dem Operatoren- und Pipelinekonzept von SAP Data Hub lassen sich Flow-basierte Anwendungen erstellen, die aus wiederverwendbaren Komponenten bestehen. Mit einem Tool namens Modeler können flussbasierte Datenpipelines erstellt werden. Daten können so mit einer Vielzahl von Berechnungstechniken und maschinellem Lernen verfeinert werden. Systeme von Drittanbietern können zur Analysen und Anreicherungen der Daten integriert werden.
Features
SAP Data Hub ermöglicht automatische intelligente Erkennung von Datenbeziehungen; Datenkorrelationen und -herkünfte werden grafisch angezeigt. Neu eingebundene Datenquellen werden mittels Metadatenerkennung durchsucht, um künftig automatisch interpretiert werden zu können. Internet of Things-Ereignisströme werden beispielsweise in unternehmensfähige Daten gewandelt. Die Daten werden dabei auf den Speichermedien verarbeitet, auf denen sie sich befinden, um unnötige Datenverschiebungen zu vermeiden.
Workflows
Workflows, d.h. Verknüpfungen von Daten aus beliebigen Quellen in der verbundenen Datenlandschaft, können mit einem sog. Modeler grafisch intuitiv modelliert werden. Ihre Ausführung kann geplant, überwacht und analysiert werden. Für komplexe Analysen und Anreicherung von Daten können Drittanbieter-Dienste, z.B. standortbezogene Systeme hinzugezogen werden.
Metadaten-Assets
SAP Data Hub verwaltet die Metadaten-Assets des Unternehmens. Metadaten dienen der Interpretation von Daten, die damit automatisch intelligent analysiert und verarbeitet werden können. Anpassbare Validierungsregeln sichern die Datenqualität. Mängel in der Dateninterpretation können leicht nachvollzogen und behoben werden. Die traditionelle Datenverwaltung wird dadurch erweitert um semantische Analysen, automatisierte Zuordnungen und Bewertungsvorschläge, um schneller zu neuen Erkenntnissen zu kommen.
Berechtigungsmanagement
SAP Data Hub erlaubt die Rechteverwaltung für Nutzer innerhalb der gesamten Datenlandschaft und sichert damit Datenintegrität und -sicherheit durch einen konsistenten ordnungsgemäßen Umgang mit den Daten. SAP Data Hub optimiert damit die Compliance und Daten-Governance der Unternehmens-IT. Sicherheitsrichtlinien für alle Datenquellen können an einem Ort verwaltet werden.
Vorteile
SAP Data Hub optimiert durch zentralisierte Datenintegration, -orchestrierung und -governance die Wertschöpfung in einer heterogenen, fragmentierten Datenlandschaft. Der Datenfluss zwischen verschiedensten Datensystemen lässt sich dadurch leichter verwalten und Nutzern und Anwendungen zur Weiterverarbeitung zur Verfügung stellen.
Detaillierte Übersicht
SAP Data Hub bietet eine leicht verständliche und beliebig detaillierte Sicht auf die gesamte Datenlandschaft. Unternehmen können dadurch die Qualität und Zusammenhänge der Daten besser verstehen. Daraus lassen sich neue Geschäftschancen identifizieren und Risiken früher erkennen.
SAP Data Hub
Mit SAP Data Hub kann die Lücke zwischen strukturierten Unternehmensdaten und unstrukturiertem Big Data geschlossen werden. Auf der Basis der Datenaufbereitung durch SAP Data Hub können Anwendungen entwickelt werden, die das Potenzial der Daten aus verschiedensten Quellen ausschöpfen: aus SAP- und SAP-fremden Systemen, aus der Cloud oder von lokalen Systemen.
Compliance und Daten-Governance
SAP Data Hub sorgt für Compliance und Daten-Governance im gesamten Unternehmen: Sicherheitsrichtlinien (inkl. Zugangskontrolle zu Daten) werden an einem Ort verwaltet, um gesetzliche und unternehmensweite Anforderungen jederzeit zu erfüllen.
SAP Data Hub kommt dem Bedarf nach, der einer SAP-Studie nach besteht, wonach 74 % der IT-Entscheidungsträger die Datenlandschaft ihres Unternehmens für so komplex halten, dass die Flexibilität beeinträchtigt sei; 86 % der Entscheidungsträger sehen Potenzial, eine wesentlich höhere Wertgewinnung aus den Daten erreichen zu können, wenn sie besseren Zugriff darauf hätten.