Swen Deobald
11. Oktober 2019

Optimierte Datenbewegung mit Smart Data Integration

Optimierte Datenbewegung mit Smart Data Integration

HANA Smart Data Integration (SDI) deckt als Bestandteil der SAP HANA-Plattform viele Datenreplikationsszenarien für SAP HANA ab, für die sonst separate Tools nötig sind. SDI ist insbesondere die einzige Lösung, die Batch-ETL (Extract-Transform-Load), Echtzeitreplikation und Virtualisierung in einer Technologie kombiniert. Man braucht keine separate Komponente mehr, wenn das Hauptziel von Datenintegration eine HANA-Datenbank ist.

Funktionalität

Data Federation mit SAP HANA Smart Data Integration

Bei Data Federation mit SDI werden externe Datensysteme virtuell so in die HANA-Datenbank integriert, als wären sie ein Teil dieser. Die Schemata der externen Quellen werden zu einem globalen HANA-Schema zusammengeführt. Alle Daten können dann so angesprochen werden, als wären sie in der HANA-Datenbank gespeichert.

Bei Data Federation können z.B. Daten von News-Seiten, Social Media und allgemein Web 2.0-Seiten in einer HANA-Datenbank gesammelt werden. Anwendungsbereiche sind die Analyse von Märkten oder des eigenen Unternehmens-Images. Im Rahmen von Master Data Management (MDM) können Daten aus sozialen Netzwerken von Lieferanten, Partnern und Kunden mit eigenen Informationen zusammengeführt werden.

Smart Data Integration

Data Federation bietet sich an, wenn das Datenvolumen gering und die Häufigkeit des Datenbankzugriffs nicht sehr hoch ist.

Data Replication mit SAP HANA Smart Data Integration

Mit der Data Replication-Funktionalität können Daten von Datenbanken wie Microsoft SQL Server, IBM DB2 oder Oracle in einer HANA-Datenbank repliziert werden. Während bei Data Federation keine Daten kopiert werden, werden sie bei Data Replication in der HANA-Datenbank gespeichert. Sie können so im Hauptspeicher vorgehalten werden, was eine optimierte Zugriffszeit (Echtzeit) bedeutet.

Data Transformation mit SAP HANA Smart Data Integration

Daten aus externen Quellen können mit SDI transformiert werden, bevor sie in der HANA-Datenbank als virtuelle Daten referenziert (bei Data Federation) oder tatsächlich gespeichert werden (bei Data Replication). Gleiches gilt für Daten, die bereits in HANA verfügbar sind und einer weiteren Transformation bedürfen.

Die Transformationen können SQL-Operationen wie Where, Join oder Aggregatfunktionen sein, ferner Pivots (Vertauschen von Spalten in Zeilen) oder eine bedingte Logik (CASE-Transformation).

Funktionskomponenten

Data Provisioning (DP) Agent

Der DP-Agent ist ein leichtgewichtiger Prozess, der die sog. Adapter mit den Kommunikationsprotokollen für die externen Quellsysteme bereitstellt. Der Agent ruft die Daten von der Quelle ab und komprimiert und verschlüsselt sie dann über HTTPS, bevor er sie an die HANA-Datenbank sendet. Zur Vereinfachung der Verwaltung und zur Vermeidung von Leistungsproblemenbefindet sich der DP-Agent meist auf einem eigenen Linux- oder Windows-System.

Unser E-Book zum Thema SAP Analytics

E-Book: SAP Analytics | Effizienz im Unternehmen steigern

Wieso sollten Unternehmen sich um die Analyse Ihrer Daten kümmern, welche Anwendungsbereiche gibt es und welche Tools eignen sich dafür? Finden Sie es heraus.

Data Provisioning (DP) Server

Der DP-Server ist ein Datenbereitstellungsserver, der auf der HANA-Plattform läuft. Er verwaltet die Kommunikation zwischen dem DP-Agent und der HANA-Datenbank.

Vergleich mit anderen ETL-Tools

Spezialwerkzeuge für Data Provisioning-Technologien behalten ihre Daseinsberechtigung für bestimmte Szenarien, z.B. SAP HANA System Replication für das Sicherstellen der Hochverfügbarkeit einer SAP HANA-Instanz.

SAP Landscape Transformation bleibt die erste Wahl für beispielsweise die Echtzeitreplikation von ABAP-Applikationsservernoder von SAP ERP als Sidecar-Lösung (Übergangslösung für den Wechsel von On-Premise zu Software-as-a-Service in der Cloud).

SAP Data Services ist weiterhin eines der besten ETL-Tools als Einzelunternehmenslösung für Datenintegration, -transformation und -qualität. Dieses kann in Betracht gezogen werden, wenn kein SAP HANA vorhanden ist oder dieses nur eines von vielen Datenzielen ist.

SAP Replication Server ist als Echtzeit-Datenintegrationslösung besser für unternehmenskritische Datenreplikationsszenarienmit Ausfallzeiten nahe Null geeignet. Es ist insbesondere auch dann besser geeignet als HANA SDI, wenn keine HANA-Ziele vorhanden sind und bidirektionale Datenbewegung in Echtzeit erforderlich ist.

Fazit

HANA Smart Data Integration ist eine Alternative zu den gängigen ETL-Tools, wenn als Ziel-Datenbank ausschließlich HANA verwendet wird. Mit dem Smart Data Integration-Ansatz ETL (Extract-Transform-Load) finden sämtliche Datenverarbeitungen in-Memory innerhalb der HANA-Datenbank statt. Die Installation erfolgt relativ einfach innerhalb der HANA-Datenbank.

Swen Deobald

Swen Deobald

Mein Name ist Swen Deobald und ich bin begeisterter SAP Analytics Berater. Wir unterstützen Sie bei allen Fragen rund um SAP Analytics, Business Warehouse, BusinessObjects und der SAP Analytics Cloud.

Sie haben Fragen? Kontaktieren Sie mich!



Das könnte Sie auch interessieren

Sie wollen Ihren ersten Bericht mit SAP Analytics Cloud (SAC) erstellen aber wissen nicht wie? In diesem Beitrag zeigen wir Ihnen wie es funktioniert - von der Lizenz, über die […]

weiterlesen

In diesem Beitrag möchte ich auf die Fragestellung eingehen, in wie weit die SAP Analytics Cloud ein SAP BW überflüssig macht und in wie weit sie als Frontend lediglich das […]

weiterlesen

Nutzen Sie Google Analytics Daten um Ihre Reports in der SAP Analytics Cloud mit zusätzlichen Informationen zu füttern. Eine direkte Anbindung ist dabei nicht vorgesehen - hier erfahren Sie wie […]

weiterlesen

Schreiben Sie einen Kommentar

Bitte füllen Sie alle mit * gekennzeichneten Felder aus. Ihre E-Mail Adresse wird nicht veröffentlicht.





Kontaktieren Sie uns!
Marie Frösener Kundenservice