Optimierte Datenbewegung mit Smart Data Integration
HANA Smart Data Integration (SDI) deckt als Bestandteil der SAP HANA-Plattform viele Datenreplikationsszenarien für SAP HANA ab, für die sonst separate Tools nötig sind. SDI ist insbesondere die einzige Lösung, die Batch-ETL (Extract-Transform-Load), Echtzeitreplikation und Virtualisierung in einer Technologie kombiniert. Man braucht keine separate Komponente mehr, wenn das Hauptziel von Datenintegration eine HANA-Datenbank ist.
Funktionalität
Data Federation mit SAP HANA Smart Data Integration
Bei Data Federation mit SDI werden externe Datensysteme virtuell so in die HANA-Datenbank integriert, als wären sie ein Teil dieser. Die Schemata der externen Quellen werden zu einem globalen HANA-Schema zusammengeführt. Alle Daten können dann so angesprochen werden, als wären sie in der HANA-Datenbank gespeichert.
Bei Data Federation können z.B. Daten von News-Seiten, Social Media und allgemein Web 2.0-Seiten in einer HANA-Datenbank gesammelt werden. Anwendungsbereiche sind die Analyse von Märkten oder des eigenen Unternehmens-Images. Im Rahmen von Master Data Management (MDM) können Daten aus sozialen Netzwerken von Lieferanten, Partnern und Kunden mit eigenen Informationen zusammengeführt werden.
Data Federation bietet sich an, wenn das Datenvolumen gering und die Häufigkeit des Datenbankzugriffs nicht sehr hoch ist.
Data Replication mit SAP HANA Smart Data Integration
Mit der Data Replication-Funktionalität können Daten von Datenbanken wie Microsoft SQL Server, IBM DB2 oder Oracle in einer HANA-Datenbank repliziert werden. Während bei Data Federation keine Daten kopiert werden, werden sie bei Data Replication in der HANA-Datenbank gespeichert. Sie können so im Hauptspeicher vorgehalten werden, was eine optimierte Zugriffszeit (Echtzeit) bedeutet.
Data Transformation mit SAP HANA Smart Data Integration
Daten aus externen Quellen können mit SDI transformiert werden, bevor sie in der HANA-Datenbank als virtuelle Daten referenziert (bei Data Federation) oder tatsächlich gespeichert werden (bei Data Replication). Gleiches gilt für Daten, die bereits in HANA verfügbar sind und einer weiteren Transformation bedürfen.
Die Transformationen können SQL-Operationen wie Where, Join oder Aggregatfunktionen sein, ferner Pivots (Vertauschen von Spalten in Zeilen) oder eine bedingte Logik (CASE-Transformation).
Funktionskomponenten
Data Provisioning (DP) Agent
Der DP-Agent ist ein leichtgewichtiger Prozess, der die sog. Adapter mit den Kommunikationsprotokollen für die externen Quellsysteme bereitstellt. Der Agent ruft die Daten von der Quelle ab und komprimiert und verschlüsselt sie dann über HTTPS, bevor er sie an die HANA-Datenbank sendet. Zur Vereinfachung der Verwaltung und zur Vermeidung von Leistungsproblemenbefindet sich der DP-Agent meist auf einem eigenen Linux- oder Windows-System.
Data Provisioning (DP) Server
Der DP-Server ist ein Datenbereitstellungsserver, der auf der HANA-Plattform läuft. Er verwaltet die Kommunikation zwischen dem DP-Agent und der HANA-Datenbank.
Vergleich mit anderen ETL-Tools
Spezialwerkzeuge für Data Provisioning-Technologien behalten ihre Daseinsberechtigung für bestimmte Szenarien, z.B. SAP HANA System Replication für das Sicherstellen der Hochverfügbarkeit einer SAP HANA-Instanz.
SAP Landscape Transformation bleibt die erste Wahl für beispielsweise die Echtzeitreplikation von ABAP-Applikationsservernoder von SAP ERP als Sidecar-Lösung (Übergangslösung für den Wechsel von On-Premise zu Software-as-a-Service in der Cloud).
SAP Data Services ist weiterhin eines der besten ETL-Tools als Einzelunternehmenslösung für Datenintegration, -transformation und -qualität. Dieses kann in Betracht gezogen werden, wenn kein SAP HANA vorhanden ist oder dieses nur eines von vielen Datenzielen ist.
SAP Replication Server ist als Echtzeit-Datenintegrationslösung besser für unternehmenskritische Datenreplikationsszenarienmit Ausfallzeiten nahe Null geeignet. Es ist insbesondere auch dann besser geeignet als HANA SDI, wenn keine HANA-Ziele vorhanden sind und bidirektionale Datenbewegung in Echtzeit erforderlich ist.
Fazit
HANA Smart Data Integration ist eine Alternative zu den gängigen ETL-Tools, wenn als Ziel-Datenbank ausschließlich HANA verwendet wird. Mit dem Smart Data Integration-Ansatz ETL (Extract-Transform-Load) finden sämtliche Datenverarbeitungen in-Memory innerhalb der HANA-Datenbank statt. Die Installation erfolgt relativ einfach innerhalb der HANA-Datenbank.