Smart Data Integration

Die Möglichkeit für den Datentransfer zu einer HANA Datenbank

Smart Data Integration (SDI) ist ein Java-basiertes Softwaretool von SAP, das einen Datenaustausch von beliebigen Quellen (viele sind standardmäßig dabei, man kann aber auch Eigenentwicklungen nutzen) zu einer SAP HANA Datenbank (N zu 1 Konfiguration) ermöglicht. Der Datenaustausch ist dabei von On-Premises-Systemen zu On-Premises oder Cloud-HANA-Systemen möglich. Die Verwendung bei Cloud zu Cloud ist hingegen nur bei Cloud-Systemen als IAAS (Infrastructure as a Service) realisierbar.

Smart Data Integration – Anwendungszwecke:

Reporting:

Das Auslesen beliebiger Datenquellen wie Datenbanken (HANA, Oracle, MSSQL, etc.), Files (Excel, CSV-Dateien) und das zentrale Ablegen dieser Daten in einem Auswertungssystem des Typs SAP HANA. Die Auswertung kann hierbei über Tools wie z.B. die SAP Analytics Cloud, Microsoft PowerBI oder SAP BW (BW/4HANA) erfolgen.

Korrelation von Daten:

Der Abgleich von beispielsweise zugekauften Marketingdaten mit den eigenen ERP-Daten, um weitere Marketing- oder Produktionsplanungen daraus abzuleiten.

Zentralisierung von Daten:

Je höher das Datenvolumen in einer Firma wird, desto wichtiger ist es, diese Daten nur an einer Stelle zentral zu halten. Dies kann z.B. bei Finanzdaten und steuerrechtlich relevanten Daten wichtig werden, um beispielsweise die Auswertung für den Wirtschaftsprüfer zu erleichtern.

 

Allgemein ist festzuhalten, dass die Halbwertszeit von Daten zu berücksichtigen sind, da als Ziel nur eine (evtl. sehr teure) HANA-Datenbank konfigurierbar ist. Dafür sollte eine Strategie zur Löschung der Daten oder das Verschieben auf günstigeren Speicherplatz definiert werden.

Installations- und Konfigurationsmöglichkeiten:

SDI kann sowohl als JAVA-Anwendung unter den Betriebssystemen (OS) Linux wie auch unter Windows installiert werden. Die Grundauswahl des OS wird sicherlich als erstes durch die Firmenvorgaben bestimmt. Sollte ein Freiraum bestehen, so ist Linux als OS vorzuziehen, da der Installer für Linux flexibler ist (z.B. bzgl. der TCP-Ports, die zu verwenden sind, was eine Mehrfachinstallation auf einem OS ohne Komplikationen ermöglicht).

Da jede JAVA-Anwendung also auch SDI gerade im Bereich Memory ressoucenintensiv ist, sind hierfür meistens die Memory-Parameter von der JAVA-Applikation anzupassen. Wenn die zu übertragende Datenmenge zu groß ist, erscheint häufig die „Out of Memory“-Fehlermeldung.

Bei jeder Installation kann es zudem zu Inkompatibilitäten mit der auf dem OS installierten JAVA-Version kommen. Auch dieser Aspekt ist bei Updates zu berücksichtigen.

Abgrenzung zu Smart Data Access (SDA):

SDI ist die Erweiterung von SDA und durch eine Entkopplung der Replikation von der HANA Datenbank als eigenständige Applikation realisiert. Während SDI ein eigenes Memory hat, so belastet SDA außerdem bei der Replikation die HANA Datenbank direkt. Bei SDA werden gerade einzelne Adapter abgekündigt (z.B. der MII Adapter – die Verbindung zu einem MES Produktionssystem).

Beiden ist gemein, dass ihre Verbindungsmöglichkeiten in der HANA Datenbank auf Remote-Sourcen und Workflow-Konfigurationen basieren, z.B. in der WEB-IDE der HANA Datenbank.

Fazit:

Sollte eine neue Datenverbindung zu einer SAP HANA Datenbank eingerichtet werden müssen, so ist für die Zukunftssicherheit und die höhere Flexibilität auf die SDI zu setzen.