SAP Data Services

SAP Data Services ist das Tool der Stunde zur Analyse, Integration, Transformation und zum Qualitätsmanagement von Daten. Erfahren Sie, was sich dahinter verbirgt und wie der Einsatz in der Praxis aussieht.

Was ist SAP Data Services (SAP DS)?

Bei SAP Data Services (kurz SAP DS, früher SAP BusinessObjects Data Services) handelt es sich um eine Lösung für eine der drängendsten Herausforderungen von Unternehmen: das Transformieren großer Mengen von Daten in unternehmerisch verwertbares Wissen.

Hierfür bietet das Tool Möglichkeit Daten aus verschiedensten Quellen zusammenzuführen, zu bereinigen, anzureichern und zu analysieren. Dies gilt für strukturierte und für unstrukturierte Daten.

Der Fokus der Anwendung liegt einerseits auf der Datenintegration, andererseits auf der Datenqualität. Im Ergebnis erhalten Unternehmen eine vertrauenswürdige, belastbare und fortlaufend aktualisierte Informationsbasis für ihre Geschäftsentscheidungen.

Für wen ist SAP Data Services geeignet?

SAP Data Services richtet sich vor allem an Unternehmen, die hohe Anforderungen an Datenqualität, Datenintegration und Datentransformation haben. Insbesondere Bestandskunden von SAP zählen zur Zielgruppe, da SAP DS sehr eng mit den Business-Anwendungen und weiteren Datenwerkzeugen des Walldorfer Herstellers verzahnt ist.

In Verbindung mit dem Produkt „SAP (BusinessObjects) Information Stewart“ eignet sich die Lösung beispielsweise auch für Data-Governance-Aufgaben und bereichsübergreifendes Data Profiling.

Besonders hilfreich ist SAP Data Services, wenn Daten aus SAP- und Non-SAP-Systemen integriert betrachtet werden sollen. Zu Non-SAP zählen unter anderem relationale Datenbanken, NoSQL-Datenbanken, DBMS (Datenbank-Management-Systeme), Enterprise-Systeme von Drittanbietern, Webservices und auch Big-Data-Ressourcen (z. B. auf Hadoop-Basis). Hierbei spielt es keine Rolle, ob das Quell-System lokal oder in der Cloud betrieben wird.

Ebenso beinhaltet SAP DS die passenden Tools, wenn es um die (systemübergreifende) Überwachung und Verbesserung der Datenqualität geht. Selbst für die Verarbeitung und Analyse großer Datenmengen (Big Data Analytics) ist die Lösung geeignet, da sie höchsten Ansprüchen an Performance und Skalierbarkeit gerecht wird.

GAMBIT Whitepaper Miniaturversion Die Datenfabrik 1444x1444px

Download

Whitepaper "Die Datenfabrik"

Erfahren Sie, wie eine optimale Migrationsstrategie aussehen kann und was dafür erforderlich ist.

Jetzt herunterladen (2,2 MB) Jetzt herunterladen (2,2 MB)

Herr
Frau

Hier fehlt noch etwas

*

Hier fehlt noch etwas

*

Hier fehlt noch etwas

Bitte geben Sie eine gültige Telefonnummer ein

*

Bitte geben Sie eine gültige E-Mail-Adresse ein

Hier fehlt noch etwas

Hier fehlt noch etwas

Bitte klicken Sie die reCAPTCHA-Checkbox

Welche Funktionen hält SAP Data Services bereit?

Die Kernaufgabe von SAP Data Services ist es, Unternehmen im Umgang mit fragmentierten Daten zu unterstützen. Hierfür hält das System eine Vielzahl von Features bereit. Im Überblick stellen sich die Funktionsbereiche wie folgt dar:

  • Datenintegration und Datentransformation
  • Datenqualitätsmanagement
  • Data Profiling
  • Analyse von Textdaten
  • Change Data Capture (CDC)
  • Integration mit weiteren SAP-Produkten

Betrachten wir diese Bereiche im Folgenden genauer.

1. Datenintegration und Datentransformation

SAP DS ist ein ausgewiesenes Datenintegrations- und Datentransformations-Tool. Seine Kernaufgabe ist demnach das Verbinden, Harmonisieren und Verarbeiten von strukturierten und unstrukturierten Daten aus verschiedenen Datenquellen.

Für die Konvertierung und Bereitstellen der Daten bietet die Lösung mehrere Methoden:

  • ETL-Methode (Extract, Transform, Load)
  • ELT-Methode (Extract, Load, Transform) in Verbindung mit der SAP-HANA-Datenbanktechnologie
  • RTL-Methode (Replicate, Transform, Load)
  • SQL-Pushdown-Methode

Damit unterstützt SAP Data Services nicht nur die Batch-Verarbeitung, den traditionellen Ansatz der Datentransformation. Auch Echtzeit-Services können genutzt werden. Sie ermöglichen das Abfragen von Datendiensten mit definierten Workflows und unmittelbaren Antworten.

Die Transformation der Daten kann parallel (für mehrere Quellen gleichzeitig) erfolgen, wodurch eine besonders hohe Datendurchsatzrate erreicht wird.

2. Datenqualitätsmanagement

Ein weiteres wichtiges Einsatzgebiet von SAP DS ist die Datenqualität. Als zentrale Plattform eignet sich die Lösung dazu, die Qualität systemübergreifend transparent zu machen und zu überwachen. Hierdurch werden auch Qualitätsprobleme und Zusammenhänge sichtbar, die bislang im Verborgenen lagen.

Ebenso gibt die Software Aufschluss darüber, wie sich Qualitätsmängel auf nachgelagerte Anwendungen und Systeme auswirken. Visualisiert werden all diese Aspekte auf übersichtlichen Dashboards.

Darüber hinaus wird SAP Data Services mit vordefinierten, anpassbaren Workflows für die Analyse, Bereinigung, Standardisierung und Anreicherung von Daten ausgeliefert. Dank dieser Eigenschaften ist SAP DS sowohl für ein einmaliges Projekt der Datenbereinigung als auch für die kontinuierliche Qualitätssicherung geeignet.

3. Data Profiling

Das Data Profiling ist eine Funktion, die ebenfalls dem Datenqualitätsmanagement zuzuordnen ist. Es handelt sich hierbei um eine automatisierte Analyse, mit deren Hilfe Qualitätsprobleme aufgedeckt werden können.

Unter anderem liefert das Data Profiling Informationen zu Häufigkeitsverteilungen, ungültigen Werten, Minimal- und Maximalwerten und Mustern in vorhandenen Datensätzen. Somit ist es möglich, Muster und Auffälligkeiten in einer Datenbank zu erkennen. Insbesondere für die frühzeitige Erkennung von Schiefständen ist diese Methode hilfreich.

4. Analyse von Textdaten

Wie erwähnt, erlaubt SAP Data Services auch die Verarbeitung unstrukturierter Daten. Besonders wichtig ist diese Eigenschaft für die Analyse von Textdaten (Text-Data-Processing).

Die Methode erlaubt es, Schlüsselbegriffe, Fakten, Stimmungen, Gefühle und Trends aus über 200 verschiedenen Datei- und Textformaten zu extrahieren und somit wertvolle Einblicke zu gewinnen. Nur einige Beispiele sind Pressemeldungen, soziale Netzwerke, E-Mails und Blogs.

5. Change Data Capture (CDC)

CDC dient dazu, Datenänderungen in einer Quell-Datenbank unmittelbar zu erkennen und auf dieser Basis eine Aktualisierung des Ziel-Systems durchzuführen.

Es muss also nicht permanent der gesamte Datenbestand aktualisiert werden. Vielmehr werden lediglich neue oder geänderte Datensätze übergeben. Hieraus ergeben sich deutliche Einsparungen von Rechenressourcen.

6. Integration mit weiteren SAP-Produkten

Data Services arbeitet mit einer ganzen Reihe weiterer SAP-Produkte aus dem Bereich Enterprise Information Management (EIM) zusammen. Hierzu zählen beispielsweise:

  • SAP Information Steward: Anwendung für Data Profiling, Datenqualität und Metadaten-Verwaltung
  • SAP Master Data Management (MDM): Tool für die Pflege von SAP-Stammdaten
  • SAP Master Data Governance (MDG): System für die Konsolidierung und zentrale Steuerung von Stammdaten
  • SAP Information Lifecycle Management (ILM): Software für die Verwaltung von Datenflüssen und den zugehörigen Metadaten
  • SAP Extended Enterprise Content Management von OpenText (Extended ECM): Verbinden von unstrukturierten Inhalten und Business-Anwendungen
Weitere Informationen finden Sie auch auf dieser Seite: ETL-Prozess

Wie hängen SAP DS und der ETL-Prozess zusammen?

Zwar beherrscht Data Services als Datenintegrations- und Datentransformations-Tool mehrere Methoden der Datenumwandlung und -bereitstellung. Der bislang bedeutsamste Ansatz ist jedoch ETL.

Diese Abkürzung steht für einen mehrstufigen Prozess, der durchlaufen wird, um Daten von Quell-Systemen in ein Data Warehouse zu überführen. Im Einzelnen besteht dieser Ablauf aus folgenden Prozessschritten:

1. Exctract (Extraktion)

In diesem Prozessschritt werden die benötigten Daten in ihrer ursprünglichen Form aus den vorhandenen Datenquellen extrahiert. Im Regelfall nutzen Unternehmen an dieser Stelle eine Staging Area für die Zwischenspeicherung.

2. Transform (Transformation)

In der Transformationsphase finden definierte Regeln Verwendung, anhand derer die Ergebnisse der Extraktion in das gewünschte Ausgabeformat umgewandelt werden. Einige Beispiele sind das Umwandeln von Einheiten (z. B. Währung), das Filtern von Datensätzen und die Zusammenführung ähnlicher Daten.

3. Load (Laden)

In diesem finalen Schritt werden die Daten im Zielsystem bereitgestellt. Im Regelfall ist dies eine Data-Warehousing-Datenbank, auf deren Basis dann Analytics-Anwendungen arbeiten.

Handelt es sich um Projekte wie Migrationen oder Datenbereinigungen, können die Daten jedoch auch in neue Anwendungen oder wieder in das Quell-System geladen werden. Ein weiteres gängiges ETL-Szenario ist das Laden von Daten aus Drittanwendungen oder sonstigen externen Quellen in SAP HANA oder SAP BW.

Hinweis: Wird als Zieldatenbank ausschließlich HANA verwendet, so ist das Tool HANA Smart Data Integration eine geeignete Alternative.

Aus welchen Komponenten besteht SAP Data Services?

Aus technischer Sicht besteht SAP Data Services aus mehreren Komponenten:

  • Designer
  • Repository
  • Jobserver
  • Data Service Engine
  • Access Server (Zugriffsserver)
  • Management Console

Der Designer ist ein Tool für Entwickler. Er erlaubt das Erstellen, Testen und Ausführen von Anwendungen (Jobs) zur Befüllung eines Data Warehouse (Zielsystem). Inhaltlich bestehen diese Anwendungen aus Workflows und Datenflüssen (Datentransformationsdefinitionen). Anwender werden bei der Entwicklung von Jobs durch eine intuitive grafische Oberfläche mit Quell-Ziel-Flussdiagramm unterstützt.

Beim Repository handelt es sich um eine Datenbank, in der erstellte Systemobjekte, Quell- und Zielmetadaten sowie Transformationsregeln gespeichert werden.

Auf dem Jobserver läuft die sogenannte Data Service Engine. Sie führt die Aufträge aus, die in den Anwendungen (Jobs) definiert wurden.

Der Access Server überträgt sämtliche Nachrichten zwischen den beteiligten Komponenten (Webanwendungen, Datendiensten, Jobserver und Engines).

Die browserbasierte Management Console ermöglicht es dem Administrator, sämtliche Ressourcen zu verwalten. Dies beinhaltet die Verarbeitung, Ausführung und Überwachung von Batch-Jobs ebenso wie die Konfiguration und Ausführung von Echtzeit-Datendiensten, die Benutzerverwaltung und diverse Konfigurationen.

Wie sieht die Architektur von SAP Data Services aus?

Die Architektur von SAP Data Services ist auf Zuverlässigkeit, Flexibilität, Performance und Skalierbarkeit ausgelegt. So können die skizzierten Komponenten wahlweise auf einem einzelnen Rechner installiert oder über mehrere Rechner verteilt werden. Dies erlaubt einerseits eine kostensenkende vertikale Skalierung. Hierbei führt ein Rechner mehrere oder sogar alle Prozesse auf einem Server aus.

Auf der anderen Seite ist auch eine horizontale Skalierung möglich. Bei dieser Variante werden Serverprozesse auf mehrere Rechner verteilt, um die Leistung zu optimieren. Streben Unternehmen eine besonders hohe Zuverlässigkeit an, so besteht darüber hinaus die Möglichkeit, redundante Versionen desselben Prozesses auf mehreren Rechnern gleichzeitig auszuführen.

Welche Vor- und Nachteile hat SAP Data Services?

SAP Data Services maximiert den Wert sämtlicher strukturierter und unstrukturierter Daten. Dies geschieht zunächst durch die Bereinigung und Qualitätssicherung. Denn diese Aspekte gewährleisten, dass Entscheidungen auf Basis valider Informationen getroffen werden.

Mehrwert entsteht jedoch auch durch die Datenintegration. Sie sorgt dafür, dass eine 360-Grad-Sicht auf wichtige Themenbereiche realisierbar ist. Data Services macht Zusammenhänge sichtbar, die Unternehmen für die Optimierung des Geschäfts heranziehen können. Selbst stark anwachsende Datenmengen lassen sich mit dem Tool effizient verwalten, ohne dass Qualitätseinbußen auftreten.

Als Nachteil von SAP Data Service kann die Komplexität angesehen werden. So ist die Einführung der Lösung ein Projekt mit einigen Herausforderungen. Oftmals ist Unterstützung durch einen externen Berater erforderlich, um die Implementierung erfolgreich umzusetzen. Das spätere Handling im operativen Einsatz gestaltet sich dank intuitiver Oberflächen jedoch relativ einfach.

Meinolf Schaefer01 1444x1444px

Meinolf Schäfer, Senior Director Sales & Marketing

Haben Sie Fragen zum Thema SAP Data Services? Sprechen Sie mich an – ich helfe Ihnen gerne!

+49 2241 8845-623

Herr
Frau

Hier fehlt noch etwas

*

Hier fehlt noch etwas

*

Hier fehlt noch etwas

*

Bitte geben Sie eine gültige Telefonnummer ein

*

Bitte geben Sie eine gültige E-Mail-Adresse ein

Hier fehlt noch etwas

Hier fehlt noch etwas

Bitte klicken Sie die reCAPTCHA-Checkbox