Machine Learning auf SAP HANA

Überblick

Machine Learning bietet Unternehmen eine Vielzahl von Anwendungsmöglichkeiten, von der Verbesserung der Geschäftsprozesse bis hin zur Erstellung personalisierter Produktempfehlungen für Kunden. Diese Technologie ermöglicht es Unternehmen, große Datenmengen zu analysieren und Muster und Trends zu identifizieren, die von menschlichen Analysten nur schwer oder gar nicht erkannt werden können.
SAP HANA ist eine hochleistungsstarke In-Memory-Datenbank, die große Datenmengen schnell und effizient verarbeiten kann. Diese Fähigkeit macht sie zu einer idealen Plattform für Machine Learning, da das Trainieren von Machine-Learning-Algorithmen große Datenmengen und hohe Rechenleistung benötigt, um genaue Ergebnisse zu erzielen.
SAP HANA enthält zwei eingebettete Machine Learning Bibliotheken: die Predictive Analysis Library (PAL) und die Automated Predictive Library (APL), deren Umfang wir uns im nächsten Abschnitt ansehen. Die Nutzung der beiden Bibliotheken wird als Embedded Machine Learning bezeichnet. Daneben bietet die SAP HANA-Plattform auch die Möglichkeit des External Machine Learnings durch die Anbindung von R und Tensorflow.
Algorithmen können mit SQL konfiguriert und ausgeführt werden über APIs mit den Programmiersprachen Python und R. Die nachfolgende Abbildung zeigt einen Überblick über die Machine Learning Architektur auf SAP HANA.

Überblick über die Machine Learning Architektur von SAP HANA. Quelle: SAP HANA Machine Learning Overview | SAP Help Portal

SAP HANA Machine Learning Bibliotheken

Predictive Analysis Library (PAL)

Die PAL enthält eine Vielzahl an Funktionen für Analysen und maschinelles Lernen. Dies umfasst Algorithmen für Klassifizierung, Regression, Clusteranalyse, Zeitreihenanalyse, Assoziationsanalyse, Analyse sozialer Netzwerke, Empfehlungssysteme, Datenvorverarbeitung und Statistik. Einen Überblick über Algorithmen finden Sie hier: PAL Procedures – SAP Help Portal.

Außerdem bietet die PAL inkrementelle Machine Learning Verfahren für SAP HANA Streaming-Analytics, die Modelle im laufenden Betrieb trainieren und aktualisieren.

Weitere Informationen finden Sie unter: SAP HANA Predictive Analysis Library (PAL) – SAP Help Portal

Automated Predictive Library (APL)

Die APL identifiziert automatisch den passenden Algorithmus und erstellt ein optimales Modell. Sie unterstützt Modelle für Klassifizierung, Regression, Clustering, Zeitreihenanalyse, Empfehlungssysteme und die Analyse sozialer Netzwerke. Für die Verwendung der APL sind keine Kenntnisse als Data Scientist erforderlich.

Weitere Informationen finden Sie unter: What is SAP HANA Automated Predictive Library? – SAP Help Portal

R-Integration

R ist eine Open-Source-Programmiersprache mit dem Fokus auf Statik. Durch die R-Integration von SAP HANA können in R verfügbaren Open-Source-Algorithmen verwendet werden. Die HANA-Datenbank interpretiert die R-Sprache und übergibt das Skript entsprechend an den R-Server. Der Anwendungsentwickler kann den R-Code in HANA SQL Script einbetten und als Datenbankabfrage übermitteln.

Damit eröffnen sich vielfältige Möglichkeiten, da der gesamte Leistungsumfang von R auf Ihre Daten in HANA angewendet werden kann.

Fazit

SAP HANA ist eine leistungsstarke In-Memory-Datenbank, die speziell für Machine-Learning-Anwendungen geeignet ist. Durch ihre Fähigkeit, große Datenmengen schnell zu verarbeiten und ihre integrierten Machine-Learning-Funktionen sowie der Integration von R bietet SAP HANA Unternehmen eine umfassende Lösung für ihre Machine-Learning-Anforderungen.

Einen Use Case mit SAP HANA Machine Learning finden Sie in diesem Blogartikel: https://prodato.de/sales-forecasting-mit-sap-hana/

Prodato verbindet.

Autorin

Magdalena Reinelt
Senior Consultant

magdalena.reinelt@prodato.de