Agile Vorgehensweisen, Flexibilität und Schnelligkeit sind Merkmale, die im Rahmen der Digitalisierung gerade auch bei Business Intelligence (BI) Projekten eine wesentliche Rolle spielen. Wie in einem anderen Blogbeitrag bereits erläutert, kann Automatisierung ein möglicher Weg für eine agilere Vorgehensweise sein. Eine andere Alternative bzw. eine Ergänzung stellt das Thema Daten Virtualisierung dar. Ein Thema, welches aus meiner Sicht aktuell noch zu sehr vernachlässigt wird.

Daten Virtualisierung im Überblick

Im Rahmen der Digitalisierung sammeln alle Unternehmen immer mehr Daten und versuchen diese für ihre Geschäftsprozesse oder die Entwicklung neuer Geschäftsmodelle sinnvoll zu nutzen. Die bisherigen Ansätze zur Datenverwaltung, wie z.B. Data Warehouse Systeme, sind diesen Datenmengen und deren zeitnahen Verarbeitung oft nicht mehr gewachsen.
Für die notwendige Agilität und Geschwindigkeit werden daher neue Technologieansätze, wie z.B. die Daten Virtualisierung, benötigt. Hierbei müssen die Daten nicht mehr umständlich bewegt werden und die Verknüpfung heterogener Datenquellen wird mit einer Daten Virtualisierung deutlich vereinfacht.
Für den Anwender lässt sich mit der Daten Virtualisierung eine transparente und für seine Zwecke optimale Zugriffsebene auf unterschiedlichste Daten realisieren. Wo die Daten im Einzelnen herkommen und wie die technischen Formate im Detail aussehen, ist für den Anwender völlig irrelevant. Er bekommt eine fachliche Sicht auf die Daten, die er sofort verstehen und selbst analysieren kann.
Im Rahmen einer Daten Virtualisierung werden die notwendigen Datentöpfe über entsprechend definierte Schnittstellen angebunden und der Zugriff auf diese Daten z.B. für die Bereitstellung in Services oder zu Analysezwecken wird über eine einheitliche virtuelle Struktur für die Nutzer bereitgestellt.
Schaubild Daten Virtualisierung

Vorteile von Daten Virtualisierung

Mit geeigneten Werkzeugen zur Daten Virtualisierung lassen sich Datenquellen sehr leicht auch ohne umfassende IT-Kenntnisse einbinden und unterstützen damit den Self-Service Gedanken. Durch den direkten Zugriff auf die Quellsysteme stehen die gewünschten Daten direkt zur Verfügung. Langwierige Extraktionsverfahren können so vermieden werden. Durch die schnelle Anbindung von Datenquellen können Fachbereichslösungen in kürzester Zeit umgesetzt werden. Die Konzeption und Umsetzung von umfangreichen ETL Prozessen entfällt. Damit ist dann gleichzeitig die Basis für eine iterative und agile Vorgehensweise geschaffen, die in bisherigen DWH Projekten meist nur schwierig umsetzbar war. Mittels Trial-and-Error Vorgehen können Anforderungen aus den Fachbereichen schnell überprüft und verifiziert werden. So entstehen in kürzester genau die Ergebnisse, die den Anforderungen des Fachbereichs entsprechen. Es existieren verschiedene Formen der Datenvirtualisierung, die ich im Folgenden kurz erläutern möchte.

Daten Virtualisierung mittels Datenbank-Funktionen

Daten Virtualisierung ist natürlich nicht wirklich ein komplett neues Konzept. Wie so oft in der IT, werden bekannte Verfahren immer wieder einmal neu erfunden bzw. entsprechend der technologischen Möglichkeiten „neu definiert“. So trifft dies im Prinzip auch auf die Daten Virtualisierung zu. Viele Datenbanksysteme bieten das Konzept der Views oder Links, mit denen man eine virtuelle Sicht auf Daten in unterschiedlichen Tabellen oder sogar Datenbanken realisieren kann. Allerdings wird damit nur eine sehr rudimentäre Art der Daten Virtualisierung umgesetzt. Müssen Daten auch aus anderen Quellen eingebunden werden, kommt man schnell an seine Grenzen. Auch die Integration einer Zugriffsbeschränkung einzelner Daten ist mit einem View Konstrukt nicht immer in der gewünschten Form möglich.

Daten Virtualisierung mittels Frontend-Tools

Viele moderne BI Frontend Werkzeuge bieten mittlerweile Möglichkeiten, diverse Datenquellen anzubinden und die Sichten auf diese Daten einfach zu modellieren. In Verbindung mit InMemory Technologien bekommt man auf diese Weise ein für den Fachanwender recht einfach zu bedienendes Werkzeug, welches gerade im Bereich von Self Service BI gerne eingesetzt wird. Problematisch ist hier aber wieder die Gefahr, dass Daten nicht immer in qualitätsgesicherter Form genutzt werden oder evtl. fehlerhaft verknüpft werden. Für eine schnelle Datenanalyse in eng begrenzten Themenfeldern oder bei entsprechend versierten Fachanwendern mögen solche Tools sinnvoll einsetzbar sein. Eine zentrale Datenverwaltung bzw. die zentrale Bereitstellung von virtuellen Sichten auf die Daten unter Einhaltung aller Qualitäts- und Sicherheitsaspekte ist aber oft die bessere Variante.

Daten Virtualisierung mittels dedizierter Virtualisierungs-Werkzeuge

Die weitreichenste Virtualisierungs-Lösung bieten dedizierte Werkzeuge, die spezielle Funktionen für ein umfassendes Virtualisierungskonzept anbieten. Einer der Vorreiter in diesem Umfeld ist z.B. Denodo. Aber auch Hersteller von ETL-Werkzeugen haben in den letzten Jahren entsprechende Funktionalitäten in ihre Produkte integriert. Vorteil der Daten Virtualisierungs-Lösungen sind die umfassenden Funktionalitäten zur einfachen Anbindung diverser Datenquellen. So lassen sich sehr schnell Informationen aus unterschiedlichen Datenbanken, ERP Systemen oder über APIs ermittelbare externe Daten als virtuelle Sicht zusammenfügen. Zusätzliche Funktionen zur Datenbereinigung, Definition von führenden Quellen, Zugriffsschutz und vielen weiteren Problemstellungen sorgen für eine schnelle und damit agile Umsetzung entsprechender Projekte.

Jetzt teilen auf:

Jetzt kommentieren