06.05.2011, 15:27 Uhr
Die Fakten aus dem Datenversteck locken
Unternehmen versprechen sich von Data Mining wertvolle Erkenntnisse für das Optimieren ihrer Geschäftsprozesse. SAS-Mitgründer John Sall kennt Chancen und Risiken.
John Sall entwickelt seit Mitte der 70-er Jahre Software. Heute ist er Mitinhaber von SAS, dem grössten privaten Software-Unternehmens der Welt. Während das Auswerten von Geschäftsdaten mittlerweile zum Milliardenbusiness geworden ist – von dem SAS einen Teil für sich beansprucht – ist Sall auf dem berühmten Teppich respektive nahe an den Daten geblieben. Er gilt als einer der führenden Software-Architekten im Bereich der Statistik. Mit JMP, kurz für «John's Macintosh Project», hat Sall ein nach ihm benanntes Programm, das heute Bestandteil der Visual Business Intelligence Suite von SAS ist. Computerworld sprach mit Sall über die Chancen und Risiken von Datenvisualisierung. Computerworld: Was sagen Sie einem Manager, der Sie um eine Alternative für Excel bittet? John Sall: Excel leistet gute Dienste bei der Tabellenkalkulation, etwa bei finanzanalytischen Berechnungen. Schwächen hat das Programm bei der statistischen Analyse und interaktiver grafischer Auswertung. Hier kommt JMP ins Spiel. Allerdings ist JMP nicht zwingend ein Ersatz für Excel. Version 9.0 bringt ein Add-On für die Microsoft-Tabellenkalkulation mit, das Daten aus Tabellen der Analyse mit JMP zugänglich macht. So können zum Beispiel Szenarien simuliert werden. Wer in einer Tabellenkalkulation eine Simulation rechnen will, muss für jede Wertänderung jeweils den Effekt auf das Resultat beobachten. Das kostet viel Zeit. JMP nutzt zum Beispiel die Response-Surface-Methode, um eine Simulation zu rechnen. Der Benutzer definiert hier nur Eingangs- und Ausgabevariablen in seiner Excel-Tabelle, JMP simuliert die Daten und präsentiert, welchen Effekt bestimmte Eingangswerte auf die Ausgabewerte haben. Damit können etwa Fertigungsbetriebe ihre Produktion optimieren oder Banken neue Finanzpakete schnüren. Welchen Nutzen bringt Datenvisualisierung den Unternehmen? Grafiken sagen mehr als die Zahlen, insbesondere, wenn die Grafiken in hoher Auflösung, mit vielen Details und in Bewegung präsentiert werden. So lassen sich Fakten und Zusammenhänge in den Daten entdecken, die durch das reine Vergleichen von Zahlenkolonnen nicht sichtbar werden. Dank der leistungsfähigen Systeme sind Analysen heute schnell gerechnet und Ergebnisse liegen unmittelbar vor. Dann können sich umgehend neue Auswertungen anschliessen, um zum Beispiel Fragestellungen im Detail zu beantworten. Unternehmen liegen immense Datenmengen vor, aus denen sie viel lernen können. Mit den heute vorhandenen Werkzeugen kann die Lernkurve viel steiler sein als noch vor ein paar Jahren. Nächste Seite: versteckte Fakten finden Ein Vorteil von Datenvisualisierung ist die Reduktion von Komplexität. Wie gross ist die Gefahr, dabei ein kritisches Detail zu übersehen?
Es gibt natürlich beide Fälle: Ein Spitalangestellter kann in einer Grafik eine Differenz bei den Ausgaben und den Krankenkassenerstattungen bemerken. Dann ist die Ursache rasch gefunden – wenn etwa eine teure Spitalleistung nicht durch eine verrechnungsfähige Codierung repräsentiert ist und dann auch nicht erstattet wird. Im umgekehrten Fall bringt einem Anwender ein Diagramm mit Millionen von Datenpunkten kaum einen Erkenntnisgewinn. Mithilfe eines anderen Grafiktyps kann aber eventuell doch eine Struktur in den Datenmassen identifiziert werden. Kurzum: In grossen Datenvolumen können sich immer Fakten verstecken. Ihnen kann man aber mit den richtigen Analysemethoden und zugehörigen Grafiken auf die Spur kommen. Es ist also fatal, nur die Grafiken oder nur die Daten bei der Analyse zu betrachten? Man muss unbedingt sowohl die Grafiken als auch die Daten ansehen. Eine Stärke von JMP sind Anpassungsmodelle (Fitting models), bei denen die Software grafisch darstellt, wie Daten miteinander interagieren. Teilweise sind aus den Grafiken selbst Zusammenhänge ablesbar, die einem Anwender verborgen bleiben, wenn er nur die Daten betrachtet. JMP produziert bei jeder Analyse eine Grafik, die aber interaktiv ist. Durch einen Mausklick auf einen Punkt in einer Verteilung sieht der Anwender die zugehörigen Daten, was eine weitergehende Auswertung vereinfacht. Neu sind einige Businessfunktionen: Heute können Variablen per Drag&Drop in eine Grafik hinzugefügt und Zeitreihen als animierte Grafiken dargestellt werden. Damit lassen sich Werte, die sich über die Zeit verändern, in einem Blasendiagramm (Bubble chart) präsentieren. Über die Zeit hinweg sieht der Benutzer die Blasen wachsen und womöglich platzen. Aus diesen Animationen können Geschäftsanwender wertvolle Schlüsse ziehen, die beim simplen Blick auf die Daten nicht gleich offenbar geworden wären. Welche Unternehmen in der Schweiz nutzen diese Auswertungen?
Aktuell haben wir circa 40 Kunden in der Schweiz. Die Mehrheit ist im Bereich Pharmazie tätig. Versicherungen, gemeinnützige Organisationen und Fertigungsbetriebe zählen aber auch zu den Anwendern. Fragestellungen stammen oftmals aus dem Umfeld Six Sigma, mit dem Unternehmen ihre Geschäftsprozesse sowie Fertigung optimieren und Kosten reduzieren wollen. Ausserhalb der Schweiz beginnen auch Finanzinstitutionen, sich für die Funktionen von JMP zu interessieren. Die Fragestellungen unterscheiden sich häufig aber nicht von denen anderer Branchen, etwa geht es um das Optimieren von Marketingstrategien. Data Mining und die grafische Analyse können aber auch hilfreich beim Risikomanagement sein. Das sind allerdings Anforderungen für SAS-Programme. Nächste Seite: Cloud und 3D JMP wäre die perfekte Anwendung für Software-as-a-Service. Wird SAS in Zukunft Lizenzen oder Rechenleistung verkaufen? JMP ist keine Server-Software, es läuft auf dem Desktop. Allerdings kann JMP als Client für Server-Applikationen benutzt werden, zum Beispiel in Data-Mining-Szenarien. Dann erledigt der SAS-Server die Rechenarbeit und auf dem Client werden Parameter verändert, Variablen hinzugefügt und Daten visualisiert. Von anderen Produkten wird es bis Ende Jahr mobile Apps und Flash-Anwendungen für den Browser geben, mit denen gerechnet und grafische Analysen erledigt werden können. Im Hintergrund steht dann ein SAS-Server, der die Rechenarbeit übernimmt, am Frontend auf dem Mobilgerät geschieht die interaktive Auswertung. JMP testen wir zurzeit lediglich als eine funktionell eingeschränkte Version auf dem iPad. Derzeit ist 3D einer der Trends. Gilt das auch für grafische Datenanalyse?
Seit der ersten Version beherrscht JMP 3D-Grafiken. Vor 21 Jahren waren es noch niedrig aufgelöste, dreidimensionale Streudiagramme. Heute benutzen wir OpenGL für die Darstellung von zum Beispiel Response-Surface-Modellen. Allerdings ist 3D kein Allheilmittel – vielmehr muss die Grafik zur Fragestellung passen. Nur wenn für das Resultat drei Variablen betrachtet werden müssen, bietet sich eine dreidimensionale Grafik an. Schon in 2D-Darstellungen steckt viel Aussagekraft. Die Grafiken können womöglich anhand eines dritten Parameters animiert werden. Solche Simulationen bieten sich insbesondere beim Betrachten zeitlicher Verläufe an. Das visuelle System des Menschen ist darauf spezialisiert, Muster in der Unordnung zu erkennen. Ebenfalls identifiziert der Mensch problemlos Ausreisser, die abseits der Masse liegen. Farbe ist überdies ein kritisches Merkmal, genau wie Bewegung in einem statischen Umfeld. Diese Eigenheiten der optischen Wahrnehmung machen wir uns bei der Visualisierung von Daten zunutze, indem Anwendern unterschiedliche Typen von Grafiken angeboten werden. Wenn man Ihren Ausführungen folgt, bemerkt man, dass Sie sich sehr viel mit dem Produkt auseinandersetzen. Programmieren Sie JMP noch mit? Ja. Neben meinem Job als Executive Vice President von SAS bin ich noch Teil des Entwicklerteams von JMP. Etwa 25 Personen schreiben die Software, genau so viele sind mit Tests und der Dokumentation beschäftigt. Im Vergleich zu den über 11'000 Angestellten von SAS sind wir ein kleines Team, in dem ich noch viel Arbeit habe. Allerdings macht mir das Programmieren viel Spass.