Data Science für Nicht-Programmierer

RapidMiner

RapidMiner ist eine Data-Science-Plattform, die eine inte­grierte Umgebung für maschinelles Lernen, Deep Learning, Text- und Data Mining, Business Analytics sowie Predictive Analytics bietet. Dabei sollen sich die einzelnen Produkte RapidMiner Studio, Server, Radoop und Streams sowohl für Business-Anwendungen wie für Ausbildung, Training, Rapid Prototyping oder zur Anwendungsentwicklung eignen.
RapidMiner Studio ist eine visuelle Design-Umgebung zum schnellen Aufbau vollständiger prädiktiver Analyse-Workflows unter einer grafischen Oberfläche. Die Workflows werden als Prozesse bezeichnet und bestehen aus mehreren Operatoren. Jeder Operator führt im Prozess eine einzelne Aufgabe aus, die Ausgabe eines Operators bildet jeweils die Eingabe für den nächsten. Die Engine kann von anderen Programmen aufgerufen oder als API verwendet werden.
Data-Science-Plattform: RapidMiner dient als integrierte Umgebung für maschinelles Lernen, Deep Learning, Data Mining und Predictive Analytics
Quelle: RapidMiner
Studio verfügt über eine umfangreiche Bibliothek mit Algorithmen für maschinelles Lernen, Datenaufbereitung und -exploration sowie Modellvalidierungs-Tools zur Unterstützung nahezu beliebiger Data-Science-Projekte und Anwendungsfälle. Dank offener APIs lassen sich auch vorhandene, spezialisierte Algorithmen integrieren. Ausserdem kann die Funktionalität mit zusätzlichen Plug-ins erweitert werden. Ein Extensions-Marktplatz bietet Entwicklern eine Plattform, um Datenanalyse-Algorithmen zu veröffentlichen.
Mit RapidMiner Server lässt sich das Programm auf Unternehmens-Hardware von jedem Gerät ohne Einschränkungen ausführen. Der Server kann verwendet werden, um Analysen zu planen, auszuführen und Echtzeitergebnisse zu erhalten. Er lässt sich in alle Datenquellen integrieren und erlaubt den Einsatz eigener Algorithmen fürs Data Mining. Über interaktive Dashboards kann man auf Informationen zugreifen, sie überwachen und freigeben sowie Aufgaben zuweisen.
RapidMiner Radoop bietet eine Plattform für die Verarbeitung von Big Data, einschliesslich Analysen und Vorhersagen. Dazu gehört eine visuelle Schnittstelle für Big-Data-ETL (Extract, Transform, Load), Analysen, Ad-hoc-Reporting, prädiktive Modellierung und Visualisierung.
Mit RapidMiner Streams schliesslich lassen sich Verarbeitungsanwendungen ohne Code streamen. So können Streaming-Analysen auf verteilten Apache-Storm-Clustern für das Datenmischen und Modell-Scoring bei Streaming-Daten bereitgestellt werden.
Neben der Möglichkeit, komplexe Workflows über die grafische Bedienoberfläche zu erstellen, unterstützt RapidMiner auch Skripting in mehreren Sprachen. Das System vereinfacht den Datenzugriff und ermöglicht das Laden und die Auswertung aller Arten von Daten, einschliesslich Texten, Bildern und Audiotracks.

Charles Glimm
Autor(in) Charles Glimm



Das könnte Sie auch interessieren