RapidMiner è un software molto completo per analizzare dati in grandi in quantità come si vuole, si possono anche importare da files di utilizzo comune.
A volte, seppur non si sia statisti si vuole analizzare in dettaglio qualcosa, si hanno i dati in gran quantità che permetterebbero di farlo ma è troppo complesso, un programma che consente di farlo senza diventare matti/e sarebbe molto comodo,inoltre, senza spendere niente è possibile usare RapidMiner, che in pratica consente di trasformare dei dati presenti in un testo in dati elaborati o statistiche, è un po come trasformare un file di log del server in Google Analytics, in locale.
Caratteristiche ed utilizzo di RapidMiner
Seppur non mi dilungherò a dire tutte le caratteristiche di RapidMiner ma solo alcune visto che sono molte e non spiegherò come usare tutte le funzionalità di RapidMiner perché sono anch'esse davvero tante, una panoramica riguardo le caratteristiche e come usare RapidMiner è doverosa.
Le caratteristiche di RapidMiner si possono riassumere nel fatto che, tramite un'interfaccia user friendly (facilmente usabile) permette di progettare il processo di analisi dei dati, essi si potranno poi importare, siano essi numerici o testuali ed è possibile rielaborarli per analizzarli meglio, anche creando altri file di output con il risultato dell'analisi.
Più in dettaglio, con più di 500 operatori, personalizzabili ed integrabili tra loro, che è possibile salvare anche aggregati per riutilizzare più velocemente in futuro, è possibile accedere a dati presenti su/in Excel, Access, Oracle, IBM DB2, Microsoft SQL Server, Sybase, Ingres, MySQL, Postgres, SPSS, dBase, file di testo ed altro, ed elaborarli, ricavandone testo, trasformarli e modellarli, inoltre, come se non lo fosse abbastanza RapidMiner lo si può anche potenziare tramite plugins:
Molto sintatticamente, in pratica per usare RapidMiner bisogna:
- Scegliere ed aggregare operatori che sarebbero azioni da eseguire, che possono essere concatenati;
- L'aggregazione di operatori forma un processo;
- Opzionalmente, se il processo per essere eseguito ha bisogno di importare dati da fonti esterne, non salvate in RapidMiner, si possono importare e si potrà poi eseguire un processo di analisi dei dati.
Myexperiment
RapidMiner non è elementare da usare, non difficile perchè ben spiegato ed ha anche dei processi e delle base dati di esempio che è possibile utilizzare per far prove di vario tipo, però, oltre che provando per imparare è utile anche vedere cosa fanno altri, Myexperiment permette di farlo, è un sito web dove si fa condivisione di progetti/esperimenti scientifici e per fare data mining, sono presenti anche degli utili e particolari esempi di processi per RapidMiner:
L'utilizzo di Myexperiment è molto semplice, basta cercare tramite parola chiave quello che si desidera analizzare, approfondire la ricerca in base il programma che si desidera, ovviamente RapidMiner in questo caso, si potranno poi scaricare i processi senza l'obbligo di registrazione, prima ovviamente si vedrà cosa fanno e se ne leggerà una breve descrizione dell'autore, ovviamente sarà possibile anche condividere i propri processi per RapidMiner.
Concludo dicendo che, seppur questo articolo non sia una guida di utilizzo per RapidMiner, la quale esiste già, realizzata dallo sviluppatore del software e non dice nel dettaglio come usarlo, lo scopo di presentare un ottimo e potenzialmente molto utile programma per analizzare i dati, e, nell'articolo qualche informazione in più è stata fornita, non credete sia abbastanza?
Da qui potete fare il download di RapidMiner, seppur l'ho testato con/lo presento per Windows c'è anche per Linux e Mac, io ho la versione in Java, è comoda dato che non c'è bisogno d'installare il programma, qui trovate Myexperiment.