Data mining

Cos’è il data mining
Il data mining consiste nell’estrapolazione di informazioni non note all’interno di una banca dati di grandi dimensioni. Il processo riesce a identificare e fornire il risultato di legami, schemi o anomalie che non sarebbero visibili tramite un’estrazione tradizionale. Quest’ultima, infatti, impiegherebbe molto più tempo e non raggiungerebbe l’obiettivo prefissato.
L’approccio estrattivo tradizionale, che sostanzialmente prevede un quesito iniziale e una modalità di ricerca dell’informazione all’interno della base dati, non ha valore aggiunto in quanto gli algoritmi estrattivi si limitano a evidenziare l’esito della ricerca. Il data mining, invece, è programmato per “catturare”, attraverso particolari algoritmi, un’informativa utile non solo al recupero di pattern ricorrenti o anomalie evidenti, ma anche di conoscenze sfruttabili a livello strategico e commerciale.
Nel data mining si può individuare un numero definito di step:
- Selezione dei dati da elaborare e delle metriche da restituire;
- Analisi dei risultati;
- Visualizzazione dell’informativa o della reportistica.
Ogni passaggio è di grande valore in quanto contribuisce a creare il risultato finale.
Risulta quindi di importanza fondamentale, per il completamento positivo del processo, la qualità del dato fornito alla base dell’estrazione (data governance).
Se il dato di partenza dell’elaborazione non risultasse corretto, il data mining non sarebbe in grado di estrapolare le informative richieste e i dati elaborati ed evidenziati nella reportistica non sarebbero attendibili.
Il data mining fa parte di un processo più completo tecnicamente denominato KDD (acronimo di “Knowledge Discovery in Databases”) e non consiste solamente nella procedura di estrazione, ma implica soprattutto l’individuazione di validi e nuovi schemi che conducano ad azioni utili e proattive.
Data mining e business intelligence
Nonostante il data mining rientri nel settore della data science, non si può dire che abbiano entrambi la stessa finalità: mentre il primo analizza i dati storici per descriverne il comportamento, la seconda sfrutta tale mole di dati per cercare di prevedere schemi futuri.
Questo risulta molto utile nel processo di business intelligence, che per definizione predilige l’elaborazione dei dati per creare nuove strategie finalizzate a un miglioramento della performance e del controllo del rischio aziendale. Il data mining è quindi una componente fondamentale della BI per riuscire a ottenere informazioni, schemi o anomalie non conosciuti.
L’utilizzo del data mining nella business intelligence può influenzare diverse aree aziendali, in particolare nel settore bancario: dal controllo del rischio (risk management) alla compliance (conformità normativa), fino alle funzioni all’interno dell’azienda che si occupano delle segnalazioni di vigilanza (primary reporting)
Modelli di data mining
I modelli di data mining si dividono in due tipologie: descrittivi e predittivi.
Il modello descrittivo assomiglia maggiormente all’estrazione tradizionale, dove si rileva l’associazione tra dati somiglianti nel database storico di partenza e si esegue un raggruppamento degli elementi che hanno evidenziato la similarità.
Il modello predittivo, invece, che analizza il dato in profondità, si pone l’obiettivo di trovare risultati ad oggi sconosciuti e crea analisi che portano a una conoscenza non evidente rispetto alla semplice analisi del dato. Questo secondo modello risulta più utile per l’azienda, che lo impiega per identificare aree di intervento strategiche e operative attraverso le risultanze delle analisi elaborate dall’algoritmo e non rinvenienti con altre metodologie.
Scopri TIGREARM
La suite applicativa e di controllo delle informazioni bancarie e finanziarie.
Clicca sul bottone e vai alla pagina dedicata ai moduli TIGREARM oppure richiedi una DEMO gratuita

Metodologie e ambiti di applicazione
Le tecniche di estrazione del dato possono essere differenti. A seconda dell’obiettivo da raggiungere è possibile impiegare metodi diversi. I principali posso essere raggruppati in: reti neurali, alberi di decisione, clustering e metodi bayesiani.
Questi principi metodologici sono utilizzati nei vari settori in cui il data mining trova un riscontro applicativo. Tra i vari ambiti di utilizzo spiccano in particolare il mercato economico-finanziario, la scienza, il marketing, la tecnologia della comunicazione, la statistica e il settore industriale.
Vantaggi del data mining
I principali benefici che si possono ricavare dall’utilizzo del data mining sono piuttosto evidenti:
- L’analisi quantitativa e qualitativa di grandi data wharehouse;
- La velocità di analisi di database di enormi dimensioni;
- Studio di varie tipologie di dati;
- Elaborazione di un numero elevato di variabili;
- Visualizzazione chiara e semplice dei risultati;
- Nessun presupposto a priori che influenzi o indirizzi l’estrazione;
- Utilizzo di algoritmi dedicati alla funzione da svolgere.
In sintesi, il data mining è una risorsa importante per le imprese e il sistema bancario. Alla base del sistema è presente un’infrastruttura tecnologica per la creazione degli algoritmi, su cui si basa tutto il processo.
Il data mining nella suite TIGREARM
Save Consulting Group offre una suite dove l’estrazione e l’elaborazione del dato è protagonista. Il processo di estrazione dell’informazione per ricavare alcune tipologie di analisi rilevanti è evidenziato principalmente in due moduli TIGREARM:
- MidaBI: la parte della suite TIGREARM dedicata alla business intelligence.
Il modulo che, gestendo la base dati delle segnalazioni regolamentari (regulatory reporting) permette un profondo e trasversale controllo della qualità del dato (data governance).
In MidaBI viene creata un’ampia gamma di reportistica sia strutturata, quindi composta da report predefiniti, sia libera. Quest’ultima viene definita e popolata mediante la produzione di indicatori, classi di valori e relativa analisi di scostamento temporale, attraverso il processo di data mining.
- Flussi di ritorno della Banca d’Italia: il modulo della suite che permette il confronto Azienda-Sistema, che è una delle chiavi dell’information management.
Anche in questo caso, il data mining agisce nella determinazione di indicatori di riferimento qualitativi per analisi interne sul patrimonio dei dati e per il grado di posizionamento della banca stessa per dette grandezze.
Scopri i moduli che utilizzano il data mining nelle sezioni dedicate e scegli quello che soddisfa le tue esigenze: MIDABI – FLUSSI DI RITORNO DELLA BANCA D’ITALIA.
Puoi utilizzare il sistema ovunque, perché tutti i moduli della suite TIGRARM sono web based.
Scopri TIGREARM
La suite applicativa e di controllo delle informazioni bancarie e finanziarie.
Clicca sul bottone e vai alla pagina dedicata ai moduli TIGREARM oppure richiedi una DEMO gratuita