Data Mining

savecg_immagini22_10

Cos’è il data mining

Il data mining consiste nell’estrapolazioni di informazioni non note all’interno di una banca dati di grandi dimensioni. Il processo riesce a identificare e fornire il risultato di legami, schemi o anomalie che non sarebbero visibili tramite un’estrazione tradizionale. Quest’ultima, infatti, impiegherebbe molto più tempo e non raggiungerebbe l’obiettivo prefissato.

L’approccio estrattivo tradizionale, che sostanzialmente prevede un quesito iniziale e una modalità di ricerca dell’informazione all’interno della base dati , non ha valore aggiunto in quanto gli algoritmi estrattivi si limitano ad evidenziare l’esito della ricerca.Il data mining, invece,  è programmato per “catturare”, attraverso particolari algoritmi, un’informativa utile non solo al recupero di partner ricorrenti o anomalie evidenti, ma anche di conoscenze sfruttabili a livello strategico e commerciale.

Nel data mining si possono individuare un definito numero di step:

  • selezione dei dati da elaborare e delle metriche da restituire;
  • analisi dei risultati;
  • visualizzazione dell’informativa o reportistica.

Ogni passaggio è di grande valore in quanto partecipa a creare il risultato finale.

Risulta quindi di importanza fondamentale per il completamento positivo del processo la qualità del dato fornito alla base dell’estrazione (data governance).

Se il dato di partenza dell’elaborazione non risultasse corretto, il data mining non sarebbe in grado di estrapolare le informative richieste e i dati elaborati ed evidenziati nella reportistica non sarebbero attendibili.

Il data mining fa parte di un processo più completo che viene tecnicamente denominato KDD (acronimo di Knowledge Discovery in Databases) e non consiste solamente nella procedura di estrazione, ma implica soprattutto l’individuazione di validi e nuovi schemi che conducano ad azioni utili e proattive.

 

Il data mining e la Business Intelligence

Nonostante il data mining rientri nel settore della data science non si può dire che abbiano entrambi la stessa finalità: mentre il primo analizza i dati storici per descriverne il comportamento, la seconda sfrutta tale mole di dati per cercare di prevedere schemi futuri.

Questo risulta molto utile nel processo di business intelligence, che per definizione predilige l’elaborazione dei dati per creare nuove strategie che portino a un miglioramento della performance e del controllo del rischio aziendale.Il data mining è quindi una componente fondamentale della BI per riuscire a ottenere informazioni, schemi o anomalie non conosciute.

L’utilizzo del data mining nella business intelligence può influenzare diverse aree aziendali, in particolare nel settore bancario: dal controllo del rischio (risk management) alla compliance (conformità normativa), fino alle funzioni all’interno dell’azienda che si occupano delle segnalazioni di vigilanza (primary reporting).

 

Modelli di data mining

I data mining si dividono in due tipologie: descrittivi e predittivi.

Il modello descrittivo assomiglia maggiormente all’estrazione tradizione, dove viene rilevata l’associazione tra dati somiglianti nel database storico di partenza e viene eseguito un raggruppamento degli elementi che hanno evidenziato la similarità.

Il modello predittivo invece, che analizza il dato in profondità, si pone l’obiettivo di trovare risultati ad oggi sconosciuti e crea analisi che portano a una conoscenza non evidente rispetto alla semplice analisi del dato. Questo secondo modello risulta più utile per l’azienda, che lo impiega per identificare aree di intervento strategiche e operative attraverso le risultanze delle analisi elaborate dall’algoritmo e non rinvenienti con altre metodologie.

Scopri TIGREARM

La suite applicativa e di controllo delle informazioni bancarie e finanziarie.

Clicca sul bottone e vai alla pagina dedicata ai moduli TIGREARM oppure richiedi una DEMO gratuita

savecg_immagini22_19

Metodologie e ambiti di applicazione

Le tecniche di estrazione del dato possono essere differenti. A seconda dell’obiettivo da raggiungere è possibile impiegare metodi diversi. I principali posso essere raggruppati in: reti neurali, alberi di decisione, clustering o metodi bayesiani.

Questi principi metodologici sono utilizzati nei vari settori in cui il data mining trova un riscontro applicativo. Gli ambiti di utilizzo sono vari. Tra questi spiccano in particolare il mercato economico-finanziario, la scienza, il marketing, la tecnologia della comunicazione, la statistica e il settore industriale.

 

I vantaggi del Data Mining

I principali benefici che si possono ricavare dall’utilizzo del data mining sono piuttosto evidenti:

  • L’analisi quantitative e qualitative di grandi data wharehouse;
  • La velocità di analisi di database di enormi dimensioni;
  • Studio di varie tipologie di dati;
  • Elaborazione di un numero elevato di variabili;
  • Visualizzazione chiara e semplice dei risultati;
  • Nessun presupposto a priori che influenzi o indirizzi l’estrazione;
  • Utilizzo di algoritmi dedicati alla funzione da svolgere.

In sintesi, il data mining è una risorsa importante per le imprese e il sistema bancario. Alla base del sistema è presente un’infrastruttura tecnologica per la creazione degli algoritmi, su cui si basa tutto il processo.

 

Il Data Mining nella suite TIGREARM

Save Consulting offre una suite dove l’estrazione e l’elaborazione del dato è protagonista. Il processo di estrazione dell’informazione per ricavare alcune tipologie di analisi rilevanti è evidenziato principalmente in due moduli TIGREARM:

Il modulo che, gestendo la base dati delle segnalazioni regolamentari (regulatory reporting) permette un profondo e trasversale controllo della qualità del dato(data governance).

In Mida BI viene creata un’ampia gamma di reportistica sia strutturata, quindi composta da report pre-definiti, sia libera. Quest’ultima viene definita e popolata mediante la produzione di indicatori, classi di valori e relativa analisi di scostamento temporale attraverso il processo di data mining.

Anche in questo caso, il data mining agisce nella determinazione di indicatori di riferimento qualitativi per analisi interne sul patrimonio dei dati e il grado di posizionamento della banca stessa per dette grandezze.

Scopri i moduli che utilizzano il data mining nelle sezioni dedicate e scegli quello che soddisfa le tue esigenze: MIDABIFLUSSI DI RITORNO DELLA BANCA D’ITALIA.

Puoi utilizzare il sistema ovunque, perché tutti i moduli della suite TIGRARM sono web based.

Scopri TIGREARM

La suite applicativa e di controllo delle informazioni bancarie e finanziarie.

Clicca sul bottone e vai alla pagina dedicata ai moduli TIGREARM oppure richiedi una DEMO gratuita