Open Data e Network Analysis: esposizione del debito sovrano EU

Can you do something with this data? Questa è la sfida di chiusura di tutti gli articoli del Guardian Data Blog, punto di riferimento mondiale per il data driven journalism. Frase sempre accompagnata da link a dati e metadati scaricabili e reinterpretabili dai lettori e aspiranti ddj.

Lo scorso 26 marzo, in concomitanza con la crisi bancaria a Cipro, un post di Simon Rogers dal titolo Where are Europe’s banks most exposed? Ha messo a disposizione i risultati di un’indagine dell’European Banking Autorithy che mostra l’esposizione lorda al debito sovrano dei paesi UE, con dettagli a livello di nazione e di istituto di credito.

 I dati, aggiornati a fine giugno 2012, mostrano quali banche possiedono i 3.6 trilioni di euro di debito sovrano e quali nazioni hanno la maggiore esposizione.

I dati sono navigabili tramite una mappa Tableau che consente di evidenziare una specifica nazione, con la lista delle banche che posseggono il suo debito.

tableau open data Ad esempio, nel caso italiano, la maggior parte del debito pubblico è detenuto da banche nazionali ma una quota non indifferente è in mano a banche straniere; la stessa situazione, anche se con volumi diversi si può osservare negli altri paesi UE.

Quello che non emerge direttamente da questa pur eccellente lettura dei dati è l’aspetto relazionale. Risulta quindi interessante esaminare le interdipendenze tra le varie nazioni per capire quali sono maggiormente interconnesse e quindi reciprocamente dipendenti dal punto di vista del debito sovrano.

Vediamo quindi di raccogliere la sfida di Simon Rogers (can you do something with this data?) e di farci aiutare dalla Network Science e dalle sue metriche relazionali; gli strumenti necessari sono un semplice foglio di calcolo e Gephi, per l’analisi e la visualizzazione.

Iniziamo ad esplorare e ripulire lo spreadsheet originale, togliendo le righe di subtotal e per ogni paese, la parte di debito sovrano di proprietà di banche nazionali (quindi in questa analisi non consideriamo il debito che rimane “in casa”).

ddj spreadsheet Per cancellare i subtotal e le righe riguardanti il debito che rimane all’interno dei confini nazionali si possono utilizzare dei campi di calcolo con delle semplici formule IF:

formula

Quindi possiamo creare due pivot table ottenendo una lista di nodi e una lista edge importabili in Gephi (Data Table, Import Spreadsheet).

La lista dei nodi rappresenta, per ogni nazione, la porzione di debito sovrano posseduta da banche estere. La lista degli edges rappresenta invece lo split per nazione. Per dettagli è possibile consultare lo spreadsheet allegato.

A questo punto, proviamo ad esaminare il dataset sotto una prospettiva diversa.

Dual Circular Layout  size by weight order by weightUn modo per rappresentare i dati è di raggrupparli con un layout a doppio cerchio (dual circular layout), nel cerchio interno le 5 nazioni che hanno una frammentazione più alta del loro debito sovrano, nel cerchi esterno le nazioni rimanenti. La dimensione dei nodi è proporzionale all’ammontare del debito e il colore vira dall’azzuro al blu a seconda della stessa metrica.

Volendo mettere in risalto le interdipendenze è possibile utilizzare algoritmi di community detection per capire quali sono i cluster di nazioni, quindi gli insiemi di stati maggiormente interconnessi e dipendenti tra loro.data drive journalism open data network analysis guardian data blog gephiUna possibile rappresentazione sfrutta le potenzialità del radial axis layout. I gruppi di stati maggiormente interconnessi sono distribuiti su 3 assi e ordinati a seconda dell’ammontare del debito sovrano. Il colore dei nodi, in questo caso, identifica l’appartenenza ad uno specifico raggruppamento di stati. Nella figura sopra può notare la situazione particolare del Liechtenstein, che si trova al centro dei due cluster guidati da Germania e Belgio.

Chiudo il post precisando che, non essendo un esperto di finanza internazionale, non sono assolutamente in grado di entrare nel merito e valutare se sia uno svantaggio o un vantaggio distribuire o concentrare il proprio debito sovrano. Mi sono semplicemente divertito a rielaborare una fonte autorevole con una prospettiva diversa. Ogni commento o suggerimento è gradito e benvenuto.

E tu, sai fare qualcosa con questi dati?

Credits and resources

Guardian Data Blog

Where are Europe’s banks most exposed?

DATA: download the full spreadsheet

Dataset rielaborato

Gephi file

Annunci

3 pensieri su “Open Data e Network Analysis: esposizione del debito sovrano EU

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...