Crescita, Competitività e Mercati internazionali

L’impatto economico della pandemia: un’analisi attraverso Twitter
L’analisi dei contenuti dei social network può essere utilizzata a supporto dei metodi tradizionali di raccolta di dati e informazioni per sviluppare un indice economico a livello regionale.
I social come strumento di analisi delle opinioni e delle dinamiche economiche
L’11 marzo 2020 l’Organizzazione Mondiale della Sanità ha dichiarato il COVID-19 una pandemia, un’emergenza sanitaria che è diventata presto un’emergenza economica mondiale. In questo articolo riportiamo un’analisi dell’impatto economico della pandemia basato sui post di Twitter che valuta, in particolare, il sentiment economico degli utenti relativo al COVID-19. Questo esercizio ha un obiettivo più ampio, quello di mostrare come i social network, generando enormi quantità di dati, possono essere utilizzati nelle scienze economiche e sociali per analizzare l’opinione di consumatori o utenti o per fare previsioni. Combinati con i metodi tradizionali di raccolta dati, come i sondaggi, i dati dei social network sono uno strumento utile in quanto consentono di monitorare lo scoppio e la diffusione di fenomeni sostanzialmente in tempo reale.

Dall’emergenza sanitaria a quella economica
Il dataset utilizzato è costituito dai tweet raccolti tra il 20 febbraio 2020, all’inizio della pandemia, e il 2 aprile 2020. Abbiamo scaricato automaticamente i tweet utilizzando l’API di Twitter tramite il linguaggio di programmazione statistico R. Nel dettaglio sono stati raccolti tutti i tweet scritti in italiano e contenenti la parola chiave coronavirus; complessivamente abbiamo un campione di 1.766.196 tweet.
Il grafico a sinistra nella Figura 1 riporta il numero totale giornaliero di tweet raccolti, un indicatore dell’interesse che gli utenti di Twitter dedicano all’argomento. La linea rossa è una media mobile a sette giorni e consente di cogliere meglio l’andamento generale dei dati. Le discussioni sul tema hanno un picco il 24 febbraio con 51.620 tweet, a seguito della decisione di chiudere le scuole nelle regioni Lombardia, Piemonte e Veneto. Un altro picco si osserva tra il 9 e il 13 marzo con oltre 60.000 tweet al giorno. L’8 marzo 2020, infatti, il Presidente del Consiglio ha esteso la quarantena a tutta la Lombardia e ad altre 14 province del Nord. Il 10 marzo, la quarantena viene estesa a tutta l’Italia, e l’11 viene vietata ogni attività commerciale ad eccezione di supermercati e farmacie.

Individuando un insieme di 200 parole chiave relative all’economia (ad esempio economia, impresa, disoccupazione, inflazione, infrastrutture, turismo) siamo riusciti a selezionare, tra tutti i tweet raccolti, quelli relativi agli argomenti economici. In totale abbiamo un campione di 154.797 tweet “economici” sul coronavirus, Figura 1 (centro). L’andamento è altamente correlato con quello generale, ma è interessante notare che gli utenti di Twitter non discutono di argomenti economici durante i fine settimana (29 febbraio - 1° marzo, 7-8 marzo, 14-15, 21-22 e 28-29).
Infine, la Figura 1 (a destra) mostra che, al netto dell’effetto weekend, la percentuale di temi economici sul totale dei tweet sul coronavirus è in aumento, confermando che l’emergenza inizialmente era ovviamente percepita come sanitaria (e gli utenti di twitter si concentravano più si questioni di tipo sanitario), ma è poi diventata anche economica. Nel periodo considerato la quota di tweet “a carattere economico” sul totale passa dal 5% a l’11%.

Cresce la preoccupazione per gli effetti economici della pandemia
Il testo dei tweet è stato analizzato con tecniche di Sentiment Analysis, con l’obiettivo di raccogliere informazioni sull’umore degli utenti di Twitter, in relazione all’effetto economico della pandemia. Senza entrare nei dettagli tecnici di procedure e metodologie utilizzate, esistono tre metodi principali per eseguire l’analisi del sentiment: apprendimento automatico, approccio rule-based e approccio lessicale e in questa analisi abbiamo utilizzato il terzo metodo.
L’analisi del sentiment consiste in due passaggi: inizialmente viene calcolato un punteggio di sentiment per ogni tweet, poi, i punteggi vengono utilizzati per raggruppare i tweet in tre classi: positivo, negativo e neutro. Per assegnare punteggi di sentiment ai tweet utilizziamo un vocabolario italiano di sentiment. Una voce in questo vocabolario consiste quindi in un lemma italiano (sostantivo, verbo, aggettivo, avverbio), un punteggio positivo e negativo da 0 a 1, un punteggio di polarità compreso tra -1 e 1 e un punteggio di intensità compreso tra 0 e 1. Si consideri, ad esempio, il seguente tweet registrato il 2 aprile: Confindustria. Calo devastante della produzione industriale. Come mostrato nella Tabella 1, le tre parole calo, devastante e industriale sono abbinate ai corrispondenti valori di positivo, negativo, polarità e intensità. Vengono poi calcolati i valori medi delle voci positive e negative e, a partire da questi, la polarità e l’intensità.



Una volta calcolati i punteggi del sentiment per tutti i tweet di un blocco giornaliero, i tweet sono stati raggruppati in positivi, negativi o neutri, utilizzando una cluster analysis. Infine, è stato calcolato il valore dell’indice giornaliero. Il sentiment complessivo, relativo a tutti i tweet raccolti, e quello economico sono stati calcolati per ciascun giorno all’interno del periodo considerato. La Figura 2 riassume i risultati e descrive i trend relativi al sentiment economico (a sinistra) ed al sentiment complessivo (a destra), dal 20 febbraio al 2 aprile. In entrambi i grafici la linea rossa è una media mobile a sette giorni e consente di evidenziare l’andamento generale.



I due grafici appaiono correlati, entrambi mostrano un calo iniziale, un aumento ed un secondo calo; tuttavia, picchi si osservano in corrispondenza di giorni diversi.

Nel periodo di monitoraggio iniziale, dal 20 al 28 febbraio, con la diffusione del virus in tutta Italia, il sentiment economico cala visibilmente e raggiunge il livello minimo di 0,002. Il 28 febbraio si registrano 31.085 tweet di cui 3.144 classificati come tweet economici. In questa giornata le parole che compaiono con maggiore frequenza sono: lavoro, economia, impresa, turismo ed emergenza, segnalando quindi una situazione critica nel mercato del lavoro e nel settore turistico, uno dei settori maggiormente colpiti dalla diffusione del coronavirus. Il 26 febbraio è un altro giorno con un valore basso per il sentiment economico e, in questo giorno, il dibattito su Twitter si concentra sulle speculazioni sui prezzi delle maschere. I giorni con valori più alti sono invece il 14 e il 15 marzo. Il 14, infatti, viene firmato un accordo per la sicurezza dei lavoratori tra rappresentanti delle imprese e sindacati. Il 15 marzo la Federal Reserve statunitense riduce ulteriormente i tassi di interesse per contrastare l’impatto negativo della crisi economica mentre in Italia vengono presi provvedimenti per sospendere e posticipare i pagamenti delle tasse. Inoltre, in Italia viene dato sostegno ai lavoratori dello spettacolo, e questo ottiene molta attenzione su Twitter.

Si osserva che mentre il valore del sentiment complessivo assume sempre valori negativi, quello economico ha valori prossimi allo zero, ma positivi.Questo dato, che potrebbe apparire strano, è in linea con quanto rilevato dalla Banca d’Italia in un sondaggio sul fatturato atteso delle imprese, come mostrato in Figura 3.

Anche in questo caso infatti, nel periodo considerato, le attese sono positive. Questo indica come ci sia stato un probabile ritardo nel percepire le conseguenze negative della Pandemia e una iniziale sottostima delle conseguenze negative.



Conclusioni
Riassumendo, questa analisi del sentiment economico sul COVID-19, realizzata a partire dai dati di Twitter, mostra con successo la capacità di catturare le notizie e le reazioni degli utenti, confermando il potenziale di questi nuovi
strumenti. Appare interessante sottolineare che, mentre il numero di tweet totali sul coronavirus è in calo, la quota di tweet economici è in aumento, confermando gli effetti a lungo termine della crisi economica.

Questa analisi fa parte di un progetto più ampio di Fondazione Nord Est in cui miriamo a utilizzare l’analisi del sentiment per sviluppare un Indice economico a livello regionale, monitorando quotidianamente i post di Twitter. Questo indice si ispira all’Economic Social Mood Index proposto dall’ISTAT ma, a differenza di esso, si concentra sul Nordest italiano e, da un punto di vista metodologico, utilizzerà un algoritmo di apprendimento supervisionato.
Blog - L'opinione di Gianluca Toschi