Disuguaglianza e povertà locale
Definizione
Con questa terminologia ci si riferisce in genere alle tematiche che sorgono quando si analizza la povertà o la disuguaglianza tramite stime statistiche di opportuni indicatori a livello sub-nazionale per aree geografiche ridotte, lavorando con dati ottenuti da sondaggi campionari disegnati per contesti nazionali, con campioni statistici complessi, significativi e rappresentativi a livello nazionale. Quello che accade è che la variabilità di tali stime è molto elevata a causa della insufficiente numerosità campionaria delle aree sub-nazionali, con la conseguente non utilizzabilità degli indicatori.
L’aggettivo “locale” (nella terminologia anglo-sassone generalmente “regional”) sta quindi a denotare quelle aree geografiche normalmente istituzionali (nel caso italiano le regioni, le provincie, i comuni) sub-nazionali di interesse; nel caso dell’Unione Europea tali aree sono definite dalla “Nomenclature des Unités Territoriales Statistiques” (NUTS) con numerazione progressiva crescente, secondo la quale, ad esempio, le nostre regioni sono NUTS 2 e le provincie NUTS 3.
In tempi relativamente recenti l’interesse per stime di povertà locale si è fortemente sviluppato per l’aumento del fenomeno, le conseguenti politiche di contrasto e la necessità di verificarne l’effettiva capacità ed efficacia. Si ricordi, ad esempio, lo studio condotto in ambiente OCSE (Piacentini, 2014) sugli indicatori AROPE (At Risk of Poverty and Social Exclusion) a livello territoriale NUTS2 su dati EU-SILC, ottenuti con sondaggi armonizzati nei paesi membri e con valenza nazionale, al fine di monitorare le politiche anti-povertà.
I principali approcci
Sul piano metodologico il problema della inadeguatezza delle stime ottenute con sondaggi nazionali per indicatori riferiti a zone geografiche sub-nazionali può essere risolto seguendo tre approcci: (i) modificando il disegno campionario, ampliando - cioè - la numerosità campionaria, (ii) migliorando le caratteristiche statistiche delle stime utilizzando informazione ausiliaria, (iii) cumulando temporalmente i dati. Obiettivo comune a tali approcci è la riduzione della varianza delle stime ottenuta tramite l’aumento delle inidonee numerosità campionarie in i) e iii) oppure specificando un legame tra variabile di studio e informazione ausiliaria in ii).
Il primo approccio si scontra pesantemente con un evidente – sovente insostenibile - aumento nei costi della rilevazione. Gli altri due sono casi particolari di quell’ampio settore della metodologia statistica noto come Stima per Piccole Aree (SAE - Small Area Estimation) ed entrambi richiedono la presenza di condizioni particolari; in particolare il secondo richiede il completamento dell’informazione derivante da operazioni censuarie con quella ottenuta da una rilevazione campionaria condotta nella prossimità di un censimento (normalmente un’indagine sui consumi/redditi delle famiglie, il terzo richiede un disegno campionario di tipo panel bilanciato e ruotato).
Si fornisce ora una breve e sintetica descrizione di tali due approcci, a cui segue una altrettanto concisa introduzione alla metodologia SAE.
Utilizzo di informazioni ausiliarie
Il Poverty Mapping è una metodologia per la stima del livello di benessere/povertà e del grado di diseguaglianza per piccole aree, come città, distretti, municipalità. Tale metodologia, introdotta e sviluppata dalla Banca Mondiale (Elbers et al., 2002; Elbers et al., 2003) e denominata ELL in onore dei suoi autori (Elbers, Lanjouw e Lanjouw), combina dati rilevati tramite indagine campionaria ai dati censuari per stimare misure di povertà e/o disuguaglianza al livello di piccola area, specificando un modello per la spesa per consumo familiare da stimare sui dati rilevati tramite indagine campionaria della tipologia Living Standards Measurement Survey (LSMS) ed utilizza i parametri stimati per effettuare una previsione basata sui dati censuari. La spesa per consumi prevista viene poi aggregata al livello desiderato per il calcolo delle misure di povertà e/o disuguaglianza.
L’informazione di base per lo sviluppo del Poverty Mapping consiste di: i) dati rilevati tramite un’indagine campionaria con la quale è stata rilevata la spesa per consumi al livello familiare oltre ad una serie di variabili familiari ed individuali e ii) dati rilevati tramite censimento della popolazione o alternativamente dati amministrativi.
Entrambe le fonti di dati, che idealmente dovrebbero fare riferimento allo stesso anno, sono necessarie, poiché: i dati rilevati tramite un’indagine campionaria permettono di stimare misure di povertà e/o disuguaglianza al livello nazionale o al livello di macroregioni ma generalmente non permettono la stima efficiente al livello di piccola area a causa della piccola numerosità campionaria relativamente all’area stessa; al contempo, i dati censuari, che non hanno ovviamente problemi di numerosità, non rilevano la variabile spesa familiare per consumi, necessaria per la costruzione di misure tradizionali di povertà.
Il Poverty mapping sviluppato attraverso il metodo ELL si sviluppa in quattro passi.
Il primo passo consiste nell’esaminare la compatibilità delle variabili rilevate tramite indagine campionaria e tramite censimento e selezionare solo quelle compatibili in termini di definizione e distribuzione.
Il passo due consiste nella specificazione di un modello per la spesa per consumo familiare in funzione delle variabili da stimare sui dati campionari.
Il passo tre utilizza i parametri stimati al passo due per simulare un elevato numero di replicazioni per i parametri stessi ed ottenere quindi replicazioni bootstrap della spesa per consumi familiari, sui dati censuari. Le previsioni ottenute vengono utilizzate per stimare misure di povertà e/o disuguaglianza al livello di piccola area unitamente ad i relativi errori standard.
Il passo quattro è quello conclusivo in cui si costruiscono le mappe corrispondenti alle misure stimate al passo precedente. Attualmente, esistono anche altre metodologie per lo sviluppo del Poverty Mapping come il metodo basato sull’Empirical Best Predictor (EBP) (Molina e Rao, 2010) ed il metodo M-quantile (Chambers e Tzavidis, 2006; Salvati et al., 2009).
Il Poverty mapping ed in particolare i risultati che si producono in termini di stima su piccole aree e di mappe sono molto utili sia in ambito di ricerca che nella definizione di politiche. Tra le varie applicazioni si evidenziano le seguenti: l’individuazione di aree particolarmente deprivate per la pianificazione di specifiche politiche anti-povertà, la pianificazione al livello regionale di politiche sociali ed economiche, nell’allocazione di risorse economiche, come strumento esplorativo per comprendere la relazione spaziale tra indicatori.
Cumulo temporale di dati
Come già ricordato, per seguire l’approccio iii) che qui è indicato come “Cumulation” occorrono dati provenienti da un disegno campionario di tipo panel ruotato; se tale rotazione consiste nel rimpiazzare un quarto del campione per ogni anno di conduzione dell’indagine, si ottiene lo schema seguente nel quale è evidente che le medesime unità statistiche elementari (USE) vengono rilevate per quattro anni successivi e che quindi le informazioni relative alle medesime possono essere aggregate opportunamente o per somma o per adeguata media. Così come è evidente che il campione dal quale tali operazioni di aggregazione provengono, è ben più ampio dei singoli campioni che vengono aggregati e pertanto la varianza delle stime provenienti dall’aggregazione sarà certamente ridotta.
Un primo problema che si pone seguendo tale approccio consiste nello scegliere se cumulare i valori delle singole variabili sui quattro anni di conpresenza delle medesime USE, oppure cumulare gli indicatori calcolati per ogni anno di rilevazione.
Figura 1. Disegno campionario dell’indagine EU-SILC
Non esistono semplici criteri di scelta tra i due approcci; normalmente la scelta deve essere operata caso per caso con strumenti tecnici abbastanza complessi. Si pensi, ad esempio alle complessità inferenziali di indicatori di disuguaglianza e/o di povertà, in presenza di disegni campionari complessi come EU-SILC (Figura 1). Per questo, in genere si preferisce aggregare temporalmente specifiche stime per ogni onda piuttosto che aggregare i micro-dati.
Modifica del disegno campionario
È possibile ottenere stime della varianza e quindi calcolare il guadagno in termini di precisione nella procedura di stima ricorrendo a tecniche di ri-campionamento come ad esempio il noto approccio Jack-knife Repeated Replications. Ovviamente è possibile usare schemi di ri-campionamento alternativi come la linearizzazione di Taylor o il Bootstrap.
Consideriamo ora, in modo teoricamente più ampio delle due applicazioni considerate, la tematica della stima per piccole aree (SAE). La dimensione delle aree di interesse è qualificata “piccola” in relazione alle poche osservazioni campionarie in esse presenti.
Immaginiamo di distribuire le osservazioni sulla povertà ottenute dall’indagine campionaria sulle aree locali. Il campione di individui o di famiglie non sarà equamente distribuito tra le aree. Per alcune aree saremo in grado di avere stime dirette credibili, perché basate su una dimensione campionaria sufficiente. In questo caso la stima degli indicatori di povertà può avvenire direttamente sulla base dei dati raccolti con l’indagine, tramite i cosiddetti stimatori diretti.
Alcune aree avranno poche osservazioni campionarie altre addirittura nessuna. In questi ultimi due casi per “rafforzare” la credibilità delle stime dirette degli indicatori o addirittura per predirle, quando non ci siano osservazioni nel campione, è necessario formulare un modello statistico. Si tratta in buona sostanza di un modello di regressione che lega la variabile di studio a variabili ausiliarie i cui valori siano disponibili per tutte le aree locali interessate.
A seconda della specificazione del modello e anche in funzione della informazione ausiliaria disponibile i ricercatori hanno sviluppato molti stimatori per piccole aree. Distinguiamo i modelli specificati a livello di area (ad esempio, la percentuale di poveri in un’area locale è funzione di variabili note per quella stessa area) da quelli a livello di unità (essere o non essere povero per un individuo è considerato funzione di caratteristiche individuali dello stesso), i modelli che si basano su ipotesi di comportamento delle medie della distribuzione della variabile di studio (EBLUP SAE estimators), da quelli che invece partono dal legame tra i quantili della distribuzione e le variabili ausiliarie (M-quantile Small Area Estimators). Un’altra importante distinzione è la modalità di studio delle proprietà statistiche (correttezza, efficienza, consistenza, ecc.) degli stimatori SAE: l’inferenza sugli indicatori di povertà locale potrà essere statisticamente significativa sotto il disegno di campionamento oppure sotto il modello specificato.
La letteratura sui metodi SAE è molto vasta e testimonia l’articolarsi dei metodi SAE in relazione alle possibili situazioni pratiche per la stima di percentuali, totali, rapporti tra totali, indicatori di livello e di associazione, coprendo tutta la gamma dei possibili indicatori di povertà monetaria e non monetaria. Una raccolta dei metodi SAE si trova nel lavoro di Molina e Rao (2010). I temi legati alla stima della povertà locale sono oggetto dei testi di Betti e Lemmi (2015) e di Pratesi (2016).
In ogni caso l’obiettivo del modello SAE è quello di migliorare la credibilità delle stime dirette riducendo l’ampiezza dell’intervallo di confidenza. Obiettivo che è generalmente coronato scegliendo la classe di stimatori SAE più adeguata allo studio di caso e all’informazione ausiliaria disponibile. Questa può provenire da fonti tradizionali (dati censuari, archivi amministrativi) e moderne, come ad esempio archivi prodotti dall’applicazione di nuove tecnologie, come i cosiddetti Big data che scaturiscono dalla tracciabilità elettronica dei comportamenti sociali (commercio elettronico, scanner data sulle transazioni, partecipazione a social network) e dati da GPS e immagini satellitari utili nello studio della mobilità e della qualificazione del territorio e della distribuzione della popolazione.
Riferimenti bibliografici
- Betti G. e A. Lemmi (2015, a cura di), Poverty and Social Exclusion: New Methods of Analysis. Londra, Routledge.
- Chambers R., Tzavidis N., (2006), “M-quantile models for small area estimation”, Biometrika, 93, 255-268
- Elbers C., P. Lanjouw, J. Mistiaen, B. Ozler e K. Simler (2002), Are Neighbours Equal? Estimating Local Inequality in Three Developing Countries (Unpublished Manuscript), Washington D.C., Banca Mondiale.
- Elbers C., J.O. Lanjouw e P. Lanjouw (2003), “Micro-Level Estimation of Poverty and Inequality”, Econometrica, 71(1), 355-364.
- Molina I. e J. Rao (2010), “Small Area Estimation of Poverty Indicators”, The Canadian Journal of Statistics, 38(3), 369-385.
- Piacentini M. (2014), “Measuring Income Inequality and Poverty at the Regional Level in
- OECD Countries”, OECD Statistics Working Papers, 2014/03.
- Pratesi M. (2016, a cura di), Analysis of Poverty Data by Small Area Estimation, New York, Wiley.
- Salvati N., M. Pratesi, N. Tzavidis e R. Chambers (2009), “Spatial M-quantile Models for Small Area Estimation”, Statistics in Transition.
Suggerimenti di lettura
- Betti G. e A. Lemmi (2015, a cura di), Poverty and Social Exclusion: New Methods of Analysis. Londra, Routledge.
- Molina I. e J. Rao (2010), “Small Area Estimation of Poverty Indicators”, The Canadian Journal of Statistics, 38(3), 369-385.
- Pratesi M. (2016, a cura di), Analysis of Poverty Data by Small Area Estimation, New York, Wiley.