Reti bayesiane per lo studio del fenomeno degli incidenti stradali tra i giovani in Toscana[1]

Filippo Elba[2], Lisa Gnaulati[3], Fabio Voeller[4]

 

Gli incidenti stradali sono un problema di assoluta priorità per la collettività e per la sanità pubblica. Essi rappresentano, a livello mondiale, la prima causa di morte nei giovani tra i 15 e i 19 anni e la seconda nei ragazzi di 10-14 e 20-24 anni. Ai costi sociali e umani si aggiungono quelli economici, calcolati tra l’1 ed il 3% del PIL di ciascun paese, tanto da porre la questione della sicurezza stradale all’attenzione dell’agenda di tutti i sistemi sanitari.

Questo lavoro presenta una rete bayesiana costruita partendo dalle informazioni contenute nel dataset 2015 “Epidemiologia dei determinanti dell’infortunistica stradale in Toscana”, realizzato sulla base delle domande poste a 5 mila ragazzi delle scuole superiori della regione. Questa rete ha lo scopo di individuare caratteristiche e atteggiamenti che si rilevano tra i giovani con una maggior propensione a tenere comportamenti rischiosi alla guida.

Una rete bayesiana si configura come un grafo costituito da nodi, che denotano variabili causali, e da archi orientati, che indicano una relazione di dipendenza statistica tra nodo genitore e nodo figlio. Altra peculiarità di questi grafi è quella di essere non ciclici, prevendendo, perciò, percorsi che non visitano più di una volta lo stesso nodo. L’acronimo utilizzato per definire questo tipo di strutture è DAG (Direct Acyclic Graph). L’utilizzo di questo strumento è tanto più vantaggioso quanto più alto è il numero delle variabili: un problema complesso è caratterizzato da n variabili e analizzare la distribuzione di probabilità congiunta completa è molto difficile quando il loro numero è elevato.

Il modello qui presentato, inoltre, è frutto di apprendimento automatico. L’algoritmo utilizzato (Hill Climbing), partendo da una funzione obbiettivo, ha definito un DAG tale da “salvare” le relazioni più forti, eliminando quelle deboli sulla base di un criterio di penalizzazione, l’Equivalent Bayesian Dirichelet.

Le 48 variabili utilizzate nella costruzione della rete, per poco meno di 3.700 osservazioni prese in considerazione, riguardano le multe subite, i comportamenti bullistici uso di droghe e alcol.

Dopo diversi tentativi, il modello reticolare scelto come il più rappresentativo è il seguente figura.

 

Figura: Rete bayesiana con penalità BDe

immagine 1

Sulla base delle relazioni definite dal modello, variabili-genitori e variabili-figli dei nodi più direttamente legati ai comportamenti rischiosi alla guida sono:

-per AS (numero di volte in cui l’intervistato ha guidato sotto effetto di stupefacenti), i nodi genitori sono: genere; frequenza dell’uso di cannabis nell’ultimo mese; i nodi figli sono: numero di multe subite per infrazioni al codice della strada; numero di volte in cui si è subito un incidente stradale tale da richiedere ricovero al pronto soccorso;

per AK (numero di multe subite dall’intervistato), i nodi genitori sono: bullismo perpetrato; numero di volte in cui l’intervistato ha guidato sotto effetto di stupefacenti; il nodo figlio è: numero di volte in cui si è subito un incidente stradale tale da richiedere ricovero al pronto soccorso;

per AT (numero di volte in cui l’intervistato ha subito un incidente stradale tale da richiedere ricovero al pronto soccorso), i nodi genitori sono: numero di multe subite; numero di volte in cui l’intervistato ha guidato sotto effetto di stupefacenti; i nodi figli non sono presenti essendo, questo, un “nodo-foglia”.

Interessante notare come la rete qui presentata confermerebbe le tesi di Elvik e Lund (2015)[5]. I due autori sottolineano come tassi di incidenti stradali più elevati si registrano tra i giovani maschi (nella rete, il nodo del genere è direttamente collegato alla tripletta di nodi riferiti a comportamenti rischiosi alla guida). In generale, la maggior probabilità dei giovani di avere incidenti stradali sarebbe imputabile a fattori biologici (ormoni, sviluppo celebrale), all’eccessiva autostima, ed in un atteggiamento di ribellione e di sfida tipici di questa età, atteggiamenti che possono essere per certi versi rappresentati dal nodo relativo a comportamenti  bullistici, che si lega al nodo delle multe subite, e a quello della frequenza dell’uso di cannabis, che può essere considerato spia di un atteggiamento caratterizzato da sottovalutazione dei rischi (il consumatore di droghe ha scarso interesse per quelle che potrebbero essere eventuali effetti di tale comportamento sulla sua salute).

Attraverso ulteriori specificazioni, il modello qui presentato potrebbe diventare una rete causale. La rete causale, a sua volta, potrebbe essere elaborata in rete decisionale, utile per guidare il governo regionale e le istituzioni preposte nella lotta al fenomeno in analisi.

Un domani, grazie alla Data Science, si potrà porre un freno alla disinvoltura dei giovani alla guida attraverso una prevenzione più mirata.

[1] La versione completa dell’articolo qui sintetizzato è consultabile e scaricabile al seguente link: https://arxiv.org/abs/1710.07066.

[2] Assistente alla ricerca e cultore della materia (Università degli Studi di Firenze), e-mail: filippo.elba@unifi.it.

[3] Ricercatrice (Osservatorio di Epidemiologia – ARS Toscana), e-mail: lisa.gnaulati@ars.toscana.it.

[4] Dirigente di ricerca (Osservatorio di Epidemiologia – ARS Toscana), e-mail: fabio.voller@ars.toscana.it.

[5] Elvik, R., & Lund, J. (2015). Contributing factors to traffic injuries in adolescents. The European Journal of Public Health, 25(suppl 3), ckv167-061.

Facebooktwitterlinkedinmail