Pollasto Gianlucad, Betti Elisaa, Venturi Giuliab, Ravelli Andrea Amelioc, Mantellini Paolaa
aIstituto per lo Studio la Prevenzione e la Rete Oncologica (ISPRO), Firenze, Italy
bIstituto di Linguistica Computazionale “A. Zampolli” (CNR-ILC), ItaliaNLP Lab, Pisa, Italy
c Research Group ABSTRACTION – Dipartimento di Lingue, Letterature e Culture Moderne, Università di Bologna, Bologna, Italy dMedico in formazione specialistica in Igiene e Medicina preventiva, Università degli Studi di Firenze, Italy
Introduzione
Il tumore del colon-retto (CRC) rappresenta una delle principali cause di mortalità oncologica sia negli uomini che nelle donne di tutto il mondo. Le evidenze scientifiche disponibili indicano che lo screening della popolazione è assolutamente efficace nel ridurre la mortalità attraverso la diagnosi precoce e l’identificazione di lesioni precancerose.
In Italia, lo screening del CRC è incluso nei Livelli Essenziali di Assistenza (LEA) dal 2001 e viene offerto gratuitamente, con cadenza biennale, alla popolazione di età compresa tra 50 e 70 anni. Nonostante ciò, la partecipazione resta spesso al di sotto della soglia del 45% indicata come valore minimo accettabile.
Le cause della bassa adesione sono molteplici e comprendono fattori organizzativi, socioeconomici e culturali, nonché elementi legati alla percezione del rischio e alla fiducia nei servizi sanitari. In questo contesto, l’alfabetizzazione sanitaria e la qualità delle informazioni fornite ai cittadini assumono un ruolo cruciale. L’alfabetizzazione sanitaria è un concetto che comprende le competenze necessarie per accedere alle informazioni sanitarie, valutarle e utilizzarle per prendere decisioni appropriate.
Una delle dimensioni più concrete e misurabili dell’alfabetizzazione sanitaria è la leggibilità dei materiali informativi. Testi caratterizzati da un linguaggio tecnico, da frasi lunghe e da strutture sintattiche complesse possono rappresentare una barriera, soprattutto per i gruppi più vulnerabili della popolazione. Nel caso delle lettere di invito allo screening, una scarsa comprensione del contenuto può tradursi in una mancata partecipazione.
Alla luce di queste premesse, l’obiettivo di questo articolo è valutare l’impatto dell’inserimento di messaggi di economia comportamentale (EC) nelle lettere di invito allo screening del cancro del colon-retto sulla chiarezza e leggibilità della comunicazione rivolta ai cittadini, mediante uno strumento di valutazione automatica della complessità linguistica.
Contesto e obiettivi del progetto BESTcc
BESTcc è un progetto finanziato dalla Regione Toscana con l’obiettivo di valutare l’impatto di diverse strategie di invito sulla partecipazione allo screening del tumore del colon-retto, tra cui l’inserimento di messaggi che si ispirano alle logiche di economia comportamentale che studia come fattori psicologici, emotivi e sociali influenzano le decisioni degli individui. Infatti anche quando sono a disposizione le informazioni e gli strumenti necessari gli individui non si comportano sempre razionalmente poiché il loro processo decisionale è influenzato sia dalle modalità di presentazione del problema da risolvere, sia dal vissuto, dalle attitudini e dalle conoscenze del singolo. In sanità l’impiego dei principi dell’economia comportamentale ha l’obiettivo di supportare gli utenti e i pazienti nell’operare, sulla base delle conoscenze fornite e in funzione delle proprie attitudini di salute, le scelte più adeguate. Tra gli obiettivi specifici del progetto vi è stato anche quello di valutare la leggibilità delle lettere di invito che incorporavano tali messaggi, coinvolgendo competenze di sanità pubblica e linguistica computazionale
Metodologia
La Figura 1 illustra un flusso di lavoro sintetico del progetto BESTcc che delinea le fasi essenziali per il processo di valutazione della leggibilità.

Figura 1: Flusso di lavoro BESTcc.
In una prima fase sono stati condotti focus group (FG) con l’obiettivo di sviluppare e rivedere i messaggi di economia comportamentale (EC) da inserire nelle lettere di invito allo screening. Successivamente, le lettere contenenti i messaggi EC sono state sottoposte a una valutazione della leggibilità articolata in due fasi:
- Utilizzando uno strumento di valutazione automatica della leggibilità basato su tecniche di elaborazione del linguaggio naturale (NLP);
- Somministrazione di un questionario a un gruppo di utenti selezionati in modo casuale.
- Valutazione automatica della leggibilità
La leggibilità delle lettere è stata valutata mediante READ-IT, uno strumento di analisi automatica per la lingua italiana basato su tecniche di NLP e machine learning. READ-IT restituisce un punteggio di complessità su una scala da 0 a 100, dove valori più elevati indicano testi più difficili da leggere. Lo strumento analizza diverse dimensioni linguistiche, tra cui il lessico utilizzato, le caratteristiche morfosintattiche e la struttura sintattica delle frasi, consentendo di identificare quali aspetti contribuiscano maggiormente alla complessità del testo.
Poiché le lettere di invito allo screening presentano caratteristiche linguistiche specifiche, READ-IT è stato riaddestrato utilizzando un corpus dedicato di testi medici in lingua italiana, tratto dai manuali MSD. Il corpus comprendeva oltre 12.000 documenti, suddivisi tra testi destinati ai professionisti sanitari e testi destinati ai pazienti.
- Valutazione umana: questionario
La valutazione empirica della leggibilità è stata condotta tramite un questionario reso disponibile a 489 individui selezionati casualmente tra la popolazione eleggibile allo screening del CRC. Il questionario includeva tre messaggi di 80 parole ispirati al EC mescolati con tre testi della stessa lunghezza estratti da documenti sanitari di varia complessità, che fungevano da controlli.
La difficoltà di lettura è stata valutata utilizzando una scala a 7 punti, da “molto facile da leggere” a “molto difficile”. Il questionario includeva inoltre informazioni sociodemografiche (età, sesso, livello di istruzione, condizione lavorativa) e domande sulla familiarità con lo screening e con il cancro, per esplorare possibili influenze sulla percezione della complessità del testo.

Figura 2: Distribuzione per livello di istruzione e condizione lavorativa dei rispondenti al questionario (64 su 489).
Risultati
La valutazione ha mostrato che le diverse versioni della lettera presentavano livelli di complessità linguistica molto simili tra loro. I punteggi complessivi si sono collocati in una fascia intermedia della scala di leggibilità, indicativa di testi complessivamente accessibili per il lettore italiano medio.
| Invitation letter | Lexicon | Syntax | Global |
| Letter with feedback | 46.44 | 42.88 | 37.39 |
| Letter with minority norm | 45.45 | 41.83 | 35.4 |
| Letter with minority norm + feedback | 45.58 | 42.19 | 36.05 |
| Standard Letter | 46.97 | 41.40 | 35.93 |
Tabella 1: Punteggi di leggibilità READ-IT delle lettere di invito con diversi messaggi ispirati al EC. Valori più bassi indicano una minore complessità linguistica e, quindi, una maggiore leggibilità.
L’introduzione dei messaggi ispirati all’economia comportamentale non ha determinato un incremento significativo della complessità del testo rispetto alla lettera standard.
L’analisi delle singole componenti linguistiche ha evidenziato che la difficoltà del testo è prevalentemente attribuibile al livello lessicale. In particolare, termini di ambito medico, pur essendo di uso relativamente comune nel contesto sanitario, contribuiscono in misura maggiore alla complessità complessiva rispetto agli aspetti sintattici. La struttura delle frasi è risultata infatti generalmente semplice.
I risultati dell’analisi automatica hanno trovato conferma nella valutazione empirica condotta tramite questionario. Il campione di soggetti selezionati ha espresso, nella maggior parte dei casi, giudizi positivi sulla facilità di lettura dei testi proposti. I messaggi EC sono stati prevalentemente classificati come “facili” o “molto facili” da leggere. Anche nell’analisi qualitativa delle risposte, il lessico è stato indicato come l’elemento maggiormente critico, mentre la lunghezza delle frasi e la struttura sintattica sono state raramente percepite come ostacoli alla comprensione. L’elevato grado di concordanza tra valutazioni automatiche e giudizi degli utenti rafforza la solidità dei risultati ottenuti.
Conclusioni
I risultati dello studio condotto nell’ambito del progetto BESTcc evidenziano come la leggibilità delle lettere di invito allo screening rappresenti un elemento strategico per favorire la partecipazione ai programmi di prevenzione. In particolare, l’introduzione di messaggi di economia comportamentale può essere realizzata senza compromettere la comprensibilità dei testi, a patto che la progettazione linguistica sia supportata da strumenti di valutazione adeguati.
Un elemento di particolare interesse emerso dallo studio riguarda l’elevato livello di concordanza tra la valutazione automatica della leggibilità e il giudizio espresso dai partecipanti al questionario. Questo risultato suggerisce che strumenti tecnologici di analisi linguistica possano rappresentare un supporto utile per la progettazione e la valutazione dei materiali di comunicazione sanitaria. In prospettiva, lo sviluppo e la specializzazione di questi strumenti – anche attraverso l’integrazione di tecniche di intelligenza artificiale – potrebbe facilitare l’analisi sistematica della leggibilità dei materiali informativi utilizzati nei programmi di prevenzione.
In prospettiva, l’esperienza maturata con il progetto BESTcc suggerisce l’opportunità di estendere questo tipo di analisi ad altri ambiti della comunicazione sanitaria contribuendo a migliorare la qualità delle informazioni fornite ai cittadini, favorire una partecipazione più consapevole ai programmi di prevenzione e, più in generale, ridurre le disuguaglianze di accesso ai servizi sanitari.