Progetto Genoma Umano: 20 anni (ed oltre…)

Sono passati 20 anni dalla pubblicazione su Nature dei risultati del sequenziamento del genoma umano. Con questo articolo ripercorriamo in breve la storia del progetto e facciamo il punto sulle principali scoperte scientifiche, i risvolti pratici, gli avanzamenti e le prospettive future scaturite da questa importante sfida scientifica.

Illustrazione creata con AI da A. Minuzzo

Il progetto

Nel 1985 fu Sinsheimer RL ad organizzare un workshop sull'argomento genoma umano presso l’università della California a Santa Cruz. Al termine dei lavori gli scienziati coinvolti dichiararono il progetto come fattibile (1).

L’anno successivo (1986) Renato Dulbecco (premio Nobel Medicina e Fisiologia 1975) pubblicò su Science un articolo nel quale ipotizzava che “il sequenziamento del genoma umano sarebbe stato un punto di svolta per la ricerca sul cancro” ; in particolare per la maggiore comprensione degli oncogeni ed oncosoppressori (2).

Tuttavia l’impeto per la sua attuazione arrivò dal Dipartimento dell’energia (DOE, oggi Office of Energy Research) che intravedeva l’opportunità di studiare gli effetti delle radiazioni nucleari sul DNA. Gli Istituti Nazionali di Salute (National Institute of Health - NIH) nel primo periodo assunsero una posizione poco proattiva che fu, tuttavia, bilanciata da un congresso americano propenso allo sviluppo del progetto, non solo per i possibili risultati scientifici ma anche per l’acquisizione di un notevole know-how - in termini di spin-off industriali - e benefici economici. Nel 1988 arrivò l’endorsement anche dal comitato dell’Accademia Nazionale di Scienza (National Academy of Science).

Nei successivi anni si susseguirono altri importanti eventi come la pubblicazione del memorandum di intesa fra NIH e DOE (1988), la nascita del National Center for Human Genome research a Bethesda (Maryland) (1989) e la definizione dei principi etici, legali e le implicazioni sociali del progetto (ELSI) (1989).

Il progetto genoma prese il via nel 1990 sotto la guida del premio nobel 1962 James Watson, considerato insieme a Francis Crick il padre della doppia elica del DNA.

I centri coinvolti nel progetto furono 20 così distribuiti: 12 in USA, 2 in Germania, 2 in Giappone, 1 in Cina, 1 in Francia, 1 in Inghilterra, con l’obiettivo di sequenziare il genoma umano ovvero determinare l’esatto ordine delle basi del DNA e localizzare i geni umani che, all’epoca, erano stati previsti in numero di 100.000. Il progetto aveva anche il fine di sequenziare il genoma di altri organismi utilizzati come modello di studio - ad esempio Escherichia Coli e Caenorabdithis Elegans - per comparare  i genomi a fini di studio evoluzionistico (3).

Il tutto fu coordinato a livello centrale - per ottimizzare il lavoro - e finalizzato a condividere i risultati con tutti gli scienziati mondiali attraverso l’informatizzazione dei risultati in un dataset liberamente accessibile.
Gli step del progetto erano i seguenti: determinare una mappa genetica del genoma umano, quindi produrre una mappa fisica del genoma ed infine eseguire il sequenziamento (3). La tecnologia disponibile all’epoca era “di prima generazione” e con alcuni limiti ma si pensava che il progresso strumentale sarebbe arrivato proprio grazie alla spinta data dal progetto genoma. A questo punto per capire meglio il sequenziamento può risultare utile un breve ripasso di biologia e genetica.

Il genoma umano è l’insieme di tutto il DNA presente all’interno delle cellule. Il DNA può essere paragonato ad una “scala a pioli” formato da due sequenze di mattoncini chiamati nucleotidi, costituiti da un pentoso, un gruppo fosfato ed una delle quattro basi azotate: adenina, timina, guanina, citosina (A, T, C, G) (3)

L’obiettivo del progetto genoma umano era sequenziare il DNA di Homo Sapiens (e degli altri organismi selezionati), quindi capire come queste quattro basi si susseguissero nel genoma. Il metodo era noto e si chiama sequenziamento di Sanger dal nome dello scienziato che lo sviluppò. 

La “ricetta” prevede di avere la sequenza di DNA che vogliamo sequenziare (modello), nucleotidi normali, “basi di terminazione della catena” ovvero nucleotidi fluorescenti che interrompono la sintesi della catena (detti dideossinucleotidi). Il tutto insieme ad un enzima chiamato Taq polimerasi, una specie di macchina cellulare che costruisce la sequenza di mattoncini prendendo come matrice il DNA. Con questo metodo vengono create tantissime sequenze di nucleotidi random copiate dal DNA e che terminano con il nucleotide fluorescente (un colore diverso per base). Attraverso un metodo di suddivisione e di lettura delle copie di DNA (elettroforesi e lettura automatizzata) le varie sequenze vengono messe in ordine con lunghezza progressiva ed è possibile risalire al nucleotide finale e quindi ricostruire la successione dei vari nucleotidi.

Da tutti questi pezzetti attraverso il processo del “genome assembly” è possibile ricostruire il genoma completo. Il metodo è elegante ma, purtroppo, ha un limite soprattutto nella lettura di  quelle porzioni del DNA che presentano ripetizioni di stessi nucleotidi e quindi sono sottoposte a un maggior numero di errori nel processo di determinazione della successione. Nonostante ciò il metodo era il migliore a disposizione nel 1990 e venne utilizzato per il sequenziamento del genoma o - per meglio dire - dei genomi. Infatti, furono richiesti 20 volontari per il progetto. Uno di questi genomi contribuì per il 70%, il restante venne suddiviso fra gli altri 19 campioni.

Dopo tredici anni di lavoro il genoma fu sequenziato per la maggior parte e l’avvenuto sequenziamento venne dichiarato nel 2003 e depositato in un database pubblico e consultabile da tutti con il codice identificativo: GRCh38. Dopo 3 miliardi di dollari spesi e 15 anni di lavoro (7) l’anno successivo - più precisamente il 21 ottobre 2004 - i risultati del sequenziamento e le modalità di controllo nella determinazione delle basi venne pubblicato su Nature a nome del Consorzio Internazionale per il sequenziamento del genoma umano.

L’articolo è una pietra miliare della medicina ed è alla base di tutta la successiva ricerca sul genoma in quanto riporta la qualità del sequenziamento delle basi. Consci dell’importanza del lavoro, gli autori affermarono che il sequenziamento del genoma sarebbe dovuto servire come “solide fondamenta per la ricerca biomedica dei decenni successivi”. E come vedremo lo è stato.

Tuttavia il lavoro non terminò nel 2003. Infatti, lo sforzo maggiore è stato completare definitivamente il sequenziamento che ha impegnato gli scienziati fino al 2022 (Nurk) (8) proprio perché lo studio delle parti rimanenti è stato quello più difficile. Inoltre, è solo del 2022 la pubblicazione del primo sequenziamento “dall’inizio alla fine” di un cromosoma umano, nello specifico il cromosoma X (Miga et Al.) (9).

1984-1986

Vengono organizzati una serie di incontri per valutare la fattibilità del progetto


1988

I National Institute of Health (NIH) riuniscono scienziati, amministratori ed esperti per il probabile progetto genoma umano


1988

Pubblicato il Memorandum of Understanding (Memorandum di Intesa) fra NIH e DOE per “coordinare la ricerca e le attività tecniche correlate al progetto genoma” a firma di James B. Wyngaardein (Direttore del NIH) e Robert O. Hunter direttore dell’ufficio di ricerca energetici - U.S. Department of Energy.
Il documento originale è visibile sul sito del progetto Genoma.


1989

HHS istituisce il National Center for Human Genome Research con direttore James D. Watson


1989-1990

NIH e DOE stabiliscono i principi etici, legali e le implicazioni sociali del progetto (ELSI)


1990

Inizio del progetto


1993

Francis S. Collins subentra come direttore al dimissionario J.D.Watson


1994

Viene pubblicata una mappa del linkage dettagliato del genoma.


1995

Viene pubblicata la prima mappa fisica del genoma umano


1996

Stesura dei "Bermuda principles" che incoraggiano la condivisione open ai dati


1999

Decodificata per la prima volta la sequenza di un cromosoma umano, il numero 22


2001

Viene pubblicata un'analisi iniziale del sequenziamento genomico


2003

Viene completato il progetto genoma umano


21 ottobre 2004

Viene pubblicato su Nature l’articolo con i risultati del sequenziamento.


Risultati, scoperte e avanzamenti

Come riportato nel documento “Understanding Our Genetic Inheritance” l’obiettivo del Progetto Genoma Umano era quello di scrivere il libro sul quale si sarebbe fondata la medicina del 21° secolo ed avrebbe permesso di comprendere non solo le patologie genetiche ma anche quelle multifattoriali. A venti anni dalla pubblicazione è quindi possibile ripercorrere una serie di avanzamenti resi possibili dal sequenziamento.

Primo fra tutti fu la scoperta che il numero di geni che codificano proteine non sono 100.000 come precedentemente ipotizzato - e poi ridimensionati a 35.000 - ma in realtà sono 20.000-25.000. In pratica, solo l’1,5% del DNA codifica proteine; una percentuale bassa rispetto ad altre specie viventi (Sana et al.) (18).

Percentuale di geni codificanti proteine in vari genomi
fonte: Sana et Al. (18)
Homo Sapiens1,4%
Caenorhabditis Elegans27%
Escherichia Coli86%


Il nostro DNA è per la maggior parte “non-coding” e per questo tale porzione venne definita “DNA spazzatura”. In realtà questa parte di DNA si è visto successivamente che non è spazzatura ma viene trascritto e svolge un ruolo importante e solo parzialmente compreso.

Il progetto genoma ha fornito quindi il catalogo dei geni e delle sequenze regolatorie che giocano un ruolo nello sviluppo, nella fisiologia e nella patologia (Taylor et Al) (10).

A partire da tale catalogo sono nati nuovi campi di studio come la proteomica, ovvero la disciplina che si occupa di identificare e quantificare le proteine espresse nei vari compartimenti biologici (organelli cellulari, organi, sangue) (Hood L.) (7). Da questo campo di ricerca sono scaturiti, fra gli altri, il progetto ENCODE (Frazer) (11) ed Roadmap Epigenomics.

La conoscenza del genoma ha permesso una velocizzazione della scoperta di mutazioni e  geni che sono implicate nelle malattie, incrementando notevolmente il database online delle malattie mendeliane, malattie monogeniche che possono essere trasmesse ai figli (Online Mendelian Inheritance in Men - OMIM). Un altro avanzamento è stato possibile nella identificazione di più di 500.000 fattori di rischio genetici comuni grazie a studi di associazione del genoma umano (GWAs). L’Human Genome Project ha avuto risvolti come la mappatura dei polimorfismi da singolo nucleotide (single nucleotide polymorphism - SNP) e che sono correlati ad alcune malattie.

Il know-how del progetto genoma ha permesso nel 2008 il primo sequenziamento del genoma del cancro e quindi l’identificazione delle mutazioni che possono essere sfruttate come target per le terapie personalizzate (Danovi) (12).

Il progetto genoma umano non ha impattato solo in campo genetico ma ha permesso di compiere notevoli passi avanti in termini di studio dell’evoluzione. Infatti, l’analisi dei genomi di molte specie ha permesso di dimostrare l’interconnessione con altre specie nell’albero genealogico della vita e dimostrando chiaramente la discendenza da un singolo ancestor (Hood) (7). Inoltre il sequenziamento dei genomi di altre specie di primati ha permesso la comprensione di quali siano le basi genetiche dello sviluppo delle caratteristiche di Homo Sapiens e quali interazioni con gli altri ominidi, come dimostrato dalla presenza di porzioni di DNA di Neanderthal. 

Il PGU ha inoltre stimolato lo sviluppo di approcci matematici e computazionali avanzati (Treangen et Al.) (13) e contribuito allo sviluppo di approcci multidisciplinari fra tipologie diverse di professionisti, in uno spirito di collaborazione che è spesso terreno fertile per lo sviluppo di idee e la risoluzione di problemi.

Non per ultimo l’importanza dell’ “open source” ovvero la possibilità di utilizzare liberamente i dati sviluppati ed i sistemi informatici per consentire a qualsiasi scienziato nel mondo di poter utilizzare il know-how ai fini dell’avanzamento della scienza e della ricerca. 

Sono stati sviluppati inoltre studi di correlazione tra genoma e sviluppo di patologie come per esempio il cancro. Nel prossimo futuro inoltre si prevede che la diffusione dello studio dei genomi individuali (Hood) (7) potrebbe portare alla tanto ambita medicina personalizzata ovvero ritagliata sulla specifica informazione genetica del singolo paziente. Il progetto genoma ha quindi delle potenziali conseguenze sulla pratica clinica e non solo, anche in termini di predizione, prevenzione, personalizzata, partecipativa (Hood) (7).

Il progetto genoma umano ha catalizzato anche una spinta tecnologica importante nel campo del sequenziamento genomico. In particolare ha portato allo sviluppo di tecnologie di sequenziamento di seconda generazione che permettono di studiare contemporaneamente sequenze di DNA molto più lunghe e quindi velocizzare il processo di studio del DNA (Shendure et Al) (14). La tecnologia in tale ambito ha continuato il suo sviluppo ed ha permesso di velocizzare il sequenziamento di interi genomi permettendo il sequenziamento in un solo giorno e la diagnosi di malattie genetiche in setting acuti (The Human Genome Project) ed a costi ridotti.

Considerando tutti questi avanzamenti, l’investimento iniziale nel progetto sembra del tutto ripagato ed a fronte di una spesa iniziale di circa 3.5 miliardi di dollari è stato stimato un ritorno di 800 miliardi di dollari (Hood) (7).

Quali sfide per il futuro?

Gli sforzi che la scienza dovrà affrontare nel campo della genomica sono molteplici.
Secondo alcuni autori dovrà essere mantenuto il focus sulla comprensione della biologia, sfruttando la genomica per la conoscenza delle malattie al fine di migliorare la salute ed implementando la sua applicazione nella pratica assistenziale. Inoltre, gli autori auspicano un incremento dei progetti di ricerca - soprattutto interdisciplinari - e che forniscano dati “open-science” disponibili per tutti (16)

I focus principali di ricerca dovrebbe interessare anche la correlazione tra genoma e fattori ambientali in termini di impatto sulla salute. Nella “visione” è ritenuta importante anche l’azione di alfabetizzazione della popolazione al fine di garantire una maggiore consapevolezza sulle decisioni legate alla genomica (17)

Le questioni etiche, legali e le implicazioni sociali legate al genoma sono ancora in via di studio e di definizione e richiederanno ulteriori sforzi di risoluzione in particolare nei campi della privacy, consenso informato (15).

Un altro aspetto è di tipo tecnico in particolare è necessario il superamento del “bias” dovuto alla caratterizzazione di un genoma di soli 20 soggetti. Questo limite è divenuto particolarmente noto in seguito alla scoperta che la lunghezza del DNA varia tra soggetti soggetti e che in uno studio di 910 discendenti africani erano presenti 296.5 milioni di basi di DNA che non erano state evidenziate precedentemente.

Pertanto una delle sfide del futuro è quella di sequenziare più genomi in modo da comprendere al meglio le varie sfumature genetiche dell’intera umanità (15). Questo obiettivo è stata accolto dal progetto Human Genome Project che si è posta come obiettivo il sequenziamento completo di 300 persone rappresentative della diversità umana.

Ti è piaciuto questo articolo? Supporta la nostra associazione: associati oppure effettua una donazione.
Il tuo sostegno è per noi importante!

DONA ORAASSOCIATI

Indietro

Perché gli Organismi Geneticamente Modificati sono utili

di F. Lucà

Le nostre scelte alimentari hanno un impatto diretto sull’ambiente. Uno studio della FAO ha…

La Cina è pronta a sfidare Trump

di L. Campisi

Il gigante asiatico si dichiara non intimorito dalle minacce americane. Oltre al patriottismo e alla…

Operazionalizzare l'etica nell'AI: criticità e prospettive

di I. Senatore

Sistemi di intelligenza artificiale sono già in uso in diversi ambiti che implicano decisioni ad…

Questo sito web utilizza i cookie

Utilizziamo i cookie per personalizzare i contenuti e gli annunci, fornire le funzioni dei social media e analizzare il nostro traffico. Inoltre forniamo informazioni sul modo in cui utilizzi il nostro sito ai nostri partner che si occupano di analisi dei dati web, pubblicità e social media, i quali potrebbero combinarle con altre informazioni che hai fornito loro o che hanno raccolto in base al tuo utilizzo dei loro servizi.