Il sequenziamento del genoma come tecnica biotecnologica di sintesi
Grazie alle tecnologie biotecnologiche il sequenziamento del genoma di una specie oggi non è più un’impresa titanica come fu a suo tempo il Progetto Genoma Umano. Era il 1977 quando si riuscì per la prima volta a pubblicare per intero il genoma di un virus, ovvero il batteriofago ΦX174, sulle pagine della nota rivista Nature. Il metodo usato allora è presente su tutti i testi universitari di Biologia Molecolare.
Prima di addentrarci nelle tecniche che rendono possibile questo processo è il caso di chiarire il significato di “sequenziare” in ambito biologico. Non si tratta di un termine riferito solo al DNA, perché significa semplicemente determinare l’ordine corretto dei monomeri che formano un polimero. Quindi si può sequenziare anche una proteina.
Vediamo ora in dettaglio il sequenziamento del genoma.
Cosa si intende con sequenziamento del genoma
Parlare di DNA e di genoma non è la stessa cosa anche se molti tendono a unificare questi due concetti. Il primo termine indica in forma generale l’acido nucleico che va a formare i cromosomi, mentre il secondo è l’insieme delle sequenze di nucleotidi di un organismo. nel caso degli eucarioti quindi tutte quelle contenute nel nucleo di una cellula somatica.
L’estensione varia a seconda delle specie considerate, visto che i batteri hanno un unico cromosoma circolare, mentre un umano 46 coppie. Dal sequenziamento del genoma umano è risultato che ci sono circa 25.000 geni, mentre il resto del DNA consiste in sequenze ripetute e che non codificano per proteine. Per la precisione circa il 97%.
Per rappresentare il patrimonio genetico si ricorre a una rappresentazione chiamata mappa genetica. Si tratta di uno schema che riporta la distanza che separa i geni. Per stimarla si ricorre alla frequenza con cui i geni passano da una generazione all’altra e quando se questi risultino o meno associati fra di loro.
Naturalmente ci sono anche altri fattori di cui tenere conto, tra cui per esempio il crossing-over che porta a ricombinazione genetica negli eucarioti. Nei procarioti invece serve valutare la presenza di fenomeni di coniugazione (passaggio di sequenze genetiche fra batteri) e di trasformazione.
La genomica e il metodo Sanger
Per eseguire il sequenziamento del DNA ci sono due metodologie principali che si sono dimostrate efficaci. Anche se la tecnologia che usano è diversa entrambe sfruttano la sintesi di un filamento complementare al frammento che si sta leggendo. Vediamole di seguito:
- Il metodo Sanger, il primo mai utilizzato a questo scopo. Sfrutta un primer per far partire la reazione di sintesi, portata avanti da una DNA polimerasi e un pool di desossinucleotidi precursori, uno per ogni base azotata (dATP, dTTP, dGTP e dCTP). Durante questa reazione si formano diverse molecole di DNA stampo di lunghezze diverse.
- Il metodo Next Generation Sequencing (NGS). L’arrivo di nuove tecnologie ha permesso di velocizzare il sequenziamento del genoma, perché a ogni ciclo si producono migliaia di filamenti complementari alla sequenza presa come stampo Le sequenze sintetizzate sono le reads, che poi si possono assemblare per ricostruire la successione di nucleotidi originale.
Come si esegue il sequenziamento di un genoma con l’NGS
I segnali luminosi che si susseguono in base all’intensità indicano una base azotata diversa. Il nome di questa tecnica di sequenziamento del genoma deriva dal fatto che l’apparecchio era prodotto dall’azienda 454, ora inglobata all’interno della Roche. La tecnologia nel tempo si è evoluta, ma il suo punto debole rimangono gli errori di lettura quando ci sono nucleotidi ripetuti.
Per quanto riguarda invece il metodo Illumina/Solexa, si tratta di un processo articolato in 4 fasi. Per prima cosa si frantuma il DNA in sequezne non più lunghe di 600 paia di basi, dopodiché lo si denatura e si esegue un’amplificazione. Il terzo passaggio prevede di passare a sequenziare con la sintesi di un filamento complementare usando nucleotidi marcati con la fluorescenza.
Si ottegono quattro tipi di sequenze complementari, che nell’ultimo step del metodo sono ordinate in cluster per ricavare quali fra di loro siano contigue nel DNA. Illumina/Solexa sintetizza a ogni ciclo milioni di frammenti di DNA e il 90% dei dati relativi ai genomi disponibili oggi deriva proprio da questo sistema. Esistono più piattaforme, da usare in base a quanto un genoma risulti esteso.