Il sequenziamento di terza generazione rappresenta, ad oggi, l’ultima frontiera del sequenziamento genomico. In questo articolo analizzeremo ed approfondiremo la tecnologia PacBio che, insieme alla tecnologia MinION, rappresenta una delle principali tecnologie del sequenziamento di terza generazione.
Caratteristiche generali
PacBio rappresenta come detto una delle tecnologie di terza generazione. Queste tecnologie, rispetto al sequenziamento Sanger e al Next generation sequencing o sequenziamento di seconda generazione, non utilizzano molecole di DNA amplificato, ma con esse è possibile sequenziare direttamente il campione, risparmiando del tempo nelle analisi del campione.
Funzionamento
Il sequenziamento tramite PacBio, definito anche “single-molecule, real-time sequencing“, si avvale dell’utilizzo di una DNA polimerasi di un batteriofago chiamato fago lambda 29, ad alta processività, capace di aggiungere 1000 pb/s (paia di basi al secondo). Questa alta processività permette di processare e sequenziare campioni di lunghezza notevole e questo rappresenta un vantaggio rispetto alle tecnologie di seconda generazione. Per il sequenziamento di un campione di nostro interesse, non amplificato, la reazione conterrà le seguenti componenti:
- DNA polimerasi ad alta processività,
- deossiribonucleotidi marcarti con fluorofori,
- Adattatori noti con il nome di “hairpin adapters” necessari per la formazione della nostra libreria di sequenziamento.
Procedimento
La reazione di sequenziamento avviene su di un chip noto con il nome di SMRT cell. Questo supporto è costituito da piccolissime unità di sequenziamento chiamate “ZeroMode Wave Guide” (ZMW). Ogni SMRT cell contiene all’incirca 150.000 ZMW (Fig. 1).
Tuttavia prima di procedere con il sequenziamento è necessario preparare le nostre librerie di sequenziamento. Il campione a doppio filamento, dopo che è stato frammentato, viene legato da specifici adattatori a singolo filamento definiti “hairpin“. Questi andranno poi a costituire la cosiddetta “SMRTbell“, ovvero una libreria costituita da una molecola di DNA circolare sulla quale la DNA polimerasi potrà poi agire.
Tipologie di lettura e sequenziamento
Le tipologie di lettura principali sono due e vengono esposte nella tabella di seguito:
Continuous long reads (CLRs) | Questa tipologia di lettura interessa librerie che abbiano un inserto con una lunghezza compresa tra i 30 – 100 Kb (Kilobasi). In questo caso la DNA polimerasi esegue uno o pochi giri di lettura. L’accuratezza della lettura si attesta intorno all’ 85 – 92% e si riscontrano problemi con gli omopolimeri, tuttavia permette di analizzare campioni di grandi dimensioni. |
Circular consensus sequencing (CCS) | Questa tipologia di lettura viene utilizzata per inserti che abbiano una grandezza compresa tra i 10 – 30 Kb (Kilobasi). A differenza della tipologia di lettura precedente la DNA polimerasi effettua più giri di lettura e questo permette di avere un’accuratezza che arriva fino al 99% e diminuisce il tasso di errore. |
All’interno di ogni unità è presente una DNA polimerasi ancorata al fondo, a questo vengono aggiunti dei deossiribonucleotidi marcati con fluorofori legati ai gruppi fosfato. Durante l’incorporazione dei deossiribonucleotidi al nostro campione, il fosfato viene tagliato e con esso anche il fluoroforo che rilascia un impulso di luce. Questo viene rilevato da uno specifico detector e il software le rielabora convertendole nella sequenza nucleotidica rispettiva (Fig. 2).
Il sequenziamento tramite PacBio di un campione richiede un tempo notevolmente inferiore compreso tra le 0,4 – 5 ore.
Limitazioni del sequenziamento tramite PacBio
La tecnologia PacBio ci permette di sequenziare campioni di notevole grandezza, tuttavia sono presenti alcune criticità. Il primo problema risiede proprio nella DNA polimerasi e nella sua elevata processività: alcune volte il detector non riesce infatti a registrare tutte le emissioni di fluorescenza che si verificano durante l’aggiunta dei deossiribonucleotidi. In effetti, la tipologia di lettura “continuous long reads” presenta un tasso di errore dell’ 11 – 15%. Tale problematica può essere risolta passando alla seconda tipologia di lettura che è stata descritta precedentemente. Infine un altro problema è il costo elevato di questa tecnologia.
Ismael Sanchez Polanco
Fonti
- “PacBio Sequencing and Its Applications” Anthony Rhoads, Kin Fai Au. Review. Genomics Proteomics Bioinformatics 13 (2015) 278–289
- https://www.pacb.com/
Fonti immagini
- https://www.openpr.com/news/1960467/global-single-molecule-real-time-sequencing-smrt-market
- https://blogs.oregonstate.edu/cgrb/2019/09/27/interview-pacific-biosciences-pacbio-sequel-service/