Currently viewing the tag: "2ème et 3ème génération de séquenceurs"

Le séquençage haut-débit voit cohabiter depuis quelques années deux générations de séquenceurs.

Au passage, une question Trivial Pursuit pour laquelle il faudra avoir un œil de caracal : quelqu’un sait quelle société a développé la première génération de séquenceurs haut-débit ? et quand ?

Les séquenceurs de deuxième génération se voient conditionnés sous forme de séquenceurs de paillasse (PGM de Ion Torrent, Miseq d’Illumina, GS-junior de Roche) permettant une démocratisation du séquençage, pendant que leurs grands frères pulvérisent la loi de Moore pour envisager un rendement (coût / Mb) toujours plus compétitif.

La large diffusion du séquençage de 3ème génération se laisse désirer laissant le champ libre à la génération précédente. Cet article vise à réaliser un court état des lieux du séquençage haut-débit de troisième génération :  un futur plus ou moins lointain, de nouvelles applications potentielles.

La question : séquenceurs de 3ème génération, l’âge de raison, c’est pour quand ? est l’interrogation qui a hanté l’AGBT 2013 marqué par le silence d’Oxford Nanopore. Cette année 2013 fut marquée par le retrait d’Illumina du capital de la société britannique : « Oxford Nanopore Technologies Ltd a annoncé la vente d’une participation détenue par son concurrent américain Illumina Inc., une étape vers la fin d’une relation pleine de conflits dans la course au développement des séquenceurs haut-débit permettant de séquencer plus rapidement et pour moins cher. »

Avant de caractériser ce que sont, seront, pourront être les 3ème générations de séquenceurs, commençons par un rapide tour des caractéristiques générales de leurs prédécesseurs et principalement de ce qui constitue leurs points faibles :

– la phase d’amplification clonale (réalisée par PCR) est source de biais (doublons, erreurs de PCR)

– les problèmes liés au déphasage engendrant une chute de la qualité le long du read produit (ce qui bride la production de reads vraiment longs)

-des reads courts  (de moins d’une centaine à environ 800 bases – vous l’aurez noté ce point est en partie une conséquence du précédent)

-des machines et des consommables onéreux

– des temps de run longs

Ainsi l’objectif principal des séquenceurs de 3ème génération est de palier les défauts de leurs aînés en produisant des reads plus longs, plus vite pour moins cher. Les séquenceurs de 2ème génération, quels que soient leurs modes de détection (mesure de fluorescence, mesure de pH) sont trop peu sensibles pour envisager la détection d’une simple molécule, d’un simple nucléotide : nécessairement la librairie doit être amplifiée, ce qui provoque des biais, des temps de préparation relativement longs et l’usage de consommables qui impacte le coût final de séquençage… assez rapidement la qualité chute plus vos reads s’allongent ce qui oblige à brider les tailles de reads que ces technologies sont capables de délivrer. En outre, travaillant sur une matrice qui est une copie de votre librairie initiale, l’information portée par les bases méthylées est perdue (ceci oblige à ajouter une phase de traitement au bisulfite qui peut être hasardeuse)

Actuellement l’une des seules technologies de 3ème génération réellement utilisée est celle de Pacific Biosciences (les hipsters disent « PacBio »). La firme, fondée en 2004, a lancé en 2010, son premier séquenceur de troisième génération le Pacbio RS basé sur une technique de séquençage SMRT  (Single Molecule Real Time sequencing.) Aujourd’hui la société Roche qui n’a pu absorber Illumina lors de son OPA, a investi 75 millions de USD, le 25 septembre 2013, pour co-développer des kits diagnostiques in vitro exploitant la technologie de PacBio.

La technologie de PacBio est aujourd’hui exploitée pour réaliser du séquençage de novo de petits génomes :

Avec ces 200 à 300 Mb délivrés par SMRT-cell, séquencer des organismes eucaryotes supérieurs demande un investissement important, malgré tout, cette technologie délivrant des reads de plusieurs milliers de bases, permet d’envisager une diminution du nombre de contigs obtenus par les seules stratégies reads-courts / gros débit.

Face à la technologie proposée par PacBio, d’autres technologies essaient d’émerger pour arriver à occuper le marché du séquençage de 3ème génération :

– La combinaison détection optique et multipore est une voie envisagée pour le séquençage de 3ème génération avec le travail mené par NobleGen biosciences.

– L’imagerie directe de l’ADN

Le microscope électronique offre une résolution possible jusqu’à 100 pm, de sorte que les biomolécules et les structures microscopiques tels que des virus, des ribosomes, des protéines, des lipides, des petites molécules et des atomes même simples peuvent être observés. Bien que l’ADN est visible lorsqu’on l’observe avec un microscope électronique, la résolution de l’image obtenue n’est pas suffisamment élevée pour permettre le déchiffrement de la séquence, c’est à dire, le séquençage de l’ADN. Cependant, lors du marquage différentiel des bases de l’ADN avec des atomes lourds ou des métaux, un tel séquençage devient possible.

Le séquençage à l’aide de transistor (Transistor-mediated DNA sequencing– une technologie développée par IBM)

Architecture of the DNA Transistor

Dans le système conceptualisé par IBM, l’ADN est contraint de passer par le pore à cause de la tension électrique subie, la vitesse de passage de la molécule à séquencer est maîtrisée à l’aide de contacts métalliques à l’intérieur du nanopore. La lecture des bases serait réalisée lors du passage de l’ADN simple brin au travers du pore (ça rappelle quelque chose…)

– Et Oxford Nanopore dans tout cela ? Si la société anglaise a annoncé la vente de la participation d’Illumina, elle a marqué l’année 2013 par son silence assourdissant. Passé l’oxymore, en cette fin d’année, coup de poker ou réel lancement, Oxford Nanopore propose un programme d’accès à sa technologie Minion où pour 1000 USD, il est possible de postuler à l’achat des clés USB de séquençage.


La stratégie d’Oxford Nanopore est basée, en partie, sur la possible démocratisation du séquençage de 3ème génération, elle s’oppose à celle de PacBio qui mise sur son arrivée précoce sur le secteur du séquençage haut-débit : décentralisation contre l’inverse. En clair, l’investissement d’un PacBio est tel que l’outil est réservé à des centres, des prestataires de services pouvant assumer cet investissement, ce qui oblige à centraliser les échantillons pour les séquencer, contre les produits (encore en développement) d’Oxford Nanopore dont la promesse est : le séquençage pour tous (ou presque).

PacBio revendique sa participation à un projet qui consiste à doubler la quantité de génomes bactériens « terminés » (actuellement de 2384) en quelques mois.

En cliquant ci-dessus sur la représentation graphique qui illustre la différence de plasticité de génome entre le génome d’une Bordetella pertussis (l’agent pathogène responsable de la coqueluche) et celui d’Escherichia coli, un poster vous apparaîtra. Ce dernier reprend les caractéristiques de l’utilisation de la technologie de PacBio à des fins d’assemblage de novo de génomes bactériens par une stratégie non-hybride (seuls des reads de PacBio sont utilisés). Les résultats sont assez bluffants, la longueur des reads de PacBio permet un assemblage complet (au prix de plusieurs SMRT cells tout de même !), de génomes bactériens « difficiles » tel que celui de Bordetella pertussis connu pour posséder un GC % relativement élevé (environ 65 %) ainsi que de nombreux éléments transposables. Les génomes possédant de nombreux éléments répétés posent de grandes difficultés d’assemblage, c’est un des arguments qui permet à PacBio de positionner sa technologie actuellement… en quelques mois les stratégies hybrides (reads courts générés par des séquenceurs de 2ème génération) ont laissé place aux stratégies non-hybrides où le séquençage PacBio se suffit à lui-même.

Le réseau régional d’ingénieurs en bioinformatique de Lille et le PPF bioinformatique vous convient à une conférence :

Mercredi 28 novembre 2012, 10h30-12h, Amphithéâtre de l’Institut de Biologie de Lille, 1, rue du Pr Calmette, LILLE.

Comment diversifier les données de séquençage à haut débit pour optimiser la bioinformatique ?

Les stratégies hybrides PacBio & Roche 454/Illumina HiSeq

– Dr Christophe Meynier et Sabrina Benoussaidh – GATC Biotech France & Belgique.

« Les nouvelles technologies de séquençage (NGS) ont permis d’améliorer drastiquement la caractérisation des génomes avec la génération de séquence en haut débit et ce à faible coût. Malgré cela, l’assemblage d’un génome reste souvent problématique et diffère en fonction des technologies utilisées. En effet la qualité d’un assemblage de novo est influencée par différents facteurs inhérent à la structure intrinsèque du génome et en parallèle à la longueur des fragments, au nombre de séquences et à la qualité de ces dernières. La technologie PacBio RS fournit les plus longues séquences jamais obtenues (3500 bases en moyenne) ce qui simplifie et améliore la création de contigs.

Des études ont montré qu’en corrigeant les séquences générées par le PacBio RS avec des données issues de secondes générations de séquenceurs (Roche 454, HiSeq), nous optimisons alors les avantages de chacune de ces technologies (couverture, fiabilité des bases et longueurs des séquences). En diminuant le nombre de contigs tout en augmentant leurs tailles, les chercheurs ont désormais les outils pour obtenir des assemblages de génomes plus rapidement, à moindre coûts ou pour obtenir des informations sur des génomes partiellement séquencés jusque-là disponibles uniquement manuellement (via PCR ou marche sur l’ADN). Notre présentation montre des résultats d’assemblages obtenus avec différentes technologies, les compare et démontre l’intérêt d’association de technologies ensemble. En outre, nous discuterons également des technologies Illumina HiSeq 2000 et Roche 454 au travers d’applications spécifiques telles que le reséquençage de génomes entiers, le séquençage de transcriptomes (RNAseq) et le ChipSeq. »

Le représentant européen des séquenceurs haut-débit de troisième génération, Oxford Nanopore va communiquer à l’AGBT… dans quelques jours. La société en profitera pour annoncer la commercialisation de ses premières machines permettant de séquencer en 24 heures un génome humain pour moins de 1000 $ (soit le même prix qu’un génome humain séquencé par un Ion Proton en 2 heures sur une plateforme de deuxième génération).

Oxford Nanopore souhaite commercialiser sa machine (en direct) avant la fin 2012. Un réelle course a lieu, puisqu’à cette échéance sera commercialisé le Ion Proton. Nous assisterons donc avant fin 2012 a un chevauchement technologique où 2ème et 3ème générations de séquenceurs risquent de se télescoper… les scientifiques en cours d’élaboration de dossiers de demandes de financements devront (vite) choisir leur camp… : partir sur une technologie qui a d’ores-et-déjà fait ses preuves (Ion Proton) donc de 2ème génération ou une technologie de 3ème génération totalement innovante… mais dont on ne possède pas de retour indépendant sur la qualité des données générées. La « guerre » technologique est lancée entre le transfuge de Solexa (technologie des séquenceurs Illumina), John Milton, le responsable scientifique d’Oxford Nanopore et la biotech’ rock-star Jonathan Rothberg, responsable scientifique de Ion Torrent chez Life Technologies.

Set your Twitter account name in your settings to use the TwitterBar Section.