Currently viewing the tag: "PacBio"

Afficher l'image d'origineSi vous vous intéressez au séquençage haut-débit, que vous souhaitez avoir un panorama des diverses technologies à disposition et que vous êtes friands de schémas de principe: la publication de Sara Goodwin, John D. McPherson & W. Richard McCombie.  Cet article publié dans la revue Nature de mai 2016 promet de faire un retour en arrière sur 10 ans d’évolution du séquençage haut-débit. Elle parvient à tenir ses promesses et livre effectivement des schémas (avec la charte graphique « Nature ») très bien faits, très pédagogiques ! En outre, le tableau (Table 1 | Summary of NGS platforms) permet à tous les pourvoyeurs de projets nécessitant le recours à du séquençage, d’avoir un pense bête sous la main pour associer la bonne technologie à la question biologique qui leur incombe… Et comme vous êtes pressés, vous pourrez retrouver l’intégralité de cet article en vous promenant et cliquant sur l’image ci-dessous.

Sara_Goowdin et al

 

Le séquençage haut-débit voit cohabiter depuis quelques années deux générations de séquenceurs.

Au passage, une question Trivial Pursuit pour laquelle il faudra avoir un œil de caracal : quelqu’un sait quelle société a développé la première génération de séquenceurs haut-débit ? et quand ?

Les séquenceurs de deuxième génération se voient conditionnés sous forme de séquenceurs de paillasse (PGM de Ion Torrent, Miseq d’Illumina, GS-junior de Roche) permettant une démocratisation du séquençage, pendant que leurs grands frères pulvérisent la loi de Moore pour envisager un rendement (coût / Mb) toujours plus compétitif.

La large diffusion du séquençage de 3ème génération se laisse désirer laissant le champ libre à la génération précédente. Cet article vise à réaliser un court état des lieux du séquençage haut-débit de troisième génération :  un futur plus ou moins lointain, de nouvelles applications potentielles.

La question : séquenceurs de 3ème génération, l’âge de raison, c’est pour quand ? est l’interrogation qui a hanté l’AGBT 2013 marqué par le silence d’Oxford Nanopore. Cette année 2013 fut marquée par le retrait d’Illumina du capital de la société britannique : « Oxford Nanopore Technologies Ltd a annoncé la vente d’une participation détenue par son concurrent américain Illumina Inc., une étape vers la fin d’une relation pleine de conflits dans la course au développement des séquenceurs haut-débit permettant de séquencer plus rapidement et pour moins cher. »

Avant de caractériser ce que sont, seront, pourront être les 3ème générations de séquenceurs, commençons par un rapide tour des caractéristiques générales de leurs prédécesseurs et principalement de ce qui constitue leurs points faibles :

– la phase d’amplification clonale (réalisée par PCR) est source de biais (doublons, erreurs de PCR)

– les problèmes liés au déphasage engendrant une chute de la qualité le long du read produit (ce qui bride la production de reads vraiment longs)

-des reads courts  (de moins d’une centaine à environ 800 bases – vous l’aurez noté ce point est en partie une conséquence du précédent)

-des machines et des consommables onéreux

– des temps de run longs

Ainsi l’objectif principal des séquenceurs de 3ème génération est de palier les défauts de leurs aînés en produisant des reads plus longs, plus vite pour moins cher. Les séquenceurs de 2ème génération, quels que soient leurs modes de détection (mesure de fluorescence, mesure de pH) sont trop peu sensibles pour envisager la détection d’une simple molécule, d’un simple nucléotide : nécessairement la librairie doit être amplifiée, ce qui provoque des biais, des temps de préparation relativement longs et l’usage de consommables qui impacte le coût final de séquençage… assez rapidement la qualité chute plus vos reads s’allongent ce qui oblige à brider les tailles de reads que ces technologies sont capables de délivrer. En outre, travaillant sur une matrice qui est une copie de votre librairie initiale, l’information portée par les bases méthylées est perdue (ceci oblige à ajouter une phase de traitement au bisulfite qui peut être hasardeuse)

Actuellement l’une des seules technologies de 3ème génération réellement utilisée est celle de Pacific Biosciences (les hipsters disent « PacBio »). La firme, fondée en 2004, a lancé en 2010, son premier séquenceur de troisième génération le Pacbio RS basé sur une technique de séquençage SMRT  (Single Molecule Real Time sequencing.) Aujourd’hui la société Roche qui n’a pu absorber Illumina lors de son OPA, a investi 75 millions de USD, le 25 septembre 2013, pour co-développer des kits diagnostiques in vitro exploitant la technologie de PacBio.

La technologie de PacBio est aujourd’hui exploitée pour réaliser du séquençage de novo de petits génomes :

Avec ces 200 à 300 Mb délivrés par SMRT-cell, séquencer des organismes eucaryotes supérieurs demande un investissement important, malgré tout, cette technologie délivrant des reads de plusieurs milliers de bases, permet d’envisager une diminution du nombre de contigs obtenus par les seules stratégies reads-courts / gros débit.

Face à la technologie proposée par PacBio, d’autres technologies essaient d’émerger pour arriver à occuper le marché du séquençage de 3ème génération :

– La combinaison détection optique et multipore est une voie envisagée pour le séquençage de 3ème génération avec le travail mené par NobleGen biosciences.

– L’imagerie directe de l’ADN

Le microscope électronique offre une résolution possible jusqu’à 100 pm, de sorte que les biomolécules et les structures microscopiques tels que des virus, des ribosomes, des protéines, des lipides, des petites molécules et des atomes même simples peuvent être observés. Bien que l’ADN est visible lorsqu’on l’observe avec un microscope électronique, la résolution de l’image obtenue n’est pas suffisamment élevée pour permettre le déchiffrement de la séquence, c’est à dire, le séquençage de l’ADN. Cependant, lors du marquage différentiel des bases de l’ADN avec des atomes lourds ou des métaux, un tel séquençage devient possible.

Le séquençage à l’aide de transistor (Transistor-mediated DNA sequencing– une technologie développée par IBM)

Architecture of the DNA Transistor

Dans le système conceptualisé par IBM, l’ADN est contraint de passer par le pore à cause de la tension électrique subie, la vitesse de passage de la molécule à séquencer est maîtrisée à l’aide de contacts métalliques à l’intérieur du nanopore. La lecture des bases serait réalisée lors du passage de l’ADN simple brin au travers du pore (ça rappelle quelque chose…)

– Et Oxford Nanopore dans tout cela ? Si la société anglaise a annoncé la vente de la participation d’Illumina, elle a marqué l’année 2013 par son silence assourdissant. Passé l’oxymore, en cette fin d’année, coup de poker ou réel lancement, Oxford Nanopore propose un programme d’accès à sa technologie Minion où pour 1000 USD, il est possible de postuler à l’achat des clés USB de séquençage.


La stratégie d’Oxford Nanopore est basée, en partie, sur la possible démocratisation du séquençage de 3ème génération, elle s’oppose à celle de PacBio qui mise sur son arrivée précoce sur le secteur du séquençage haut-débit : décentralisation contre l’inverse. En clair, l’investissement d’un PacBio est tel que l’outil est réservé à des centres, des prestataires de services pouvant assumer cet investissement, ce qui oblige à centraliser les échantillons pour les séquencer, contre les produits (encore en développement) d’Oxford Nanopore dont la promesse est : le séquençage pour tous (ou presque).

PacBio revendique sa participation à un projet qui consiste à doubler la quantité de génomes bactériens « terminés » (actuellement de 2384) en quelques mois.

En cliquant ci-dessus sur la représentation graphique qui illustre la différence de plasticité de génome entre le génome d’une Bordetella pertussis (l’agent pathogène responsable de la coqueluche) et celui d’Escherichia coli, un poster vous apparaîtra. Ce dernier reprend les caractéristiques de l’utilisation de la technologie de PacBio à des fins d’assemblage de novo de génomes bactériens par une stratégie non-hybride (seuls des reads de PacBio sont utilisés). Les résultats sont assez bluffants, la longueur des reads de PacBio permet un assemblage complet (au prix de plusieurs SMRT cells tout de même !), de génomes bactériens « difficiles » tel que celui de Bordetella pertussis connu pour posséder un GC % relativement élevé (environ 65 %) ainsi que de nombreux éléments transposables. Les génomes possédant de nombreux éléments répétés posent de grandes difficultés d’assemblage, c’est un des arguments qui permet à PacBio de positionner sa technologie actuellement… en quelques mois les stratégies hybrides (reads courts générés par des séquenceurs de 2ème génération) ont laissé place aux stratégies non-hybrides où le séquençage PacBio se suffit à lui-même.

Le réseau régional d’ingénieurs en bioinformatique de Lille et le PPF bioinformatique vous convient à une conférence :

Mercredi 28 novembre 2012, 10h30-12h, Amphithéâtre de l’Institut de Biologie de Lille, 1, rue du Pr Calmette, LILLE.

Comment diversifier les données de séquençage à haut débit pour optimiser la bioinformatique ?

Les stratégies hybrides PacBio & Roche 454/Illumina HiSeq

– Dr Christophe Meynier et Sabrina Benoussaidh – GATC Biotech France & Belgique.

« Les nouvelles technologies de séquençage (NGS) ont permis d’améliorer drastiquement la caractérisation des génomes avec la génération de séquence en haut débit et ce à faible coût. Malgré cela, l’assemblage d’un génome reste souvent problématique et diffère en fonction des technologies utilisées. En effet la qualité d’un assemblage de novo est influencée par différents facteurs inhérent à la structure intrinsèque du génome et en parallèle à la longueur des fragments, au nombre de séquences et à la qualité de ces dernières. La technologie PacBio RS fournit les plus longues séquences jamais obtenues (3500 bases en moyenne) ce qui simplifie et améliore la création de contigs.

Des études ont montré qu’en corrigeant les séquences générées par le PacBio RS avec des données issues de secondes générations de séquenceurs (Roche 454, HiSeq), nous optimisons alors les avantages de chacune de ces technologies (couverture, fiabilité des bases et longueurs des séquences). En diminuant le nombre de contigs tout en augmentant leurs tailles, les chercheurs ont désormais les outils pour obtenir des assemblages de génomes plus rapidement, à moindre coûts ou pour obtenir des informations sur des génomes partiellement séquencés jusque-là disponibles uniquement manuellement (via PCR ou marche sur l’ADN). Notre présentation montre des résultats d’assemblages obtenus avec différentes technologies, les compare et démontre l’intérêt d’association de technologies ensemble. En outre, nous discuterons également des technologies Illumina HiSeq 2000 et Roche 454 au travers d’applications spécifiques telles que le reséquençage de génomes entiers, le séquençage de transcriptomes (RNAseq) et le ChipSeq. »

Ce post fait naturellement suite à celui dédié à la seconde génération de séquenceurs multi-parallélisés, et conserve la même approche, à savoir un tour d’horizon des technologies et une évocations des informations générales sur le sujet.

A l’instar du PGM de Ion torrent mis sur le marché depuis un an (10Mb – reads 100b – 06.2011 / 100Mb – reads 200b -11.2011 / 1Gb – reads 400b – prévu début 2012), la seconde génération de séquenceurs haut débit tend vers une production de reads de plus en plus longs et de moins en moins chère. Toutefois, on est en droit de se demander quelle sera leur pérennité face à la 3éme génération répondant à un cahier des charges assez similaire et la possibilité de bénéficier de nouvelles applications.

 

Le principe de la 3ème génération peut être symbolisé par le séquençage d’une molécule d’ADN sans étape de pré-amplification (contrairement à la génération actuelle type 454 Roche, SOLiD Life technologie, Ion Proton, PGM Ion torrent, HiSeq Illumina, …) en conservant l’incorporation de nucléotides, par cycles ou non ( dans ce dernier cas, le terme de « Séquençage d’ADN simple molécule en temps réel » est approprié).

Les technologies « SMS » pour « Single Molecule Sequencing » peuvent être regroupées selon trois catégories:

– Technologies de séquençage en temps réel impliquant la synthèse du brin d’ADN complémentaire via une ADN polymérase.

– Technologies de séquençage par détection des bases successives d’une molécule d’ADN au travers de nanopores.

– Technologies de séquençage basées sur des techniques de microscopie.

En combinant les dernières avancées dans la nanofabrication, la chimie de surface et l’optique, Pacific Biosciences (Pacbio RS) a lancé une plateforme technologique puissante appelée technologie de molécule unique en temps réel, ou « SMRT » pour « Single Molecule Real-time sequencing ». Parmi ses concurrents directs, Helicos Biosciences (Helicos) qualifié  « tSMS » pour « True Single Molecule Sequencing ». Malgré le recours à une technologie analogue, la mention « Temps réel » auquel il échappe est simplement liée à une incorporation cyclique des nucléotides fluorescents.

D’autres technologies, à des degrés de développement plus ou moins avancé, sont dans les tuyaux et qui sait de Noblegen, Starlight, Cracker Bio, NABSys, Halcyon, ou autres…  révolutionnera encore un peu plus cet univers du haut débit et suivra le chemin emprunté dernièrement par Oxford Nanopore

 

Chaque année depuis 13 ans, l’AGBT (Advances in Genome Biology and Technology) rassemble les fournisseurs de technologies de pointe, quelques « maîtres » en la matière venant dispenser des cours du soir (sorte de « master-class ») et beaucoup de scientifiques essentiellement Nord-Américains. En effet, cette grande messe de la biologie haut-débit a lieu à Marco Island, île de Floride, lieu de villégiature pour retraités liftés percevant leurs fonds de pension sous forme de rente viagère.

La Côte Est américaine accueille les grandes entreprises de biotechnologies de la côte opposée pour démontrer que la Californie avec des sociétés telles que Illumina, Life technologies, Roche, Pacific Biosciences, Agilent… reste le meilleur fournisseur de technologies de pointes pour les gros centres de recherches situés sur la Côté Est (NIH, MIT-Broad Institute, Yale…). La Côte Est héberge les deux tiers des séquenceurs haut débit nord-américains. Depuis quatre ans, il faut bien le dire l’AGBT consacre le séquençage haut-débit, technologie qui vampirise la plupart des présentations (n’oublions pas que la jeune société PacBio sponsor principal, vend des séquenceurs…) et sessions « workshop »… au détriment de technologies plus « anciennes » (les puces à ADN par exemple). On le sait, ce type de rassemblements adoube la nouveauté et consacre ce que, parfois, hâtivement, on nomme : innovation.

Bien que ces rassemblements endogames sont critiquables, ils constituent une tribune pour les principaux axes de développements des technologies appliquées au vivant. L’AGBT est un tremplin dont se servent un grand nombre de firmes californiennes pour annoncer des lancements de machines à générer de la séquence. Cet évènement très américanocentré n’a pas de réel pendant européen, malgré les différentes formes prises par des rassemblements tels que le « carrefour des biotechnologies » remplacé par l’Eurobio-event. L’Eurobio-event sorte de biennale  biotech’ où l’on trouve rassemblés beaucoup de vendeurs de robotiques, de pipettes… beaucoup de conférences traitant du business, de l’investissement dans les biotechnologies plus que des biotechnologies en tant que technologies. Assez peu de science dans Eurobio-event, beaucoup de business.

L’AGBT oscille quant à elle, entre un monde de scientifiques avide de nouvelles méthodes visant à l’exploitation rationnelle des flots de données issues de la biologie haut-débit (ce que représente l’illustration ci-dessus) et un monde de vendeurs de solutions appliquées à la recherche en biologie – quand les uns partagent un même « problème » et réfléchissent à une solution optimale pour sortir du sens biologique d’un amas de données, les autres vendent les générateurs de « problèmes » en misant sur la communauté scientifique mondiale pour apporter la réponse aux nouveaux problèmes générés. Il s’agit de trier l’information émanant de ce type de rassemblements en n’oubliant pas que cette vitrine – telle que peut l’être l’AGBT ou tout autre évènement de cette ampleur – peut parfois être un mirage scientifique plus qu’un virage technologique…

L’AGBT cette année 2012 aura lieu du 15 au 18 février sur l’île Marco Island : http://agbt.org/about.html, on y parlera de la technologie de Pacific Biosciences (des retours sur expériences sont prévus, avec leur 15 % de taux d’erreur de séquençage, il s’agit de LA déception technologique de l’année, mais PacBio est aussi LE sponsor principal de la réunion, quel suspens !), on y parlera aussi du futur Ion Proton

Set your Twitter account name in your settings to use the TwitterBar Section.