Le séquençage de génome entier ou « Whole-Genome-Sequencing » (WGS) est souvent cité dans les brèves du BuSCA. Cette technique récente a amélioré l’investigation des épidémies, l’attribution de source et l’évaluation des risques alimentaires liés aux micro-organismes pathogènes.
Depuis l’avènement des nouvelles techniques de séquençage haut débit (NGS), il est maintenant possible d’analyser rapidement et à moindre coût le génome complet (WGS) d’un micro-organisme avec une très grande définition, améliorant ainsi la précision et la résolution du typage des agents pathogènes. L’exploitation des données issues du WGS, combinée aux enquêtes épidémiologiques, fournit des informations sur l’évolution génétique d’une souche dans un contexte épidémique et permet de regrouper les cas entre eux et d’identifier rapidement un aliment suspect.
Avant l’apparition du séquençage haut débit, dans les années 2000, il existait d’autres méthodes de caractérisation phénotypique et/ou génotypique des micro-organismes [1]. Parmi les plus utilisées peuvent être citées le sérotypage, l’électrophorèse champs pulsé (PFGE) ou le séquençage de gènes ciblés (MultiLocus Sequence Typing, MLST).
Deux approches sont habituellement utilisées pour analyser les données de WGS : i) l’analyse du polymorphisme nucléotidique (SNP) ou ii) le typage (cg- ou wg-) MLST. Par rapport au MLST classique pour lequel un nombre limité de gènes (6 ou 7) est considéré, le WGS permet de comparer les variations génétiques du core-génome (partie conservée du génome) (cgMLST) ou du génome entier (wgMLST), soit plusieurs centaines ou milliers de gènes. Le choix de la méthode d’analyse des séquences dépend de l’objectif poursuivi, de l’espèce ou du genre considéré. En général, les approches basées sur l’analyse des SNPs sont plus discriminantes que les approches dites « gène par gène » (cg- ou wg-MLST). Ces analyses génèrent plusieurs types de données (données brutes, profils alléliques, assemblages) stockées dans des bases de données publiques ou privées [2]. Grâce à ces données, les gènes de résistance aux antibiotiques et ceux expliquant la virulence des agents pathogènes peuvent également être rapidement identifiés. Depuis 2013, entre 11 000 et 18 000 articles scientifiques discutent de l’utilisation du séquençage haut débit pour l’identification, l’investigation ou la prévention des épidémies d’origine alimentaire [3]. Un nombre croissant de pays utilisent en routine cette technologie principalement pour l’investigation des épidémies d’origine bactérienne. La plupart des organisations sanitaires nationales et internationales (EFSA, FDA, CDC, OMS) recommandent l’utilisation des données de WGS en routine, notamment pour la surveillance de Salmonella, E. coli et Listeria [2],[4],[5],[6] mais il n’existe pas de méthodes normalisées officielles, ni d’exigences réglementaires.
Assurer la qualité et la robustesse des analyses de données après le séquençage est encore un véritable challenge en terme d’harmonisation des protocoles, pipelines analytiques et solutions informatiques. Au niveau Européen, l’EFSA et l’ECDC ont intégré ces contraintes et ont produit un avis conjoint récent [7]. Au niveau international, le Global Microbial Identifier (GMI), consortium de plus de 270 scientifiques issus de 55 pays, promeut la mise en place d’un système mondial de bases de données d’ADN génomique pour l'identification et le diagnostic des maladies infectieuses. Pour mettre en place un tel système, une approche coordonnée et standardisée entre les différentes agences sanitaires internationales est nécessaire [7]. Cette approche doit comprendre une harmonisation des protocoles, des analyses bio-informatiques et des paramètres de qualité. Le GMI propose ainsi des « programmes d’essais d’aptitude » réguliers aux laboratoires et travaille à la production de recommandations et protocoles harmonisés.
La surveillance de la chaîne alimentaire nécessite aussi l’intégration des métadonnées fournies par les enquêtes épidémiologiques (source, caractéristiques cliniques, date, environnement, etc.). Ces métadonnées, indispensables pour l’investigation et la compréhension des épidémies et l’évaluation des risques microbiens, devraient être également intégrées aux bases de données. Le WGS permet d’enrichir et de conforter les informations issues des enquêtes épidémiologiques, il ne peut en aucun cas les remplacer. Une analyse complète des coûts et des bénéfices liés à l’utilisation systématique du WGS dans le domaine de la sécurité sanitaire des aliments n’est pas encore disponible car une telle évaluation dépend du niveau d’équipement et du besoin de chaque pays [5]. Même si le coût du séquençage et du stockage des données a largement diminué ces dernières années, les coûts liés au passage du PFGE au WGS ont été estimés entre 100 000 $ US et 700 000 $ US, par laboratoire, aux États-Unis, selon le débit d'isolats [5]. Cependant une analyse canadienne plus globale a montré que l’utilisation du WGS, en remplacement de plusieurs méthodes de typage, pourrait réduire de 5,21 millions à 90,25 millions de dollars par an le coût global de la prise en charge des soins de santé liés aux cas de salmonellose [8].