banner

ニュース

Nov 15, 2023

SARS の 3 つの次世代シーケンス手順の ISO15189 検証および認定のための最小限の要件

Scientific Reports volume 13、記事番号: 6934 (2023) この記事を引用

774 アクセス

1 オルトメトリック

メトリクスの詳細

新型 SARS-CoV-2 株 (変異体) の急速かつ反復的な感染拡大により、世界中の公衆衛生当局が懸念される変異株の循環を監視するための監視ネットワークの構築を促しています。 次世代シーケンス技術の使用により、臨床検査室で求められる品質管理評価の必要性が高まっています。 本研究は、ISO15189規格を満たす3つの異なるNGS法を使用したSARS-CoV-2タイピングの検証ガイドを初めて提案したものである。 これらには、メソッドのリスク、特異性、精度、再現性、再現性の評価が含まれます。 使用された 3 つの方法のうち、2 つは Oxford Nanopore Technologies の逆転写ポリメラーゼ連鎖反応 (Artic v3 および Midnight v1) を使用するアンプリコンベースであり、3 つ目の方法は Illumina テクノロジーの逆補体ポリメラーゼ連鎖反応 (Nimagen) を使用するアンプリコンベースです。 すべての方法が、臨床現場における SARS-CoV-2 タイピングの品質要件 (精度、再現性、再現性に関して 100% 一致するタイピング結果) を満たしていることがわかりました。 さらに、3 つの配列決定法のそれぞれから得られたタイピング結果は、3 つの広く知られている命名法 (WHO、Pangolineage、および Nextclade) を使用して比較されました。 一塩基変異に関しても比較した。 結果は、臨床現場での分析の対象基準を満たさないサンプルに対してより質の高い結果を提供するため、Artic v3 と Nimagen がアウトブレイク調査に特権的に与えられるべきであることを示しました。 この研究は、医療機器および体外診断用の新しい欧州規制に関連して、研究室で開発された NGS 検査の検証に向けた第一歩です。

コロナウイルスはエンベロープを持った一本鎖 RNA ウイルスで、哺乳類や鳥類に広く分布しており、呼吸器感染症を含む幅広い疾患を引き起こします。 これらのウイルスは、遺伝的多様性が高く、遺伝子組み換えや突然変異を起こす高い能力を持っています 1,2。 2019年末、SARS-CoV-2と呼ばれるコロナウイルスサブファミリーの新たなメンバーが中国(武漢)で初めて検出され、その後に起こった前例のない世界的パンデミックの原因となった。 他の RNA ウイルスと比較して突然変異の頻度が低い 3 にもかかわらず、SARS-CoV-2 はヒトへの感染率が高いため、突然変異の獲得とそれに伴う進化の可能性が高まります。 そのため、時間の経過とともに、対象となる変異体や懸念される変異体(VOC)など、SARS-CoV-2 の多くの変異体が出現してきました。 後者は、以前に流行していた株よりも高い伝播性および/または免疫回避能力を示します3、4、5、6。

ほとんどの国は、医療施設の洪水を回避し、必要な治療が必要な人々の医療アクセスを確保することを目的とした公衆衛生対策を実施することで、新たな感染の波を制御しようとしている。 これに関連して、新たに循環している変異株とその集団内での伝播を早期に検出できる効率的な監視ネットワークを開発することが不可欠でした7,8。 全ゲノム配列決定は、科学者がウイルスを研究し、ワクチンを開発するのに役立つだけでなく、強力な監視ネットワークを確立するための重要なツールでもあります。

SARS-CoV-2 ゲノム全体は、ウイルス感染細胞を使用し、いくつかの次世代シーケンシング (NGS) 技術 (すなわち、イルミナとオックスフォード ナノポア テクノロジー) を組み合わせて、2020 年初頭に初めて配列決定されました。 どちらの技術も、現在でも循環株の配列を取得するために世界中で広く使用されています5、6、7、10、11。 2020年9月、コロナウイルス病2019(COVID-19)ゲノミクスUKコンソーシアムと呼ばれる英国の国家配列決定ネットワークは、今日アルファバリアント(B.1.1.7)として知られる最初のVOCを特定した。 この SARS-CoV-2 変異体は、HV69-70 欠失と N501Y アミノ酸変異を特徴としています。 このウイルスは非常に急速に拡散する能力があり、武漢で最初に確認された株と比較して、疫学的利益をもたらすことが知られている 3 つの変異 (すなわち、N501Y、69-70 欠失、P681H) を含む合計 14 の系統特異的なアミノ酸置換を示しました 7,12 。 それ以来、懸念される 4 つの主な亜種が世界中で特定されています。ベータ (K417N、E484K)、ガンマ (K417T、V1176F)、デルタ (L19R、L452R、157-158 欠失、L452R、T478K、D950N)、および最新のオーミクロンです。 (R346K、L452X、F486V) のバリエーション。 これらの変異体はそれぞれ変異を蓄積しており、武漢の参照ゲノムと比較して 60 以上の変異を獲得した現在最も蔓延しているミクロン変異体まで進化上の利点をもたらしています。

25. 40 \(\upmu\)L of each pool diluted with 60 \(\upmu\)L of RC-PCR Low-TE buffer (Nimagen B.V.; Nijmegen, Netherlands) was purified using 85 \(\upmu\)L of Solid Phase Reversible Immobilization (SPRI) AmplicleanTM magnetic beads (Nimagen B.V.; Nijmegen, Netherlands) by mixing DNA and beads (beads:DNA ratio = 0.85), followed by incubation of the mix at room temperature (RT) for 5 min, then beads were washed twice with 75% ethanol. Beads covered with DNA fragments of interest were mixed with 110 \(\upmu\)L of RC-PCR Low TE Buffer (Nimagen B.V.; Netherlands) and incubated at RT for 2 min. The purification procedure was repeated a second time. Eluted DNA from each pool was quantified using the 1xdsDNA HS kit (Thermo Fisher Scientific; MA, USA) with the Qubit 4.0 (Thermo Fisher Scientific; MA, USA) and amplicons size and integrity were checked using the QIAxcel fragment analyzer (Qiagen; Hilden, Germany) with the DNA Screening Kit (Qiagen; Hilden, Germany)./p>9) and their length (Artic: minimum length= 400 bp - maximum length= 700 bp, Midnight: minimum length= 600 bp - maximum length= 1,200 bp) to avoid chimeric reads. The passed reads were mapped to the reference genome of SARS-CoV-2 MN908947.3 using minimap2 (version 2.18-r1015) and SNVs were called for positions with depth of reads \(\ge\) 20, and consensus sequence obtained using medaka (version 1.4.3, model r941_prom_variant_g360) a software using trained neural network-based models to appropriately call sequence variations29./p> 0.81 for SNV identification./p> 0.81 for SNV identification./p> 100x, run 2: mean coverage= 0x, 0% > 100x, run 3: mean coverage= 5x, 1.5% > 100x)./p> 0.8) for all samples with a qPCR Ct value < 25 (Artic v3: mean \(\kappa\) = 0.9918 ± 0.01060, Midnight v1: mean \(\kappa\) = 1 ± 0, Nimagen: mean \(\kappa\) = 0.9433 ± 0.1468). For the sample with the highest qPCR Ct value (Ct = 29.01), coefficients are lower (Artic v3: \(\kappa\) = 0.6896 ± 0.02007, Midnight v1: \(\kappa\) = 0 ± 0.00005, Nimagen: \(\kappa\) = 0.7659 ± 0.05119) indicating a greater discrepancy, especially for the Midnight v1 SOP. Both short-amplicon methods (Artic v3 and Nimagen) have a coefficient indicating a high correlation (Fig. 1 left panel). Although the reproducibility of the three methods is similar for samples with a qPCR Ct value <25, the reproducibility of the Midnight v1 SOP is significantly different from that of both other methods for samples with a qPCR Ct value >25 (Supplementary table 3)./p> 100x, repeat 2: mean coverage= 0x, 0% > 100x, repeat 3: mean coverage= 1x, 0% > 100x) (Supplementary table 4)./p> 25 (Artic v3: \(\kappa\) = 0.7279 ± 0.08269, Midnight v1: \(\kappa\) = 0 ± 0, Nimagen: \(\kappa\) = 0.8837 ± 0.03753) still showing a high repeatability for Nimagen and Artic while Midnight v1 is not repeatable./p>25 (Artic v3: \(\kappa\) = 0.7581 ± 0.01951, Nimagen: \(\kappa\) = 0.8287 ± 0.01903), especially for the Midnight v1 SOP which had a \(\kappa\) coefficient = 0 ± 0.00003, indicating that it was not repeatable for samples with a qPCR Ct value > 25 (Fig. 1 right panel). This was due to the low read depth (<20) at most nucleotide positions for two repeats performed with the Midnight v1 SOP. As this depth was the minimum threshold set in the bio-informatics pipeline for nucleotide calling in the consensus sequence, and as the third repeat had a sufficient read depth at these positions, the analysis resulted in a complete mismatch. Although the repeatability is not significantly different between the three methods for samples with qPCR Ct value <25, the repeatability of the Midnight v1 SOP is significantly different when compared with both other methods for qPCR Ct value >25 (Supplementary table 3)./p> 25 in clinical setting, sequencing results and strain typing can be obtained in non-clinical setting but should be interpreted with caution. Therefore, we compared the three methods using fifty-five samples without considering the Ct value exclusion criteria./p>30 for the N-gene (Table 2)./p>25 (Table 2), which led us to study the evolution of genome coverage as a function of viral load. We observed that for the three SOPs, the coverage was high for all samples with a N-gene qPCR Ct values <25 (96% and 90% of samples had a mean coverage above 380x for Artic v3 and Midnight v1 methods, respectively, and 90% of samples have a mean coverage above 600\(\times\) for Nimagen method) but the sequencing coverage dropped drastically with the three SOPs for samples with a qPCR Ct value >25 (Fig. 2)./p>25./p>25, the kappa coefficient decreased progressively with the increase of Ct value. This decrease was similar when comparing any method to one another (Fig. 3). However, all the mismatches observed can be explained by a too low read depth at the position of the mismatch for the method that did not identify the mutation (<20 reads for the Nanopore methods or <5 reads for the Illumina method). When, at that genomic position, the depth of reads was greater than 0 but below the previously mentioned cut-offs, we observed that the mutation was present in more than 70% of the reads, indicating that the discrepancies were not due to sequencing errors inherent to the methods but rather to the detection thresholds set in the bio-informatics pipelines./p>25 usually showed insufficient read depth which provided low reliability on some key mutations, which could lead to wrong or approximate lineage designation, highlighting the importance of sample selection criteria in the context of national surveillance programs using clinical samples8,38. Our data confirmed that the three methods validated here provided similar quality results and were adequate for epidemiological monitoring of SARS-CoV-2 using samples with N-gene qPCR CT value <25 in clinical setting./p>25), a method using smaller amplicons (Artic v3 and Nimagen) should be preferred as they exhibit better reproducibility and repeatability, and a higher mean coverage of the genome. This variability in coverage for samples with a low viral load had already been reported by Freed et al. Nevertheless, they have shown that it was possible to reach good quality results by generating more sequencing data than for samples with high or medium viral loads. This was not achieved in our study as we sequenced all samples under the same conditions. It has also been shown that in order to effectively detect SNVs and by extension reach a minimum coverage of 400x with an amplicon-based NGS technique, the material used for reverse transcription should contain at least 1,000 copies of viral RNA39,40./p>

共有