Lekárska genetika a diagnostika 2/2024

Rapídne celogenómové sekvenovanie a komplexná analýza s využitím AI Emedgene

RNDr. Martin Kašný, Ph.D., Ing. Mgr. Přemysl Bartoš, Ph.D., Mgr. Alžbeta Mičúchová, Bc. Veronika Bůžková, Mgr. Laura Ambrozová, Ph.D., Mgr. Karolína Stivínová, Mgr. Irem Mertová, Mgr. Alžběta Hamplová, Mgr. Eliška Hladíková, Mgr. Nela Tomko, Mgr. Markéta Kovalová, Ph.D., prof. MUDr. Milan Macek, DrSc., RNDr. Petr Kvapil

Cieľ: Optimalizácia protokolu rýchleho WGS poskytujúceho vysokokvalitné dáta s následnou anotáciou prioritných variantov s využitím umelej inteligencie softvérového nástroja Emedgene. Materiál a metódy: Z venóznej krvi 3 účastníkov (rodinné trio: matka, otec a proband-dcéra), proband s diagnózou Mayer-Rokitansky- -Küster-Hauserovho syndrómu, bola izolovaná genómová DNA pomocou súpravy EZ1&2 DNA Blood 350 μl Kit. Celogenómové knižnice boli pripravené pomocou súpravy TruSeq DNA PCR-Free High Throughput Library Prep Kit. rWGS sekvenovanie bolo realizované na prístroji NovaSeq 6000 s použitím sekvenačnej chémie S1 flowcell. Na následnú sekundárnu analýzu bol použitý Dynamic Read Analysis for GENomics (DRAGEN) OnPremise Server v4.1 (Illumina) s hg38 Alignment, Variant Calling cloudový systém DRAGEN v4.0 a softvérový nástroj využívajúci umelú inteligenciu Emedgene (Illumina). Výsledky: Vysokokvalitná genómová DNA bola úspešne izolovaná z venóznej krvi všetkých 3 účastníkov štúdie. Celogenómové knižnice boli úspešne sekvenované s generovaným objemom dát: 464,92 Gb, pri 92,57 % čítaní pokrytých viac ako 35× a pri 94,66 % čítaní so skóre kvality Phred nad 30 (Q30). Všetky tri celogenómové knižnice spĺňali požadované kritérium – 800 miliónov čítaní z oboch koncov. Sekundárnou analýzou s využitím cloudového systému DRAGEN v4.0 a softvérového nástroja Emedgene bolo vytipovaných 7 patologických variantov Mayer-Rokitansky-Küster-Hauserovho syndrómu, ktoré boli zhodnotené laboratórnym diagnostikom. Záver: Optimalizovaný protokol umožňuje rýchlu prípravu vysokokvalitných indexovaných celogenómových sekvenačných knižníc, sekvenovanie a bioinformatickú analýzu za 39 hodín a 54 minút.

Kľúčové slová: genómová DNA, celogenómové sekvenovanie, Rapid WGS, NovaSeq6000, anotácia variantov, umelá inteligencia Emedgene

Celý článok je dostupný len pre predplatiteľov časopisu Lekárska genetika a diagnostika. Objednať časopis

Rapid whole-genome sequencing and comprehensive analysis using AI Emedgene

Purpose: Protocol optimization of the rapid whole-genome sequencing providing highquality data with subsequent annotation of priority variants using the AI software tool Emedgene. Materials and methods: Genomic DNA was isolated using the EZ1&2 DNA Blood 350 μl Kit from venous blood from 3 participants (family trio: mother, father and proband daughter); proband diagnosed with Mayer-Rokitansky-Küster-Hauser syndrome. Whole-genome libraries were prepared using the TruSeq DNA PCR-Free High Throughput Library Prep Kit. Sequencing was performed on a NovaSeq 6000 using S1 flowcell sequencing chemistry. Dynamic Read Analysis for GENomics (DRAGEN) On Premise Server v4.1 (Illumina) with hg38 Alignment and Variant Calling and DRAGEN v4.0 Cloud System and AI software tool Emedgene (Illumina) were used for subsequent secondary analysis. Results: High-quality genomic DNA was successfully isolated from the venous blood of all 3 study participants. Whole-genome libraries were successfully sequenced with a generated volume of data: 464.92 Gb, with 92.57% of reads covered more than 35× and 94.66% of reads with a Phred quality score above 30 (Q30). All whole-genome libraries met the required criterion of 800 million of pair-end reads. Secondary analysis using the DRAGEN v4.0 cloud system and artificial intelligence Emedgene identified 7 pathological variants of Mayer- Rokitansky-Küster-Hauser syndrome, which were evaluated by a laboratory diagnostician. Conclusion: The optimized protocol enables rapid preparation of high-quality indexed wholegenome sequencing libraries, sequencing and bioinformatic analysis in 39 hours and 54 minutes.

Keywords: genomic DNA, whole genome sequencing, Rapid WGS, NovaSeq6000, variants´ annotation, Emedgene artificial intelligence