Bioinformatický tým a analýza genomových dat
Bioinformatický tým Laboratoř onkogenetiky na 1. lékařské fakultě Univerzity Karlovy analyzuje terabajty genomových dat pomáhající odhalovat dědičná nádorová onemocnění. Ta vznikají často u lidí, kteří zdědili od svých předků vzácnou poruchu v genetické informaci, která se nachází v některém ze stovek známých nádorových predispozičních genů. Nalezení takovéto genetické „chyby“ – mutace – je podmínkou pro to, aby se osoby s vysokým rizikem vzniku nádorového onemocnění mohli zařadit do specializovaných léčebných programů, umožňujících prevenci nádorového onemocnění, nebo jeho diagnostiku v časném stádiu, kdy pravděpodobnost vyléčení i tak závažného onemocnění jako je rakovina, je vysoká.
Vyšetřovací metoda – panelové sekvenování nové generace
Vyšetření se provádí pomocí tzv. panelového sekvenování nové generace, což je metoda, kterou je možné najednou přečíst genetickou informaci stovek genů, ve kterých by se vrozená porucha mohla skrývat. Již několik let probíhá vyšetření pomocí panelu CZECANCA, který v Laboratoři onkogenetiky vznikl.
Genetické informace a jejich přepis
Geny jsou informační jednotky genetické informace (DNA), které si můžeme představit jako jednotlivé „programy“. Jestliže je jejich informace zapotřebí, přepíší se z databáze DNA do výrobních plánů v podobě RNA. Molekula RNA (správně messengerové RNA – mRNA) slouží jako předloha pro následnou výrobu bílkovin, které se skládají z dvaceti speciálních aminokyselin. Bílkoviny jsou konstrukční prvky, které tvoří i řídí naše organizmy. Čtyřpísmenný genetický kód musí být při přepisu z mRNA do bílkovin čten specializovaným „skenerem“, který převádí vždy tři písmena kódu DNA/RNA na jednu z 20 aminokyselin (plus kód pro zahájení, resp. zastavení syntézy).
Záměna jen jediného písmena genetické abecedy v DNA tedy může mít řadu různých důsledků. V nejjednodušší podobě se nemusí stát vůbec nic, pokud tato porucha leží třeba mimo geny. I v genech může zůstat bez příznaků, pokud nebude měnit schopnost „čtení“ genu na úrovni DNA, nepovede ke změnám „plánů“ mRNA, nebo nebude měnit „kritické součástky“ - jednotlivé aminokyseliny v bílkovině. V opačném případě může záměna i jediného písmena genetické abecedy hrozit vznikem rakoviny, které může u nosiče mutace propuknout i v mladém věku.
Výsledky genetického vyšetření a úloha bioinformatického týmu
Výsledkem genetického vyšetření je přečtení mnoha milionů kusů genetického kódu obsahujících část informace genů, které se nacházejí u konkrétního analyzovaného pacienta. Úkolem bioinformatického týmu je přiřadit „kusy kódů“ ke konkrétním genům, porovnat je se „zdravou“ referencí, nalézt případné genetické odchylky, určit jejich dopad na genetickou informaci u vyšetřovaného jedince a analyzovat výskyt takovýchto osob v naší populaci a ve světě.
Bioinformatický tým se však kromě rutinních analýz u pacientů zabývá i vedením a aktualizací národní databáze CZECANCA konsorcia, která pomáhá klinickým genetikům ve správné interpretaci výsledků genetických analýz.
Výpočetní výkon a technologie
Vedoucí bioinformatického týmu, Mgr. Petra Zemánková, Ph.D. z Laboratoře onkogenetiky uvádí: „Z hlediska výpočetního výkonu, obsahuje spolehlivá analýza panelu dvou set genů od jednoho pacienta přibližně 300 MB hrubých dat, ze kterých po namapování na referenci vznikne finální genetická informace o velikosti150 MB. Jeden běh aktualizace databáze CZECANCA zahrnuje více než 10 000 datových sad od pacientů a 2 000 od kontrol, což znamená namapování a přepočítání 1,8 TB dat.“
Její kolega, Ing. Petr Nehasil dodává: „Na nových serverech HP ProLiant DL380p mapujeme sekvenační data na referenční DNA a převádíme je do formátů vhodných pro identifikaci genetických odchylek. Toto je jeden z výpočetně nejnáročnějších kroků a díky novým serverům se podařilo zkrátit výpočetní čas na pětinu. V praxi to znamená, že výpočet výsledků od jednoho pacienta trvá hodiny, místo dne a aktualizaci databáze CZECANCA jsme našim spolupracujícím lékařům schopni „spočítat“ během 2 měsíců na místo 10!“.
„Servery z CZECH-SERVER.cz přinášejí významné zvýšení produktivity i tolik potřebnou výkonovou rezervu, která umožní další rozvoj bioinformatických analýz pro stále se zvyšující počet genetických vyšetření dědičných forem rakoviny“, shrnuje Mgr. Zemánková.