Češi otevřeli cestu k objevování neznámých látek: Svět získává nový klíč k chemii života
Čeští vědci ve spolupráci s mezinárodním týmem přinášejí nástroj, který zásadně rozšiřuje možnosti identifikace neznámých látek. Nová databáze masové spektrometrie umožňuje odhalovat dosud skryté molekuly, urychlit vývoj léků a přesněji sledovat chemické stopy v životním prostředí. Otevírá se tak prostor pro objevy, které mohou změnit medicínu, biologii i ochranu přírody.
Projekt MSⁿLib, nedávno publikovaný v prestižním časopise Nature Methods, představuje zlomový okamžik v práci s chemickými látkami, které tvoří základ našeho života i průmyslu. Vědci po celém světě se již desítky let snaží systematicky mapovat tzv. chemický prostor, tedy nesmírně rozsáhlý soubor možných molekul, z nichž většinu známe jen velmi povrchně. Přestože masová spektrometrie se stala klíčovým nástrojem pro identifikaci malých molekul v biologických i environmentálních vzorcích, její praktické využití bylo dlouho omezeno na relativně úzký repertoár dostupných spektrálních knihoven. Dosud totiž existovalo jen několik set tisíc spekter ze standardní dvoustupňové fragmentace (MS²), zatímco vícestupňová fragmentace (MSⁿ), která poskytuje nesrovnatelně hlubší informace o vnitřní stavbě molekul, byla veřejně dostupná pouze pro méně než dva tisíce sloučenin.
MSⁿLib tuto nerovnováhu radikálně mění. Nová knihovna zahrnuje více než 2,3 milionu spektrálních záznamů a obsahuje detailní data k více než 30 tisícům unikátních molekul. Tyto látky byly měřeny v obou ionizačních režimech, tedy pozitivním i negativním, a výsledkem je strukturovaná databáze, která výrazně rozšiřuje dostupné možnosti pro identifikaci neznámých látek. Celkový přínos je dvojnásobný: jednak se otevírá cesta k lepšímu porozumění fragmentačním drahám, substrukturám a izomerům, jednak se daří zaplnit bílá místa na mapě chemického prostoru, která byla dosud zcela neprobádaná. Přes 22 tisíc z obsažených struktur se přitom v žádné jiné veřejné databázi nevyskytovalo, což ukazuje, že jde o skutečně průlomový zdroj.
Zvláštní význam má tento úspěch pro Českou republiku. V Ústavu organické chemie a biochemie Akademie věd ČR, konkrétně v týmu vedeném Tomášem Pluskalem, byla vyvinuta technologická platforma, která umožňuje mimořádně efektivní měření a zpracování velkého množství látek. Český tým vytvořil metodiku, jež dokáže zpracovat během krátkého časového cyklu desítky sloučenin najednou, a to s vysokou kvalitou a konzistencí spektrálních dat. Právě tato efektivita umožnila posunout projekt z řádu tisíců na řád desítek tisíc a dnes už i statisíců molekul. V současnosti je v rámci projektu analyzováno dalších 70 tisíc látek a cíl do konce roku je dosáhnout až 200 tisíc spekter – což znamená, že během několika let vznikne databáze, která několikanásobně překoná to, co věda dokázala vybudovat za předchozí dvě desetiletí.
MSⁿLib ale není jen o chemii v úzkém smyslu. Její dopady zasahují do celé řady oblastí. Farmaceutický průmysl získává nástroj, který mu umožní přesněji mapovat metabolické cesty a rychleji identifikovat kandidátní molekuly pro nové léky. Biologové a lékaři mohou sledovat dynamiku metabolitů v organismech a hledat biomarkery pro diagnostiku nemocí. Ekologové a toxikologové mohou díky databázi efektivněji identifikovat kontaminanty v prostředí, a tím lépe sledovat dopady chemikálií na zdraví člověka i přírody. Významné jsou i aplikace v zemědělství, potravinářství nebo bezpečnostním výzkumu, kde je třeba rychle odhalit přítomnost rizikových látek.
Silným aspektem projektu je i jeho otevřenost. MSⁿLib je koncipována jako open-source platforma: data jsou veřejně dostupná a doprovází je software, především nástroj mzMine, který je rovněž volně k dispozici. To znamená, že komunita vědců po celém světě může nejen využívat existující knihovnu, ale i přispívat k jejímu rozšiřování. Tento princip otevřené vědy zajišťuje, že databáze nebude statickým dílem, nýbrž živým organismem, který se bude vyvíjet podle potřeb a možností výzkumu.
Neméně důležitý je i rozměr propojení s moderními technologiemi. Strojové učení a umělá inteligence, které jsou stále více využívány pro automatickou anotaci spekter a predikci struktur, zásadně závisejí na dostupnosti rozsáhlých a kvalitních tréninkových dat. MSⁿLib poskytuje právě takovou datovou základnu. Čím rozmanitější spektra jsou k dispozici, tím přesněji lze trénovat modely schopné rozpoznávat nejen známé, ale i dosud nepopsané látky. Výsledkem může být situace, kdy algoritmy začnou předpovídat struktury molekul s vysokou přesností a rychlostí, což by mohlo zásadně urychlit proces objevování nových léčiv nebo identifikace environmentálních toxinů.
Samozřejmě, existují i výzvy. Získávání čistých referenčních látek je logisticky složité a finančně náročné, stejně jako samotná akvizice spekter, která vyžaduje špičkové přístroje, pečlivou optimalizaci podmínek a časově náročnou práci. Nicméně český tým ukazuje, že tyto překážky lze překonat chytrým designem experimentů a vysokoproduktivními protokoly. Výsledkem je projekt, který už nyní posouvá hranice světové vědy a může se stát základem pro dlouhodobé změny ve způsobu, jakým chápeme chemii života. MSⁿLib je tak symbolem toho, že i relativně malá země, jako je Česká republika, dokáže díky kombinaci špičkové vědy, otevřenosti a mezinárodní spolupráce posunout hranice poznání.