AI a térbeli metabolizmusra: Az élet adattárai

Képforrás

Itt, a Neuromation-ban izgalmas - és meglehetősen kifinomult - kezdjük! - közös projekt Dr. Theodore Alexandrov térbeli metabolikus csoportjával az Európai Molekuláris Biológiai Laboratóriumból. Ebben a hozzászólás-mini sorozatban elmagyarázom, hogyan tervezzük a mélyreható tanulás legújabb eredményeinek felhasználását és új modellek feltalálását a tömegspektrometriás adatok képalkotó feldolgozására, az egyes sejtek anyagcseréjének profiljainak kinyerésével a különböző fenotípusú sejtek molekuláris trajektóriáinak elemzésére ...

Várj, biztosan már háromszor veszítettem téged. Hadd kezdjem újra.

Omics: az Önt létrehozó adatkészletek

Képforrás

A fenti kép a molekuláris biológia központi dogmáját mutatja be, a XX. Századi biológia legfontosabb betekintését a Földi élet működésében. Megmutatja, hogyan áramlik a genetikai információ a DNS-ből a fehérjékbe, amelyek a sejtekben ténylegesen elvégzik a munkát:

  • A DNS tárolja a genetikai információkat, és megismételheti azokat;
  • a transzkripciónak nevezett eljárásban a DNS genetikai kódjának részeit kivonja a messenger RNS-hez (m-RNS), amely szintén nukleinsav;
  • és végül: a transzláció a fehérjék előállításának, az RNS-szálakból származó genetikai kód „beolvasásának” és a terv gyakorlati megvalósításának folyamata.

Nagyon leegyszerűsített képet festettem, de ez valóban az élet központi, legfontosabb információáramlása. A központi dogma, amelyet Francis Crick 1958-ban állított elő, azt mondja, hogy a genetikai információ csak a nukleinsavaktól (DNS és RNS) fehérjéig terjed, és soha nem tér vissza - a fehérjék nem tudnak visszamenni és módosítani a DNS-t vagy RNS-t, vagy akár más fehérjéket is, ezeket csak a nukleinsavak szabályozzák.

Mindenki tudja, hogy a DNS-be épített genetikai kód nagyon fontos. Kicsit kevésbé ismert, hogy a központi dogma útvonalának minden egyes lépése (az út alapvetően azon általános reakciók sorozata, amelyek a molekulákat egymásba transzformálják, például a DNS -> RNS -> protein egy út, és nagyon fontos! ) megfelel a saját „adatkészletének”, a szervezet saját jellemzésének, mindegyik fontos és érdekes a maga módján.

A DNS-ébe kódolt génkészletedet genomnak nevezzük. Ez a fő „adatkészlet”, az elsődleges terv, a genom az a cucc, amely megmondja, hogyan működik a leg absztraktbb módon. Mint valószínűleg tudod, a genom egy nagyon hosszú „A”, „C”, „G” és „T” betűből álló sor, amely a négy nukleotidot képviseli ... ne aggódj, nem fogunk belemenni a dolgokba. Az emberi genomprojekt sikeresen szekvenálta (levélben "elolvasta") az emberi genom tervezetét 2000-ben és egy teljes emberi genomot 2003-ban, mindhárom milliárd levelet. Azóta a szekvenálási módszerek sokat javultak; ráadásul természetesen az összes emberi genom nagyon hasonló, tehát ha már rendelkezik, sokkal könnyebb megszerezni a többit. A genom meghatározza, hogy mely betegségekre fogékonyak, és meghatározza számos jellemző tulajdonságát.

Az emberi genom tanulmányozása messze nem ért véget, de ez csak a történet első része. Mint fentebb láttuk, a DNS genetikai kódját ki kell olvasni az RNS-be. Ezt transzkripciónak nevezzük, ez egy bonyolult folyamat, amely a jelenlegi megbeszélésünk szempontjából egyáltalán nem releváns: lényeg az, hogy a genom darabjait szó szerint másoljuk az RNS-be (hivatalosan T átváltoztatja U-t, más nukleotidot, de még mindig pontos ugyanaz az információ):

Képforrás

A sejtek itt megkülönböztetik a genom mely részeit írják át.

Az RNS szekvenciák halmazát (mindkettőt kódoló RNS-t, amelyet később fehérjék előállításához használunk, és a nem kódoló RNS-t, azaz annak többi részét) egy sejtben transzkriptomnak nevezzük. A transzkriptóm sokkal pontosabb információt nyújt az egyes sejtekről és szövetekről: például a máj sejtjének pontosan ugyanaz a genomja van, mint az agy neuronjának - de nagyon különböző transzkriptomok! A transzkriptóma tanulmányozásával a biológusok „megnövelhetik a felbontást”, és megnézhetik, hogy mely gének expresszálódnak a különböző szövetekben és hogyan. Például a modern, személyre szabott orvoslás átvizsgálja a transzkriptómákat a rák diagnosztizálására.

De ez még mindig a genetikai kódról szól. A harmadik adatkészlet még részletesebb: a proteom a sejtekben előállított összes fehérjéből áll, a transzlációnak nevezett eljárásban, ahol az RNS templátként szolgál, három betűvel, amely minden fehérjét kódol:

Képforrás

Ez már sokkal közelebb van a valós célhoz: a fehérjék, amelyeket egy sejt előállít, meghatározzák a kölcsönhatásaikat más sejtekkel, és a proteom sokat mond arról, hogy mit tesz a sejt, mi a funkciója a szervezetben, milyen hatással van más sejtek és így tovább. És a proteom, a genomtól eltérően, temperálható: sok gyógyszer pontosan úgy működik, hogy elnyomja vagy felgyorsítja a specifikus fehérjék transzlációját. Például az antibiotikumok általában küzdenek a baktériumokkal azáltal, hogy megtámadják RNS-jüket, teljesen elnyomják a fehérje szintézist, és ezzel elpusztítják a sejtet.

A genomika, a transzkriptika és a proteomika a molekuláris biológia alterületei, amelyek a genomot, a transzkriptomot és a proteomot vizsgálják. Ezeket együttesen „omiknak” nevezik. A központi dogma régóta ismert, de a biológusok csak a közelmúltban dolgoztak ki olyan új eszközöket, amelyek valójában engedték bepillantni a transzkriptómába és a proteomába.

És ez vezetett a molekuláris biológia nagy adatainak „omics-forradalmához”: ezekkel az eszközökkel az elmélet helyett a valóságainkba betekinthetünk, és megtudhatjuk, mi történik a sejtjeiben - és segíthetünk személyesen is, nemcsak a olyan gyógyszer, amelynek működnie kell a legtöbb embernél, de az ön számára valahogy kudarcot vall.

Metabolómia: túl a dogmán

Képforrás

A molekuláris biológusok a genomika, a transzkriptika és a proteomika összefüggésében kezdtek beszélni az „omics forradalomról”, ám a központi dogma még mindig nem a teljes kép. A fehérjék fordítása csak a sejtekben zajló folyamatok kezdete; ezután ezek a fehérjék valójában kölcsönhatásba lépnek egymással és a sejt más molekuláival. Ezek a reakciók magukban foglalják a sejt anyagcseréjét, és végül pontosan az anyagcserét érdekli, és javíthatunk.

A modern biológia nagyon érdekli azokat a folyamatokat, amelyek túlmutatnak a központi dogmán, és bevonják az úgynevezett kis molekulákat: enzimek, lipidek, glükóz, ATP stb. Ezeket a kis molekulákat vagy a sejtekben szintetizálják - ebben az esetben metabolitoknak, vagyis a sejt anyagcseréjének termékeinek nevezik -, vagy azok túlról érkeznek. Például a vitaminok tipikus kis molekulák, amelyekre a sejteknek szükségük van, de nem képesek szintetizálni magukat, és a gyógyszerek exogén kis molekulák, amelyeket úgy tervezünk, hogy megbénítsák a sejtek anyagcseréjét.

Ezeket a szintézisfolyamatokat a fehérjék vezérlik, és követik az úgynevezett metabolikus útvonalakat, a közös biológiai funkcióval rendelkező reakcióláncokat. A központi dogma az egyik nagyon fontos út, de a valóságban ezrek vannak. Az emberi metabolizmus nemrégiben kifejlesztett modellje 5324 metabolitot, 7785 reakciót és 1675 kapcsolódó gént sorol fel, és ez egyértelműen nem az utolsó változat - a modern becslések szerint 19000 metabolitot elérnek, tehát az útvonalak még nem kerültek feltérképezésre.

A szervezet metabolikus profilját nem határozza meg teljes mértékben a genom, transzkriptóma vagy akár proteom: a metabolom (metabolitok halmaza) különösen olyan környezet hatására alakul ki, amely például vitaminokat szolgáltat. A metabolómia, amely az élő szervezetekben a metabolitok összetételét és kölcsönhatását vizsgálja, a biológia, az analitikai kémia és a bioinformatika kereszteződésén helyezkedik el, a gyógyászatban történő egyre növekvő alkalmazásokkal (és ez nem az omicsok utolsó része, de a metabolomika most elegendő számunkra). .

A metabolom ismeretével jobban jellemezhetjük és diagnosztizálhatjuk a különféle betegségeket: mindegyiknek nyomot kell hagynia a metabolómban, mert ha az anyagcserék nem változtak, miért van egyáltalán probléma? .. A sejtek metabolikus profiljának tanulmányozásával a biológusok felfedezni új diagnosztikai és terápiás biomarkerek, új célokat találnak a gyógyszerekre. A metabolizmus az igazán személyre szabott orvoslás alapja.

A végső adatkészlet

Képforrás

Eddig alapvetően elmagyaráztam a molekuláris biológia és az orvostudomány területén a közelmúltban elért haladást. De mit fogunk tenni ebben a projektben? Nem mi biológusok vagyunk, hanem tudósok vagyunk, AI kutatók; mi a mi részünk ebben?

Nos, a metabolom alapvetően hatalmas adatkészlet: minden sejtnek megvan a saját metabolikus profilja (a sejtben megjelenő molekulák halmaza). A metabolikus profilok különbségei meghatározzák a különböző sejtpopulációkat, azt, hogy az anyagcsere-profilok hogyan változnak az időben, hogy megfelelnek-e a sejtek fejlődésének mintáinak, és így tovább, és így tovább. Sőt, a térbeli metabolizmusban, amelyben együtt dolgozunk, speciális képek formájában érkezik: a képalkotó tömegspektrometria eredményei nagyon nagy felbontással. Ez ismét magyarázatot igényel.

A tömegspektrometria egy olyan eszköz, amely lehetővé teszi a mintában szereplő mindazok tömegének megismerését. A ritka ütközések mellett ez alapvetően ugyanaz, mint annak kiderítése, hogy mely specifikus molekulák jelennek meg a mintában. Például, ha egy gyémánt betesz a tömegspektrométerbe, akkor látni fogja, hogy nem, nem csak egyetlen szénatomot, akkor valószínűleg mind a 12C, mind a 13C izotópokat látni fogja, és összetételük sokat mond a gyémánt tulajdonságairól.

A képalkotó tömegspektrometria alapvetően egy kép, ahol minden pixel spektrum. Vegyünk egy szövet egy részét, tegyük egy tömegspektrométerbe, és kapjunk egy háromdimenziós “adatkockát”: minden pixel tartalmazza a szövet ezen részén található molekulák (metabolitok) listáját. Ez a folyamat a fenti képen látható. Megmutatnék néhány képet itt, de félrevezető lenne: lényeg az, hogy nem egyetlen kép, hanem sok párhuzamos kép, minden metabolit számára egy. Valami ilyesmit (a kép innen készült):

A tömeg-spektrometriai eszközök jobb képalkotó eszközeinek elkészítésére irányuló törekvés célja elsősorban a felbontás növelése, azaz a pixelek csökkentése és az érzékenység növelése, azaz kisebb mennyiségű metabolit kimutatása. Mostanáig a tömegspektrometria képalkotó módszere nagy utat tett meg: a felbontás olyan magas, hogy a képen az egyes pixelek képesek az egyes cellákra képezni! Ez a nagy felbontású tömegspektrometria, amely egysejtű tömegspektrometria néven vált ismertté, megnyitja a kaput a metabolomika számára: most már sok sejt anyagcsere-profilját megkaphatja egyszerre, kiegészítve a szövetben lévő térbeli elhelyezkedésükkel. .

Ez az élet végső adatállománya, a jelenleg létező legszélesebb körű beszámoló a tényleges szövetekről. A projektben ezt a végső adatkészletet kívánjuk tanulmányozni. A mini-sorozat következő részletében meglátjuk, hogyan.

Szergej Nikolenko
Vezető kutatási igazgató, Neuromation