Otthon » Mérgező gombák » Bioinformatika: mi ez? A bioinformatika főbb irányai a vizsgált objektumok függvényében Biológiai informatika.

Bioinformatika: mi ez? A bioinformatika főbb irányai a vizsgált objektumok függvényében Biológiai informatika.

A bioinformatika a biológia számos területének fontos részévé vált. A kísérleti molekuláris biológiában a bioinformatikai technikák, például a képalkotás és a jelfeldolgozás hasznos eredményeket hoznak nagy mennyiségű nyers adatból. A genetika és genomika területén a bioinformatika segít a genomok és a megfigyelt mutációk szekvenálásában és annotálásában. Szerepet játszik a biológiai irodalomból származó adatok elemzésében, valamint a biológiai adatok rendszerezésére és lekérdezésére szolgáló biológiai és genetikai ontológiák kialakításában. Szerepet játszik a génelemzésben, a fehérje expressziójában és szabályozásában. A bioinformatikai eszközök segítenek a genetikai és genomikai adatok összehasonlításában, és általában a molekuláris biológia evolúciós aspektusainak megértésében. Általában segít elemezni és katalogizálni a biológiai útvonalakat és hálózatokat, amelyek a rendszerbiológia fontos részét képezik. A szerkezetbiológiában segít a DNS-, RNS- és fehérjeszerkezetek szimulációjában, modellezésében, valamint a molekuláris kölcsönhatásokban.

Történet

Az információtovábbítás, tárolás és feldolgozás biológiai rendszerekben betöltött fontos szerepének felismerése alapján Pauline Hogeweg 1970-ben bevezette a „bioinformatika” kifejezést, amely a biotikus rendszerekben zajló információs folyamatok tanulmányozásaként határozta meg. Ez a meghatározás párhuzamba állítja a bioinformatikát a biofizikával (a biológiai rendszerekben zajló fizikai folyamatok vizsgálata) vagy a biokémiával (a biológiai rendszerekben zajló kémiai folyamatok vizsgálata).

A „genomikus forradalom” kezdetén újra felfedezték a „bioinformatika” kifejezést, amely egy biológiai információ tárolására szolgáló adatbázis létrehozására és karbantartására utal.

Sorozatok. A számítógépek szükségessé váltak a molekuláris biológiában, amikor a fehérjeszekvenciák elérhetővé váltak, miután Frederick Sanger az 1950-es évek elején szekvenálta az inzulint. Több szekvencia manuális összehasonlítása nem bizonyult praktikusnak. Ezen a területen Margaret Oakley Dayhoff volt az úttörő. David Lipman (a Nemzeti Biotechnológiai Információs Központ igazgatója) "a bioinformatika anyjának és apjának" nevezte. Dayhoff összeállította a fehérjeszekvenciák egyik első adatbázisát, kezdetben könyv formájában publikálta őket, és úttörővé vált a szekvencia-illesztés és a molekuláris evolúció módszereiben.

Genomok. Ahogy a teljes genomszekvenciák elérhetővé váltak, ismét Frederick Sanger úttörő munkájával, újra felfedezték a „bioinformatika” kifejezést, amely biológiai információk, például nukleotidszekvenciák tárolására szolgáló adatbázisok létrehozására és karbantartására utal (GenBank adatbázis 1982-ben). Az ilyen adatbázisok létrehozása nemcsak tervezési problémákkal járt, hanem egy átfogó felület létrehozásával is, amely lehetővé teszi a kutatók számára, hogy lekérdezzék a meglévő adatokat és újakat adjanak hozzá. Az adatok nyilvános elérhetősége miatt gyorsan kifejlesztették azokat a feldolgozó eszközöket, amelyeket olyan folyóiratokban ismertettek, mint a Nucleic Acid Research, amely már 1982-ben speciális kiadványokat közölt a bioinformatikai eszközökről.

Gólok

A bioinformatika fő célja a biológiai folyamatok megértésének elősegítése. A bioinformatika abban különbözik a többi megközelítéstől, hogy a cél elérése érdekében számításigényes módszerek létrehozására és alkalmazására összpontosít. Példák ilyen módszerekre: mintafelismerés, adatbányászat, gépi tanulási algoritmusok és biológiai adatok megjelenítése. A kutatók fő tevékenysége a szekvencia-illesztés, a génfelfedezés (a DNS-régiót kódoló gének keresése), a genom dekódolás, a gyógyszertervezés, a gyógyszerfejlesztés, a fehérjeszerkezet-illesztés, a fehérjeszerkezet előrejelzés, a génexpresszió és a fehérje-fehérje problémák megoldására irányul. interakció előrejelzése, az egész genomra kiterjedő asszociációk keresése és az evolúció modellezése.

A bioinformatika ma adatbázisok, algoritmusok, számítási és statisztikai módszerek és elméletek létrehozását és fejlesztését foglalja magában a biológiai adatok kezelése és elemzése során felmerülő gyakorlati és elméleti problémák megoldására.

Főbb kutatási területek

Genetikai szekvencia elemzés

Biodiverzitás értékelése

Bioinformatikai alapprogramok

  • ACT (Artemis Comparison Tool) – genomi elemzés
  • Harlequin - populációgenetikai adatok elemzése
  • A Bioconductor egy nagyszabású FLOSS projekt, amely számos külön csomagot biztosít a bioinformatikai kutatásokhoz. Írva .
  • BioEdit
  • BioNumerics - kereskedelmi univerzális szoftvercsomag
  • BLAST - rokon szekvenciák keresése a nukleotid- és aminosavszekvenciák adatbázisában
  • Clustal - a nukleotid- és aminosavszekvenciák többszörös összehangolása
  • DnaSP - DNS szekvencia polimorfizmus elemzés
  • FigTree - filogenetikai fák szerkesztője
  • Genepop
  • Genetix – populációs genetikai elemzés (a program csak francia nyelven érhető el)
  • JalView - többszörös igazítási szerkesztő nukleotid- és aminosav-szekvenciákhoz
  • A MacClade egy kereskedelmi program interaktív evolúciós adatok elemzésére
  • MEGA - molekuláris evolúciós genetikai elemzés
  • Mesquite - összehasonlító biológia program Java nyelven
  • Izom - nukleotid- és aminosavszekvenciák többszörös összehasonlítása. Gyorsabb és pontosabb, mint a ClustalW
  • PAUP - filogenetikai elemzés parsimony módszerrel (és más módszerekkel)
  • PHYLIP - filogenetikai szoftvercsomag
  • Phylo_win - filogenetikai elemzés. A program grafikus felülettel rendelkezik.
  • PopGene - a populációk genetikai sokféleségének elemzése
  • Populációk – populációgenetikai elemzés
  • PSI Protein Classifier - a PSI-BLAST programmal kapott eredmények összefoglalása
  • Seaview – filogenetikai elemzés (grafikus felhasználói felülettel)
  • Flitter - szekvencia betétek a GenBankban, EMBL-ben, DDBJ-ben
  • SPAdes - bakteriális genom összeszerelő
  • SplitsTree - program filogenetikai fák építésére
  • T-Coffee – a nukleotid- és aminosav-szekvenciák többszörös progresszív összehangolása. Érzékenyebb, mint a ClustalW/ClustalX.
  • Az UGENE egy ingyenes orosz nyelvű eszköz, nukleotid- és aminosav-szekvenciák többszörös összehangolása, filogenetikai elemzés, annotáció, adatbázisokkal való munka.

egy nagyszabású kétnapos fesztivál több párhuzamos programmal, a VKontakte közösségi hálózat szervezésében. Van egy zenei program népszerű zenészekkel, videojátékokkal foglalkozó területek, sportolási lehetőségek, ételek, piac és még sok más. Az egyik szekció egy előadóterem, melynek egyik résztvevője az orosz bioinformatikus, a biológiai tudományok doktora és a tudomány népszerűsítője, Mihail Gelfand. A Buro 24/7 egy tudóssal beszélgetett arról, hogy mi az a bioinformatika, milyen fontos felfedezéseket adott a világnak, lehetséges-e ezt a tudományt a vadonban végezni, és miért nincs értelme a biológiai Nobel-díjnak.

— Kezdjük azzal, hogy mi is az a bioinformatika? Miért bio? Miért pont számítástechnika?

— A bioinformatika egy módszer a biológiára számítógépen. Eleinte az emberek egyszerűen az élőlények megfigyelésével tanulták a biológiát. Aztán elkezdtek kísérletezni. Viszonylagosan szólva, ha levágod az egér fejét, azonnal elpusztul. És ha levágja a béka fejét, az egy ideig tovább ugrik. Ebből az ellentétből pedig levonhatunk néhány következtetést az élőlények felépítésére vonatkozóan. Itt persze kicsit túlzok, de értitek.

Aztán elkezdődött az in vitro biológia. Ez nem a szervezet egészét, hanem egyes sejtjeit, egyes génjeit, egyes fehérjéit vizsgálja. Aztán kiderült, hogy ennek a szemléletnek a keretein belül kialakult egyik fő területen - a molekuláris biológiában - olyan módszerek jelentek meg, amelyek rengeteg adatot generálnak. Eleinte ezek az adatok DNS-szekvenciák voltak, majd - a gének munkájáról szóló adatok, majd - a fehérjék és a DNS kölcsönhatásairól, majd - a DNS térbeli csomagolásáról és még sok másról. És dolgozhat egy ilyen tömb egészével, elemezheti - nyilván számítógép segítségével elemezheti, mert egyszerűen nem lehet „kézzel” elemezni ezeket az adatokat, túl sok van belőle.

Bármilyen nagy adat sok technikai problémát vet fel: hogyan kell helyesen tárolni, hogyan lehet gyorsan továbbítani. De az elsődleges feladat az, hogy ezekből az adatokból valami megfelelő és érdekes biológiát készítsünk. Ezt csinálja a bioinformatika. Kísérletek során nyert adatokat igyekszik felhasználni a sejtek működésének megértésére.

A bioinformatika három fő stílusa létezik. Nagyon alapvető kérdéseket tehet fel. Például mit csinál pontosan egy ilyen és ilyen fehérje? Vagy fordítva: melyik fehérje tölt be ilyen és olyan funkciót a sejtben. Ez egy bonyolultabb kérdés, mert viszonylagosan szólva, rendelkeznie kell egy listával az összes fehérjéről, és kiválaszthatja közülük a kívánt fehérjét. De végső soron ezek még mindig klasszikus molekuláris biológiai kérdések. Csak arról van szó, hogy ha rendelkezik számítógépes módszerek arzenáljával, akkor leggyakrabban meglehetősen ésszerű tippet tehet. Aztán a kísérletező elmegy és ellenőrzi ezt a feltevést. Ebben az értelemben a bioinformatika egyszerűen egy olyan eszköz, amely javítja a molekuláris biológia hatékonyságát.

A bioinformatikának van egy másik fajtája is, ez az elmúlt 10 évben jelent meg. Ez az úgynevezett rendszerbiológia. A rendszerbiológia keretein belül a tudósok nem egy egyedi fehérje munkáját próbálják leírni, hanem a szervezet egészét. Például, hogyan változik a gének munkája az embriófejlődés során. Vagy mi változott a gének működésében, amikor megjelent egy rosszindulatú daganat. Ez egy másik munkastílus, mert a molekuláris biológia mindig is redukcionista tudomány volt, amely meglehetősen részleges megfigyelésekkel foglalkozik. És szidták ezért - azt mondták, hogy külön tanulmányozhatja a fokozatokat, de soha nem fogja megérteni, hogyan működik az óra. A rendszerbiológiában pedig az emberek csak „az órát mint egészet” nézik, és megpróbálják leírni a teljes mechanizmus működését.

A bioinformatikának van egy harmadik stílusa is, egy harmadik változata – ez a molekuláris evolúció. Az ilyen vizsgálatok során összehasonlítjuk a különböző lények tanulmányozásából származó adatokat. Megpróbáljuk megérteni, hogyan zajlott le a gének és a genomok evolúciója, hogyan működik a szelekció, és miért különböznek egymástól igazán a különböző állatok emiatt. Elmondhatjuk, hogy ez az evolúcióbiológia problémáival való munka a molekuláris biológia módszereivel.

— Adnak-e bioinformatikai Nobel-díjat?

- Ez egy nagyon érdekes kérdés. Még nem adták, és az előrejelzésem szerint a közeljövőben nem adják.

Általánosságban úgy gondolom, hogy a biológiai Nobel-díjnak most nincs jelentősége, mert a modern biológia nagyon kollektív tudomány. Általában az történik, hogy valaki kezdeti megfigyelést tett, valaki kifejlesztette, majd valaki más fejlesztette ki, vagy mondjuk ez alapján csinált valami hasznosat. És ha megnézzük, a legújabb biológiai Nobel-díjakat mindig a tudományos közösség zúgolódása kíséri – azt mondják, hogy a díjat nem annak adták, aki ténylegesen tette ezt a felfedezést, másoknak kellett volna odaadni. Ennek eredményeként mindez nagyon értelmetlenné válik. Minden díj körül van még egy tucat ember, akinek szintén odaadható.

A bioinformatikában ez a helyzet a végletekig terjed. Először is mások adataival dolgozunk. Másodszor, az ilyen művek mindig társszerzők, és általában nagyon sok társszerzővel. Konkrétan senki sem jobb sok másnál. Ugyanakkor, mint kollektív egész, a bioinformatika hihetetlenül hasznos tudomány.

— Akkor mondja el, melyek a legfontosabb felfedezések a bioinformatika keretein belül?

„Például az élőlények taxonómiájáról alkotott elképzeléseink nagymértékben megváltoztak. A külső sajátosságokon, anatómián és fiziológián alapuló klasszikus taxonómia sok esetben egyszerűen nem működött – például a baktériumok esetében. A molekuláris biológia megjelenésével sokkal következetesebb elvekre építettük a taxonómiát.

Íme egy példa az ilyen apró, de szórakoztató felfedezések területéről. Mindenki tudja, hogy a bálna emlős. De megjelenésében teljesen különbözik a többi emlőstől. Kétféle biológiai eltérés létezik bárkitől. A kacsacsőrűek nem hasonlítanak senkihez, mert az evolúció teljesen külön ágát képezik. A bálnák pedig nem olyanok, mint bárki más, mert nagyon sajátos körülmények között élnek, és fiziológiájuk teljesen át van építve, hogy megfeleljen a környezetüknek. És ez viszonylag nemrég történt. De hát biztosan vannak a szárazföldön a bálnákhoz hasonló lények. Ki ez?

A bioinformatika segítségével pedig sikerült kideríteni, hogy a bálnák a vízilovak legközelebbi rokonai. Sőt, a vízilovak közelebb állnak a bálnákhoz, mint a tehenekhez, az antilopokhoz, a sertésekhez és mindenki máshoz, akik formálisan ugyanabban az artiodaktilusban vannak. Kiderült, hogy a bálnák csak nagyon megváltozott vízilovak.

A végén kiderült, hogy egyáltalán nem minden volt így. A gombák az állatok rokonai, nem a növények. Az algák, mint kiderült, nagyon sok alapvetően különböző faj, és néhány közelebb van a növényekhez, és néhány ugyanolyan távol van tőlük és az állatoktól. És ami a legfontosabb, a többsejtűség többször is felmerült egymástól függetlenül. Ez teljesen megváltoztatja az iskola biológiával kapcsolatos elképzeléseit is.

Egy másik bioinformatikai felfedezés az alternatív splicing. Kiderült, hogy egy gén több fehérjét is kódolhat, amelyekben egyes részek azonosak, mások pedig teljesen eltérőek. Ezt „alternatív splicingnek” hívják. Sokáig azt hitték, hogy ez egy egzotikus dolog, ami meglehetősen ritka. Aztán kiderült, hogy az emberben szinte minden gén több fehérjét kódolhat, és az alternatív splicing nem ritka dolog, hanem mindenütt jelen van.

Bioinformatika nélkül egy ilyen felfedezés egyszerűen lehetetlen lenne, mert az állítás a gének egészére vonatkozik, nem pedig egy egyedi génre. Ez a rendszerbiológia.

– Mennyibe kerül a bioinformatika? Lehet-e gyakorolni egy távoli faluban?

- Nos, legalább a bioinformatikát meg lehet csinálni, és elég sikeresen Oroszországban - és ez a modern időkben meglehetősen távoli hely. A bioinformatikának a lényeg a jó internetkapcsolat, mert rengeteg adatot kell letölteni. Aztán minden attól függ, hogy pontosan mit csinálsz. Gyakran szüksége van egy jó erős számítógépre.

De vannak olyan feladatok, amiket egyszerűen laptopon is el lehet végezni - ennek ellenére szinte mindig valamilyen nagy teljesítményű számítógépet használsz, csak éppen nincs ilyen -, valaki által írt és a szerverén futó programokat használsz. A távoli falvakban már elérhető a laptop és az internet is, így ez nem probléma.

A másik dolog az, hogy nagyon nehéz bármilyen tudományt elszigetelten tanulmányozni. Mindig meg kell beszélni valakivel. Nagyon nehéz érdekes problémát kitalálni, ha nem beszélsz senkivel. De ha már tanult valamit, akkor valószínűleg elmehet a nyaralójába, és ott megteheti.

Ebből a szempontból a bioinformatika természetesen sokkal könnyebben kivitelezhető, mint a kísérleti biológia. Éppen most volt a világbajnokság, és betiltották a radioaktív anyagok behozatalát Oroszországba. A radioaktív nyomjelzők pedig számos laboratóriumi biológia kísérlet kulcselemei. Ennek eredményeként hatalmas mennyiségű molekuláris aktivitás egyszerűen kikapcsolt két hónapra. A bioinformatikában valami hasonló történt a Telegram legutóbbi blokkolásakor – az oldalak nem működtek, nem lehetett működni.

- Valójában csak nagyon szerencsés voltam. Egy időben, amikor elvégeztem a mechanikai-matematikai karon, éppen csak megjelent a bioinformatika. És kiderült, hogy ez egy olyan tudomány, ahol egyrészt hasznos volt a matematikai végzettségem, másrészt még mindig az igazi biológia. És bizonyos mértékig a nyelvészet: végül is a genom „betűk” és „szavak”. Mindig is nagyon érdekelt a biológia és a nyelvészet.

Ráadásul a bioinformatikát akkor nem kellett tanítani, meg kellett csinálni. Volt olyan csodálatos időszak, amikor előállt egy probléma, leülhetett és megoldhatta. Valószínűleg te voltál az első, aki felvette. Ebben a tekintetben nekem is nagy szerencsém volt. Ez már nem így van.

Jegyek a VK Festre vásárolhatók

Bioinformatika divatos szóvá vált a tudomány modern világában. Körülbelül egy-két évtizeddel ezelőttig az emberek a biológiát és a számítástechnikát két teljesen különböző területnek tekintették. Az egyik az élőlényeket és azok testfunkcióit tanulmányozta, míg a másik számítógépekkel és információs rendszerekkel foglalkozott. Manapság azonban úgy tűnik, hogy kapcsolat van e két terület között, és ez az új terület, a bioinformatika a számítástechnika és a biológia ötvözeteként jelent meg.

Mi a bioinformatika?

bio + számítástechnika = bioinformatika
Bioinformatika  — egy interdiszciplináris terület, amely módszereket és szoftvereszközöket fejleszt a biológiai adatok megértéséhez. Interdiszciplináris tudományterületként a bioinformatika a számítástechnikát, a statisztikát, a matematikát és a mérnöki ismereteket egyesíti a biológiai adatok elemzésére és értelmezésére.

A különféle biológiai vizsgálatok a biológiai adatok mennyiségének exponenciális növekedését eredményezik, és nagyon nehéz manuálisan elemezni. Itt jön a segítség a számítástechnika és az informatika. Különféle számítási módszereket alkalmaznak a biológiai adatok pontosabb és hatékonyabb elemzésére, valamint a feldolgozási folyamat automatizálására. Ezért a bioinformatika a biológia és az orvostudomány területén felmerülő problémák megoldására szolgáló adattudományi területnek tekinthető.

Miért érdemes bioinformatikát tanulni és alkalmazni?

A bioinformatika interdiszciplináris tudomány lett, és ha Ön biológus, akkor a bioinformatikai ismeretek nagy hasznát vehetik kísérletei és kutatásai során.

A nemzetközi munkaerőpiac jelenleg tele van álláslehetőségekkel bioinformatikai ismeretekkel rendelkező emberek számára. A nagy gyógyszeripari, biotechnológiai és szoftvercégek bioinformatikai szakértelemmel rendelkező szakembereket keresnek, akik hatalmas mennyiségű biológiai és orvosi információval dolgozhatnak.

A bioinformatikát elsősorban a következő területeken használják pontosságÉs megelőző gyógyászat. A precíziós orvoslás alapja az egyéni páciensekre szabott orvosi módszerek, beleértve a kezelési és diagnosztikai módszereket. A betegségek kezelése helyett a precíziós medicina a betegségek megelőzésére és megelőzésére irányuló beavatkozások kidolgozására összpontosít. Olyan betegségekre összpontosít, mint pl influenza, Rák, szívbetegségÉs cukorbetegség.

Az azonosítás érdekében kutatásokat végeznek genetikai változások betegeknél, lehetővé téve a tudósok számára, hogy jobb kezeléseket, sőt lehetséges megelőző intézkedéseket javasoljanak. Az ilyen genetikai változások által okozott rák bizonyos típusai korán azonosíthatók, és a kezelés megkezdhető, mielőtt az állapot rosszabbodik.

Hogyan lehetsz bioinformatikus szakember?

Mielőtt belemerülne a témába, a kezdeti szakaszban tudnia kell egy kicsit biológia , genetikaÉs genomika. Ez magában foglalja a gének tanulmányozását, DNS, RNS, fehérjeszerkezetek, különféle szintézis folyamatok stb.

Akkor tanulnod kell biomolekuláris szerkezetek(például a következőben található sorozatok: DNS, RNSés fehérjék) és a különféle modellek felfedezésének és elemzésének módszerei, valamint az ezekről szóló információs oldalak. Különböző módszerek által használt különböző algoritmusokkal fog találkozni. Ezenkívül lehetőséget kap különféle gépi tanulási és adatbányászati ​​technikák használatára, mint például a rejtett Markov modellek, neurális hálózatokÉs klaszterezés.

Mivel nagy mennyiségű adattal lesz dolgod, fontos, hogy jól megértsd statisztika hogyan kell elemeznie az adatokat a konkrét követelményeknek megfelelően.

Természetesen jó képességekre lesz szükség programozás. Programozási nyelvek, mint pl R, PitonÉs Bash ezek a leggyakrabban használt nyelvek a biológiai adatok elemzésében. Annak eldöntése, hogy hol kezdje, a céljaitól függ. Használhat más nyelveket is, mint pl C/C++És Jáva.

Az alapvető fogalmak alapvető megértése után más területeket is felfedezhet, mint pl szerkezeti bioinformatika,rendszerbiológiaÉs biológiai hálózatok.

Az ember csodálatos teremtmény, és a genomja még lenyűgözőbb. A DNS-molekulában tárolt teljes emberi genom csodálatos! Egy perc alatt hatalmas mennyiségű adat kódolható és megfejthető, hogy megértsük, mely génexpressziós változások vezethetnek végzetes genetikai betegségekhez. Az egészségügyi rendszereknek intézkedésekre van szükségük az ilyen betegségek kimutatására, valamint olyan kezelési és megelőzési intézkedésekre, amelyek segítenek életeket menteni.

A bioinformatikában bebizonyosodott, hogy nagy lehetőségek rejlenek a betegségek korai stádiumában történő azonosításában, a kezelések azonosításában és az emberek életének javításában. A számítástechnika tudása által ihletett területek, mint például a géntechnológia, az orvostudomány és a közegészségügy, az egyes betegek kezelésétől egész populáció meggyógyításáig fejlődhetnek.

Bioinformatikai koncepció

A bioinformatika általában a számítógépek használatát jelenti biológiai problémák megoldására. Jelenleg ezek szinte kizárólag a molekuláris biológia feladatai. Ennek oka, hogy az elmúlt 20-25 évben valóban kolosszális kísérleti anyag halmozódott fel kifejezetten a biológiai molekulák (például fehérjék és nukleinsavak) felépítéséről és működéséről, elég csak az emberi genomot idézni. Ennek az anyagnak az elemzéséhez fejlett számítógépes módszerekre van szükség. Ezért a bioinformatikát a világ legtöbb tudományos központjában a számítógépes molekuláris biológia szinonimájaként értelmezik.

Ennek a tudományágnak több fő iránya van attól függően

vizsgált tárgyak:

  • * Szekvencia bioinformatika.
  • * Strukturális bioinformatika.
  • *Számítógépes genomika

A bioinformatika főbb irányai a vizsgált objektumok függvényében

Szekvencia bioinformatika

Szekvencia bioinformatika

A bioinformatika jelenleg legismertebb és leghatékonyabb alkalmazása a genomok elemzése, amely szorosan összefügg a szekvenciaanalízissel.

A bioinformatika ezen ága nukleotid- és fehérjeszekvenciák elemzésével foglalkozik. Jelenleg hatékony kísérleti módszereket fejlesztettek ki a nukleotidszekvenciák meghatározására. A nukleotidszekvenciák meghatározása rutinszerű, jól automatizált eljárássá vált. Egy rutinszerű, jól automatizált eljárás eredményeként hatalmas mennyiségű genetikai szöveget sikerült már megszerezni. Így 2007. február 15-én az EMBL adatbázis 87 000 493 nukleotid szekvenciát leíró dokumentumot tárol, amelyek összesen 157545686001 karaktert (nukleotidot) tartalmaznak, ami hozzávetőlegesen 105 vastag kötetből álló könyvtárnak felel meg tiszta betűtípussal. A megfelelő gén megtalálása az EMBL-ben olyan, mintha egy idézetet találnánk egy ilyen könyvtárban. Számítógép segítsége nélkül ezt finoman szólva is nagyon nehéz megtenni. Az adatok mennyisége pedig exponenciálisan növekszik.

Képzeljük el egy kis baktérium genomját – ez egy 1-10 millió karakter hosszú folyamatos lánc, és nem az összes DNS kódol fehérjéket. A bioinformatikai feladatok első típusa az a feladat, hogy nukleotidszekvenciákban keressünk speciális régiókat, fehérjekódoló régiókat, RNS-t kódoló régiókat (például tRNS), szabályozó fehérjék kötőhelyeit stb. És ezek nem mindig egyszerű feladatok, például az eukarióta szervezetek génjei váltakozó „értelmes” és „nonszensz” fragmentumokból (exonokból és intronokból) állnak, és az „értelmes” fragmentumok közötti távolság elérheti a több ezer nukleotidot.

Hadd találják meg a gént. Mit kódol? Miért van rá szükség?

Ha fehérjét kódoló DNS-szakaszról beszélünk, akkor egy nagyon egyszerű művelettel - ismert genetikai kóddal történő transzláció - érhető el. aminosav (fehérje) szekvenciák. Az eddig ismert 4 273 512 fehérje közül a szekvenciák körülbelül 94%-a csak ilyen hipotetikus fordítás, és semmi többet nem tudunk róluk. Az automatikus szekvenszerekből érkező információ sebessége meghaladja a jelentésének megértésének sebességét! De a biológiai tárgyak olyan tárgyak, amelyek az evolúció folyamatában keletkeztek. Az összehasonlító evolúciós megközelítés a biológia egyik legerősebb megközelítése. Például az egyik szervezetből származó fehérje működését kísérletileg jól tanulmányozták, és hasonló aminosav-szekvenciájú fehérjét találtak egy másik szervezetben. Feltételezhető, hogy a második (ismeretlen) fehérje ugyanazt vagy hasonló funkciót lát el. És itt azonnal felmerül néhány kérdés. Először is mit jelent a hasonló sorrend? Hogyan hasonlítsuk össze a sorozatokat? Milyen mértékű szekvencia-hasonlóságra feltételezhetjük, hogy a fehérjék hasonló funkciókat látnak el? A szekvencia-összehasonlítás (illesztés) kritikus feladat a bioinformatikában. Nehéz olyan modern biológust találni, aki soha nem használta a Blastp és a ClustalX programokat, ezeknek a programoknak a megjelenése már nagy siker a bioinformatikában. A modern bioinformatikusok azonban nem boldogok, és folyamatosan fejlesztik az igazítási módszereket. Számos példa van arra, hogy az összehasonlító evolúciós megközelítés a bioinformatikai módszerekkel kombinálva új biológiai ismereteket generál.

A genetikai szövegek olyan szövegek, amelyek nagy zajt tartalmaznak a kapcsolódó szekvenciák összehasonlításával, bizonyos esetekben lehetséges a zaj kiszűrése és egy jel azonosítása, például egy szabályozó fehérjéhez kötődni képes nukleotidok rövid szekvenciája; savmaradékok egy enzimben, amely a szubsztrátkötésért felelős. Hogy biztosak legyenek az eredményben, a bioinformatikusok valószínűségszámítást és matematikai statisztikákat használnak. Összefoglalva, a bioinformatika fő feladatai az egyes szekvenciák elemzésével kapcsolatban a következők:

  • * Két sorozat egymáshoz igazítása és hasonlóságának meghatározása
  • * Több igazítás kialakítása
  • * Génfelismerés
  • * A szabályozó fehérjekötő helyek előrejelzése
  • *Az RNS másodlagos szerkezetének előrejelzése

Az új kísérleti technológiák létrehozása számos új kihívás elé állítja a bioinformatikát. Például a tömegspektrometria fejlődése lehetővé teszi (eddig elvileg) a sejtben jelen lévő teljes fehérjekészlet egy kísérletben történő elemzését. A probléma megoldásához a tömegspektrumok és a genomok közös elemzésére van szükség. Az új biológiai jelenségek és mechanizmusok felfedezése új problémák megjelenéséhez is vezet. Jó példa erre az RNS interferencia felfedezése, amelyért 2006-ban élettani Nobel-díjat kapott. Ez a felfedezés a bioinformatikai munka egész hullámát eredményezte, amelyek a mikroRNS-ek és új mikroRNS-ek kötőhelyeinek felkutatására irányultak. Sok megállapítást ezután kísérletileg megerősítettek.

Mindenki tudja, hogy a bioinformatikának köze van a számítógépekhez, a DNS-hez és a fehérjékhez, és hogy ez a tudomány élvonala. A biológusok közül sem mindenki büszkélkedhet részletesebb információval. Mihail Szergejevics Gelfand a Chemistry and Life-nak mesélt néhány olyan problémáról, amelyeket a modern bioinformatika megold (az interjút Jelena Kleshchenko rögzítette).

Információk a biológiában

Az elmúlt évtizedekben számos új tudományos tudományág jelent meg divatos névvel: bioinformatika, genomika, proteomika, rendszerbiológia és mások. De lényegében a bioinformatika, mint mondjuk a proteomika, nem tudomány, hanem több kényelmes technológia és konkrét problémák halmaza, amelyek ezek segítségével megoldhatók. Elmondható, hogy minden ember, aki tömegspektrometriával fehérjekoncentrációt határoz meg, vagy fehérje-fehérje kölcsönhatásokat vizsgál, a proteomika területén dolgozik. De lehetséges, hogy idővel ez a felosztás kevésbé lesz fontos: az alkalmazott technológia kevésbé lesz jelentős, mint a gondolkodás és a kérdésfeltevés. Ebben az értelemben pedig a bioinformatika, mint a legrégebbi tudományok közül - akár 25 éves is - a cementáló elv szerepét tölti be, mert akárhogyan is szerzik be az adatokat, az mégis a számítógépben köt ki. Nem is lehet más: a baktérium genom mérete több millió nukleotid, egy magasabb rendű állaté százmillió vagy milliárd. A génaktivitást vizsgáló Transcriptomics több tízezer hírvivő RNS koncentrációjáról, a proteomika - több százezer peptidről és fehérje-fehérje kölcsönhatásokról szerez adatokat. Ennyi információval nem lehet kézzel dolgozni. Emlékszünk még arra, hogyan nyomtattunk papírra nukleotid szekvenciákat, majd kivágtuk a kinyomtatott vonalakat, egymás alá helyeztük, és ilyen kézműves módon végeztük az igazítást - hasonló területeket kerestünk. Ez lehetséges volt, ha több tíz vagy száz nukleotidról vagy aminosavról volt szó, de a modern adatmennyiség mellett speciális eszközökre van szükség. Ilyen eszköztárat biztosít a bioinformatika - gyakorlatias értelemben a biológusok érdekeit szolgáló alkalmazott tudomány.

Mivel saját munkám elsősorban a genomikai adatok elemzését foglalja magában, a következőkben elsősorban a genomikára koncentrálok. Már a szekvenálók legújabb generációjának megjelenése előtt az adatmennyiség kezdett felülmúlni Moore törvényét: a genomok nukleotidszekvenciái gyorsabban halmozódtak fel, mint a számítógépek ereje. Nem túlzás azt állítani, hogy az elmúlt években a biológia kezdett átalakulni „adatban gazdag” tudománnyá. Viszonylagosan a „klasszikus” molekuláris biológiában egy kísérletben egy biológiai tényt állapítottak meg: egy fehérje aminosavsorrendjét, működését, a megfelelő gén szabályozását. És most az ilyen jellegű tényeket ipari úton szerzik meg. A molekuláris biológia azon az úton halad, amelyet az asztrofizika és a nagyenergiás fizika már megtett. Egy folyamatosan működő rádióteleszkóp vagy gyorsító esetén megoldódik az adatkinyerés, előtérbe kerülnek az adattárolás és -feldolgozás problémái.

Ugyanez történik a biológiával is, és nagyon gyorsan, és nem mindig könnyű változtatni. Akinek azonban sikerül, az nyer. Szemináriumunkon az egyik biológus elmondta, hogyan tanulmányozott kollégáival egy bizonyos fehérjét a kísérleti biológia hagyományos módszereivel. Ez nehéz feladat: tudva, hogy egy bizonyos funkciót egy sejtben végeznek, keresse meg az ezért felelős fehérjét. Megtalálták ezt a fehérjét, elkezdték tanulmányozni, és meggyõzõdtek arról, hogy léteznie kell egy másik, hasonló tulajdonságokkal rendelkezõ fehérjének, mivel az elsõ jelenléte nem magyarázza meg az összes megfigyelt tényt. A második fehérje keresése az első hátterében még nehezebb volt, de sikerült nekik is. Aztán megjelent az emberi genom – és miután hozzáfértek a szekvenciájához, még egy tucat ilyen fehérjét találtak...

Ebből a példából egyáltalán nem következik, hogy a gyakorlati molekuláris biológia kimerítette volna magát. Inkább új eszközöket tanult meg: nemcsak az elektroforézis utáni csíkokat a gélben, az mRNS és a fehérjék koncentrációját, vagy mondjuk a baktériumok szaporodási sebességét, hanem a számítógépben tárolt óriási adatmennyiséget is. Vegyük észre, hogy az értelmezés eleme elkerülhetetlenül jelen van a klasszikus biológiában. Amikor egy kutató azt állítja, hogy az A fehérje kiváltja a B gén transzkripcióját, akkor nem közvetlenül azt figyeli meg, hogy a fehérje hogyan lép kölcsönhatásba a gén szabályozó régiójával, hanem a gélen lévő sávok elhelyezkedéséből és más kísérleti adatokból vonja le ezt a következtetést. A bioinformatikában lényegében ugyanez a helyzet, csak a végletekig emelve: kész adatok vannak a számítógépen, és ezek között kell találni olyan rejtvényeket, amelyekből képet lehet összeállítani.

A műszaki bioinformatika területe az elsődleges adatfeldolgozást foglalja magában. A szekvenáló maga nem „olvas” DNS-molekulákat, hanem kimeneti fluoreszcencia görbéket állít elő, amelyek csúcsait még nukleotidszekvenciává kell alakítani. Ezt a problémát minden alkalommal új módon oldják meg egy új szekvenáló berendezésnél, és a bioinformatika oldja meg. Ráadásul, mint már említettük, a kapott adatokat valahol tárolni kell, könnyen hozzá kell férni stb. Mindezek tisztán technikai problémák, de nagyon fontosak.

Bonyolultabb és érdekesebb feladat a bioinformatikusok számára, hogy genomadatok alapján konkrét megállapításokat kapjanak: az A fehérje ilyen és olyan funkcióval rendelkezik, a B gén ilyen-olyan körülmények között kapcsol be, a C, D és E gének egyszerre fejeződnek ki. , és termékeik komplexet alkotnak. Ezt tesszük, és ez a tudományunk gyakorlati alkalmazása. Számunkra a felhasználók más biológusok, akikkel a számukra érdekes tényeket közöljük.

Helyszín és szabályozás

Hogyan következtethetünk a fehérjék és gének működésére egy nukleotid szekvenciából? Az első megfontolás triviálisnak tűnik: ha egy fehérje hasonló egy másik, már tanulmányozott fehérjéhez, akkor nagy a valószínűsége annak, hogy megközelítőleg ugyanazt csinálja. Valójában ez nem is annyira banális: a bioinformatika ezen irányában az első komoly siker az volt, hogy a vírus onkogének magának a szervezetnek „elrontott” génjei.

Ma már nem nehéz ilyen összehasonlítást végezni. Léteznek adatbankok a nukleotid- és fehérjeszekvenciákról (részletesebben a Chemistry and Life, 2001, 2. szám). Az 1980-as évek végén fogalmazódott meg egy általános elképzelés, hogy ennek hogyan kellene működnie, és ebben az értelemben a bioinformatika készen állt a genomikai adatok özönére. Ma ez egy szabványos internetes szolgáltatás: feltöltöd a szekvenciádat egy ablakba, megnyomsz egy gombot, és néhány másodperc múlva megjelenik, hogy melyik szekvenciához hasonlít az adatbázisból.

Ezután kezdődnek a finomabb megfontolások. Ismeretes például, hogy a baktériumokban a gének gyakran operonokba szerveződnek, azaz egyetlen hírvivő RNS-ként íródnak át. Különféle evolúciós elméletek magyarázzák, miért történik meg, hogy funkcionálisan rokon gének alkotnak operont. Az első elmélet szerint kényelmes és hasznos, ezért az evolúció támogatja. Ha a fehérjéknek közös funkciójuk van, például egy anyag feldolgozásának különböző szakaszaiért felelősek, akkor logikus, hogy egy időben, ugyanazon jel szerint jelennek meg a sejtben (természetesen közös mRNS-sel és szabályozással mindenkinek ugyanaz) és egyenlő mennyiségben. A második állítás kevésbé triviális és szebb. Azoknak a géneknek, amelyek termékei kapcsolódó funkciókat látnak el, a vízszintes átvitelnek köszönhetően a közelben vannak. Ez egy igen jelentős mechanizmus a baktériumok evolúciójában: az egyik baktérium genomjának szakaszai egy másikba kerülnek, ami ennek köszönhetően új, hasznos tulajdonságokra tehet szert. Nyilvánvaló, hogy ha egy anyagcsereútnak csak egy génje kerül át az új genomba, akkor a megfelelő fehérje használhatatlan lesz: nincs szubsztrátja az általa katalizált reakciónak, termékének viszont nincs kit feldolgoznia. Ennek az elméletnek a további megerősítése, hogy a baktériumoknak genomiális lókuszai vannak, amelyekben az azonos anyagcsereútból származó gének különböző DNS-szálakon fekszenek, és ezért különböző irányokba íródnak át. A közös transzfer megnövekedett valószínűsége itt mindenképpen nagy szerepet játszik.

Az a tény, hogy két gén egymás mellett helyezkedik el egy genomban, nem sokat mond funkcionális kapcsolatukról, az is lehet, hogy véletlen. Azonban képesek vagyunk azonosítani a géneket különböző szervezetekben. Szekvenciáik természetesen nem esnek egybe a nukleotidig lefelé, de meglehetősen jelentősen eltérhetnek egymástól. De vannak bizonyos szabályok, amelyek alapján azt mondhatjuk, hogy ez ugyanaz a gén, mondjuk az Escherichia coliban és a szénabacilusban. Tehát, ha egy génpár nem egy genomban, hanem ötvenben található a közelben, és különböző taxonómiai csoportok képviselőiben (vagyis ez az elrendezés nem csak egy közös őstől öröklődik), ez azt jelenti, hogy valóban mindegyik felé vonzódnak. más. Ha az evolúció nem támogatta volna közelségüket, nem őrizték volna meg. Ez azt jelenti, hogy feltételezhetjük, hogy funkcionálisan összefüggenek.

A második szempont hasonló az elsőhöz. Nem minden baktériumnak ugyanaz a génkészlete: például ha egy gén egy bizonyos szénhidrát feldolgozásához szükséges enzimet kódol, akkor egy olyan baktériumban, amely nem táplálkozik ezzel a szénhidráttal, nem lesz ilyen. De egy baktérium, amely ezzel a bizonyos szénhidráttal táplálkozik, minden szükséges felszereléssel rendelkezik: enzimekkel és transzportfehérjével, amely a szénhidrátot a sejtbe juttatja. A funkcionálisan rokon gének a „mindent vagy semmit” elv szerint jelen vannak a genomban: mint már említettük, értelmetlen egy anyagcsereútnak csak egy töredéke, a baktériumok pedig gazdaságos lények, ami nem hasznos, az gyorsan eltűnik a genomból . Ezért ha készítünk egy táblázatot, amelyen különböző géneket sorokba rendeznek, és különböző genomokat oszlopokba rendezünk, és pro és kontra pro és kontra géneket jelölünk, amelyek egy adott genomban jelen vannak vagy hiányoznak, akkor ugyanazt a funkciót betöltő géncsoportokat fogjuk látni. És valószínűleg egy ismeretlen génnek tulajdonítható, amely ugyanazokkal az előnyökkel és hátrányokkal rendelkezik, mint egy bizonyos csoportnak.

A harmadik szempont a génaktivitás szabályozására vonatkozik. A gén közelében általában vannak olyan területek, amelyekkel bizonyos fehérjék kölcsönhatásba lépnek – kiválthatják a transzkripciót, blokkolhatják azt, szabályozhatják annak intenzitását, vagyis a gén aktivitása minden pillanatban tőlük függ. Néhány szabályozó régiót nagyon jól azonosítanak a karakteres „betűk” sorozatai, de ez ritka. Például alacsony pontossággal ismerjük fel a genomokban a transzkripciós faktor kötőhelyeit, és a megfelelő helyekkel együtt egy csomó „szemetet” halmozunk fel – hasonló rövid régiókat, amelyek valójában nem kapcsolódnak a génszabályozáshoz. De mivel azokat a géneket, amelyek együtt működnek, közösen szabályozzák, a valódi kötőhelyek egy tucat genomban ugyanazok a gének előtt helyezkednek el, a véletlenszerűek pedig itt-ott szétszóródnak, és semmiféle mintázat nem követhető a helyükön. Az eredmény egy erőteljes szűrő, amely lehetővé teszi a „szemét” kiszűrését. És ha egy ismeretlen funkciójú gén előtt következetesen ismerős hely található, akkor egyértelmű lesz, hogy ez a gén egy funkcionális alrendszer részeként szabályozott, amelyet ugyanaz a szabályozó szabályoz, és ugyanazt a funkciót látja el.

Engem leginkább a szabályozási rendszerek fejlődésének tanulmányozása érdekel, de ennek a mellékterméke a sok funkcionális előrejelzés. A kutatás úgy alakul, mint egy detektívtörténet: minden egyes megfontolás külön-külön nagyon kicsi, de ha sok a „bizonyíték”, és mindegyik ugyanazt a pontot találja el, akkor magabiztos kijelentések születhetnek. Volt olyan eset, amikor részletesen leírtuk a szabályozó rendszert - egy transzkripciós faktort, annak kötőhelyeit, azt, hogy represszor és nem aktivátor lesz, hogy a kötéshez két dimer kooperatív kölcsönhatására van szükség - egyszerűen a a genom betűi. Ezt követően mindez a részletekig helyesnek bizonyult.

Riboszóma mint cinkraktár

Az egyik ilyen alkotásban központi szerepet játszott Jekaterina Panina, aki akkoriban a Moszkvai Állami Egyetem Mechanikai és Matematikai Karának hallgatója volt (később a Los Angeles-i Kaliforniai Egyetemen végzett posztgraduális iskolába, és igazi kísérletező lett. biológus). Harmadévesen jött hozzánk, és azt mondta, hogy biológiát szeretne tanulni. A Mechanikai és Matematikai Kar végére több cikket publikált komoly folyóiratokban.

A baktériumsejtnek cinkionokra van szüksége: ezek például egyes enzimek részei kofaktorként. Ennek megfelelően létezik molekuláris gépezet, amely a cinkkel kapcsolatos összes folyamatot kiszolgálja. A cinkrepresszort (nagy mennyiségben a cink mérgező a sejtre nézve, ezért megfelelő koncentrációban történő szállításának kikapcsolása nem kevésbé fontos, mint a környezetből való kinyerése) az előző fejezetben ismertetett ideológiát alkalmazva tanulmányoztuk. Ha van egy potenciális cink-represszor hely a gén előtt, akkor a gén összefüggésben lehet a cink anyagcserével. Így „számoltuk ki” egykor a cink transzportert, egy transzmembrán fehérjét, amely biztosítja a cink bejutását a sejtbe.

Tehát 2002-ben Katya észrevette, hogy valamilyen oknál fogva a potenciális cink-represszor helyek gyakran a riboszomális fehérjék génjei előtt jelennek meg. Ezt a megfigyelést megosztotta a témavezetőjével, és azt mondtam, hogy mivel a genomban több mint száz riboszomális fehérje gén található, és a helyek különböző gének előtt találhatók, ez véletlen egybeesés. Ám Katya nem hitt a véletlenben, és talált egy cikket Jevgenyij Kunintól (a sejt eredetének modelljéről, lásd M. A. Shkrob cikkét az augusztusi számban), amely nem sokkal korábban jelent meg. Ott kimutatták, hogy egyes riboszómális fehérjék egy cinkkötő motívumot, úgynevezett cinkszalagot, három vagy négy ciszteint tartalmaznak egymástól megfelelő távolságban és a megfelelő kontextusban. Kunin és munkatársai egyik fontos megfigyelése az volt, hogy ugyanaz a fehérje bizonyos szervezetekben rendelkezik ezekkel a cink-motívumokkal, másokban viszont nem, de látszólag cink nélkül is normálisan működik. És egyes baktériumokban ugyanaz a fehérje két változatban is elérhető, cinkszalaggal és anélkül.

És Katya észrevette, hogy az utóbbi esetben, amikor két fehérjeváltozat van egy genomban, a cinkszalag nélkülit elnyomja a cinkrepresszor. Vagyis cink jelenlétében expresszálódik egy olyan fehérjeváltozat, amelyiknek cinkre van szüksége, cink hiányában pedig olyan fehérjeváltozat expresszálódik, amelynek nincs szüksége rá.

Minden sejt létezésének alapja a nehézipar, a termelőeszközök előállítása, ahogyan a szocializmus politikai gazdaságtanáról szóló előadásokon is tanítottak bennünket. A sejt fehérjéjének körülbelül 70%-a riboszómákból, organellumokból áll, amelyek más fehérjék előállításához szükségesek. Másrészt a cink a sejt számára létfontosságú enzimek, például a DNS-polimeráz kofaktora. Ha a cink kevéssé válik, a riboszómális fehérjék teljesen felveszik, az enzimeknek nem marad semmi, és a sejt elpusztul. De a sejtnek van egy tartalék másolata a riboszomális fehérjéről, amelyhez nincs szüksége cinkre. Feltételeztük, hogy cinkhiányos körülmények között a sejt bekapcsolja az ilyen fehérjék szintézisét, és ezek a cinktartalmú fehérjék helyett a riboszómák egy részébe integrálódnak. Ebben az esetben bizonyos mennyiségű cink szabadul fel. Lehet, hogy a riboszómák egy kicsit kevésbé hatékonyan működnek ezután, lehet, hogy egyáltalán nem – de azért, hogy a lényegesen kisebb példányszámban képviselt létfontosságú enzimekhez elegendő cink legyen, érdemes feláldozni egy a riboszómák kis hányada.

Írtunk egy tanulmányt, de egy éven belül egyetlen jó hírű folyóirat sem fogadná el a riboszómák őrült elméletét cinkraktárként. Katya lelete azonban nagyon szépnek tűnt számomra, és életemben egyetlen alkalommal használtam ki azt a tényt, hogy nagyapámnak az Egyesült Államok Tudományos Akadémia tagjaként joga van cikkeket benyújtani publikálásra a " Proceedings of the National Academy of Sciences of USA" Elküldte a cikket felülvizsgálatra Kuninnak, aki pozitívan értékelte (és úgy tűnik, valaki másnak). A cikk a PNAS-ban jelent meg, és ahogy hamarosan kiderült, éppen időben: hat hónappal később megjelent egy japán biológusok cikke, akik kísérletileg ugyanezt mutatták ki. Sejthető, hogy már régóta dolgoztak ezen, és valószínűleg kissé felzaklatta őket, hogy a számítógépes előrejelzés előre jelezte az eredményüket.

Megjegyzendő, hogy ez az egész történet nagyon apró privát megfigyeléseken alapul (cisztein van a fehérjében - nincs cisztein, van potenciális represszor hely - nincs hely...). De összességében ezek az apróságok lehetővé tették egy nem triviális következtetés levonását, amely teljesen helyesnek bizonyult. Általában, amikor cikkeket publikálunk, igyekszünk a lehető legvilágosabban elmondani, hogy melyik előrejelzésünket tartjuk megbízhatónak, és melyik bizonyulhat tévesnek. Tehát azok között, amelyekben biztosak voltunk, egy sem volt hibás (több tucat ellenőrzött már), de a gyengék között valóban előfordult defekt, bár szintén nem gyakran.

Csavarhúzó kivehető pengével

A transzporter fehérjékkel végzett munka sem volt kevésbé szép (csak a korai szakaszban vettem részt bennük, így jogom van dicsérni őket anélkül, hogy dicsekedővé válnék). A transzporterek a bioinformatikusok számára nagy sikert jelentenek, mivel a transzporterek azonosítása, különösen a bakteriális, meglehetősen egyszerű. Számos hidrofób hélix van bennük, amelyek áthaladnak a membránon: közöttük van egy csatorna, amelyen keresztül a sejt életéhez szükséges ion vagy molekula behatol a belsejébe. A transzmembrán szegmenseket speciális programok segítségével lehet megtalálni egy fehérjeszekvenciában. Ha pedig egy ismeretlen bakteriális fehérjéhez öt vagy hat ilyen szegmens tartozik, az szinte biztosan transzporter (mert más transzmembrán fehérjék, például a légzési lánc tagjai vagy a rodopszin jól ismertek). Azt még tisztázni kell, hogy milyen anyagot hordoz.

A transzporterek specifitásának kísérletben történő tanulmányozása átlag alatti élvezet. Az enzimekkel ez már szinte rutinfeladat, amit egy robotra lehet bízni. Túlexpresszálsz egy enzimet (vagyis rákényszeríted, hogy nagy mennyiségben szintetizálódjon), majd ötszáz különböző szubsztrátot kínálsz neki, és megnézed, melyik reagál vele.

A transzporter természetesen túlzottan is kifejezhető. De ahhoz, hogy működjön, azonnal be kell épülnie a membránba, különben a hidrofób szegmensek egymáshoz „tapadnak”, és a fehérje nem működőképes aggregátumokat képez. Ezért sok membrán vezikulát kell készíteni, ezekbe megfelelő irányban fehérjéket szúrni, majd megnézni, hogy a kívánt anyag bejut-e a vezikulákba. Ezenkívül a szállítók különbözőek. Egyesek hasznos anyagokat pumpálnak a sejtbe egy koncentrációgradiens ellenében, és erre fordítják az ATP-molekula energiáját, amelyet egy speciális fehérje - ATPáz - bont le. Mások másodlagos transzportot hajtanak végre - a „szükséges” molekula beengedésével egyidejűleg hidrogén-, kálium- vagy nátriumiont szabadítanak fel egy koncentrációgradiens mentén. Ha a transzporter ATP-függő, akkor ahhoz, hogy működjön, több fehérjéből kell összeállítani egy konstrukciót, beleértve az ATPázt is. És ha ez másodlagos transzport, akkor még mindig ki kell találnia, hogy melyik ionkoncentrációt kell növelni a labdán belül. Ebből világosan látszik, hogy a transzporterek biokémiája az erős akaratúak tudománya, és kevés kísérleti adat áll rendelkezésre róluk.

Másrészt bioinformatikai módszerekkel sokkal könnyebb meghatározni a transzporterek specificitását. Elég csak a már ismert logikához folyamodni: ha például ennek a fehérjének a szintézisét egy cinkrepresszor szabályozza, akkor nagy valószínűséggel cink transzporter lesz, és ha génje a ribóz katabolizmussal egy lókuszban található. géneket, nyilván ribózt visz át a sejtbe, pontosan így találtuk meg a riboflavin transzportert: van egy ismeretlen funkciójú fehérje, hat potenciális transzmembrán szegmense van, a riboflavin útvonal génjeivel együtt szabályozzák - ami azt jelenti. vagy a riboflavin, vagy prekurzora transzportere. De mivel egyes genomokban ez a transzporter és a riboflavin-függő fehérjék is jelen voltak, de nem volt út a riboflavin prekurzorokból történő szintéziséhez, ez azt jelenti, hogy csak a riboflavin transzportere lehet.

Egy adott előrejelzés kísérleti tesztelése sokkal könnyebb, mint a nulláról kezdeni. Mindig elmagyarázom a diákoknak, hogy a bioinformatikus egy teljesen védtelen lény, mint egy kalandregény szereplője, aki tudja, hol rejlik a kincs. Amíg csendben van, mindenki vigyáz rá és vigyáz rá, de amikor megszólal, már nincs rá szükség. Amint egy bioinformatikus azt mondta, hogy „ennek a fehérjének ilyen és olyan funkciója van”, már csak a kísérletezők tisztességén múlik, hogy ennek az állításnak az ellenőrzése után felvállalják-e társszerzőnek. A kijelentések pedig – ahogy az olvasó már láthatta – rendkívül egyszerűek és konkrétak, elég egyszer hangosan kimondani őket.

Ugyanebből az egyszerű következtetésből egy bonyolultabb, de egyben érdekesebb történet is indult. Vizsgáltuk a biotin bioszintézis-útvonal szabályozását (a biotin a H-vitamin, vagy a B7-vitamin, számos fontos enzim kofaktora). A biotin transzporter egyelőre ismeretlen volt. Munkánk során felfedeztünk egy transzport fehérjét, amely a biotinútvonal génjeivel együtt szabályozott, esetenként lokalizálódik. Aztán minden ugyanaz, mint a riboflavinnál: vannak olyan organizmusok, ahol nincs biotinútvonal, de vannak fehérjék, amelyek kofaktorként függenek tőle, és van ugyanaz a potenciális transzporter - tehát biotin transzporter.

Amint már említettük, a transzporterek ATP-függőek és másodlagos szállítást végeznek. A biotin transzporter magányos volt, nem látszott a közelben ATPáz gén, ami azt jelenti, hogy másodlagos transzporter volt. De aztán láttuk, hogy néhány genomban volt néhány ATPáz a biotin transzporter közelében. Az, hogy ez mit jelent, abban a szakaszban nem volt világos, ezért a cikkben egyszerűen megemlítettük egy mondatban.

Ugyanebben az időben a kobalamin útvonal szabályozását tanulmányoztuk. A kobalamin vagy a B12-vitamin szintén fontos enzimek kofaktora, egy nagyon nagy molekula, megfelelő összetettségű metabolikus útvonallal. Ennél a történetnél fontos, hogy a kobalamin molekula közepén egy kobalt ion található, amelyet ismét transzporterek juttatnak be a sejtbe. Találtunk jó néhány ilyen transzportert, publikáltunk róluk egy cikket, és hamarosan levelet is kaptunk Thomas Eitingertől a Humboldt Egyetem Mikrobiológiai Intézetétől (Berlin). Arra buzdított, hogy figyeljünk arra, hogy bármelyik kobaltszállító nikkelt is szállíthat, és fordítva, mert gyenge a specifikussága. Azt válaszoltuk, hogy a transzportereket a sejtben betöltött funkcionális szerepük szempontjából tekintjük, és ha a fehérjegén a kobalamin szintéziséhez szükséges nagy génkészlettel egy operonban helyezkedik el, természetesen a sejtnek szüksége van a fehérjére. kobaltszállító, bár in vitro nikkeltűrővé tehető. És ha egy transzporter gént látunk ugyanabban az operonban egy nikkelfüggő ureázzal, akkor ez minden bizonnyal egy nikkel transzporter.

Közös munkára volt kilátás, Dmitrij Rodionov, aki ezt a munkát végezte, német kollégáival közösen kis összegű közös támogatásra pályázott, és három hónapra Berlinbe ment. (Dmitrij a MEPhI-n végzett, utána nálunk tanult genomikát, majd az USA-ban dolgozott, most pedig a „Molekuláris és sejtbiológia” akadémiai programtól nyert ösztöndíjat egy új csoport létrehozására, és visszatér Moszkvába.)

Ekkor már elkezdtünk velük (e-mailben) egy nagy projektet készíteni a nikkel- és kobalttranszporterek összehasonlító genomikájával kapcsolatban, ahol egyrészt szabályozás szerint, másrészt lokalizáció szerint, kobalt- vagy nikkel-funkcionális fehérjékkel összekapcsolva osztályoztuk őket. . Tehát az egyik ilyen nikkel-kobalt családban furcsa dolgokat figyeltek meg. Egyrészt az ATPázok és az ioncsatornát alkotó transzmembrán fehérjék, ahogy az várható volt, a közelben helyezkedtek el, és együtt szabályozták őket. Másrészt ugyanabban az operonban lehet egy másik transzmembrán fehérje. Sőt, ezek az „idegen” fehérjék a kobalt- és nikkeltranszportrendszerekben meglehetősen eltérőek voltak, és nem voltak homológok, ellentétben az ATPázokkal és a transzmembránokkal. Ráadásul az ATPáz és a transzmembrán fehérje homológnak bizonyult azokkal az „extra” biotinfehérjékkel, amelyeket az előző vizsgálatban néha találtak vagy nem.

Még mindig nem tudom, hogyan vette rá Dima német kollégáit, hogy hajtsák végre a következő őrült kísérletet. A „klasszikus” biokémikusoknak, akik egész életükben a kobalt és a nikkel baktériumokban való transzportját tanulmányozták, azt javasolta: kapcsoljuk ki a transzporter ATPázát és a biotinnal homológ transzmembrán fehérjét, és csak egyetlen egyedi komponenst hagyjunk meg. Hiszen a biotin transzporternek nincs igazán szüksége ATPázra és a „fő” transzmembránra, ott vannak, akkor nincsenek - lehet, hogy a nikkel transzporternek sincs szüksége rájuk, egy magányos nem homológ transzmembrán magától megbirkózik? Nem tudni, hogy a tekintélyes német biokémikusok miért döntöttek úgy, hogy megteszik ezt a furcsa cselekedetet: megfosztják a látszólag közönséges ATP-függő transzporter ATPázt, és meglátjuk, mi történik. Így vagy úgy, Dimának igaza volt. A magányos transzmembrán kobaltszállítóként működött – kevésbé hatékonyan, de működött. Ez volt az első példa egy kettős rendszerre, amely ha van ATPáz, akkor ATP-függőként működik, ha pedig nincs, akkor ionfüggőként működik.

Később a berlini kollégák is ezt tették a biotinnal: elvettek egy baktériumot, amelyben a biotin transzporterben van ATPáz és transzmembrán, kikapcsolták a génjeit – és kimutatták, hogy ez a fehérje önmagában biotin transzporterként is működik, bár kisebb erővel, mint az ATPáz jelenléte.

Dmitrij Rodionov ekkor már posztdoktoriként dolgozott Andrei Osterman laboratóriumában a Burnham Orvosi Kutatóintézetben, La Jolla-ban. Osterman csodálatos ember, biokémikus, aki megértette a bioinformatikai módszerek hatékonyságát, megtanulta használni őket, és sok új enzimet talált a segítségükkel. És így, amikor Dmitrij bekerült a biokémikusok körébe, és kommunikálni kezdett velük, kiderült, hogy több tucat hasonló transzporter létezik, amelyek különböző szubsztrátokat - kofaktorokat, aminosavakat, ionokat - hordoznak. (Egyébként a riboflavin transzporterről kiderült, hogy ez ugyanaz.) Különböző kutatócsoportok egymástól függetlenül vizsgálták ezeket a transzportereket, fogalmuk sem volt arról, hogy egy családba tartoznak.

Az is világossá vált, hogyan lehetséges egy ilyen szervezés. A kobalt- és nikkeltranszporterek nem találhatók külön az ATPázuktól (hacsak nem távolítják el kísérleti úton). De van egy másik osztálya a bakteriális transzportereknek, amelyek ugyanazt az ATP-ázt használják – mint egy eltávolítható hegyű csavarhúzó. Ebben az esetben az univerzális ATPáz és a transzmembrán fehérje a riboszómális fehérjékkel együtt kódolható, azaz folyamatosan és nagy mennyiségben expresszálódnak. Azok a fehérjék pedig, amelyek a transzporterek specifitását biztosítják, itt-ott szétszóródnak a megfelelő operonokban. És ATPáz hiányában egy ilyen fehérje legalább másodlagos transzporterként működik, és ezért egyes organizmusok genomjában csak azt látjuk.

Bioinformatika és az evolúció elmélete

Ezek az „alkalmazott” felfedezések azonban nagyon fontosak és hasznosak, de nekünk, bioinformatikusoknak nem ezek a legfontosabbak. És a legfontosabb dolog, amit a biológia ipari forradalma hozott számunkra, az volt, hogy lehetőség nyílt az evolúció más szintű megvitatására. Még a triviális kijelentések sem olyan triviálisak, mint mondjuk az emberi és csimpánz genomjának százalékos hasonlóságáról. A molekuláris evolúció tanulságos abból a szempontból, hogy figyelemreméltóan beteljesíti a darwini elképzeléseket a dolgok természetéről.

A molekuláris biológusok által megszerzett adatok ma már nagy hatást gyakorolnak a taxonómiára – a növények és állatok osztályozására. A botanikusok és zoológusok eleinte szkeptikusak voltak a molekuláris családfákkal kapcsolatban, amelyek a fajok közötti rokonság fokát mutatták ki a nukleotidszekvenciák összehasonlítása alapján, de el kell ismernünk, hogy az első molekuláris fák nem voltak túl sikeresek. Most a szemünk láttára konvergencia megy végbe – a klasszikus és a molekuláris taxonómia egymás felé halad. Az már világos, hogy a molekuláris fák, ha bizonyos szabályok betartásával épülnek, meglehetősen közel állnak a valósághoz, és okot adhatnak az ortodox taxonómiai fogalmak morfológián alapuló felülvizsgálatára - az organizmusok külső jellemzőinek összehasonlítására. És furcsa módon kiderült, hogy azok a fajok, amelyek állítólag génjeik hasonlósága alapján kényszerülnek egymásra, valóban találnak közös jellemzőket. Kiderült, hogy egy jó molekulafa nem mond ellent a morfológiai szerkezetnek, csak más tulajdonságok bizonyulnak vezetőnek.

Ami a baktériumokat illeti, a klasszikus biológia korában sejtalakja és anyagcsere-tulajdonságaik szerint osztályozták őket: milyen cukrokat tudnak hasznosítani, milyen aminosavakat és kofaktorokat tudnak maguk szintetizálni, és melyekre van szükségük a külső hatások részeként. környezet stb. Ez a taxonómia nagyon gyenge volt, mivel a baktériumok a magasabb rendű organizmusokhoz képest nagyon kevés morfológiai és funkcionális tulajdonsággal rendelkeznek. Ma úgy tűnik, hogy a bakteriális taxonómia teljes mértékben molekuláris adatokon alapul. A fajneveket tömegesen módosítják. De a leglenyűgözőbb eredmény ezen a területen természetesen Carl Woese munkája volt, aki 1977-ben a molekuláris taxonómia alapján feltételezte az archaebaktériumok (ma archaea néven) létezését – az élet harmadik tartományát, amely különbözik az eukariótáktól és „ igaz” baktériumok.

Nem mondhatjuk, hogy a bakteriális taxonómia minden problémája megoldódott. Az elképzelés, hogy mi is az a baktériumfaj, nagyrészt megsemmisült. Felfedezték például, hogy két E. coli törzsben - egyazon faj képviselőiben - a gének akár egyharmada is egyedi lehet, vagyis az egyik törzsben jelen lehet, a másikban pedig hiányzik. Sok váratlan és érdekes dolog ismert már a baktériumok evolúciójáról. Konkrétan az derült ki, hogy a horizontális transzfer – a genetikai anyag cseréje – történhet taxonómiailag távoli lények között. Például, Metanosarcina- tipikus archaea, de génjeinek egyharmada bakteriális eredetű, és ezek a gének szinte teljes anyagcseréjét szolgálják, míg a Methanosarcina transzkripciós, transzlációs, replikációs és membránszerkezeti mechanizmusai az archaeákra jellemzőek. Ebből a példából meg lehet ítélni, milyen izgalmas most a baktériumok evolúciójának tanulmányozása.

Véleményem szerint a legérdekesebb dolog a szabályozási rendszerek fejlődése. Elég sokat tudunk ezekről a baktériumok rendszereiről, és el tudjuk képzelni, hogyan változnak a szabályozórendszerek, hogyan kezd hirtelen egy helyi szabályozó több tucat gént irányítani, vagy megváltoztatja a specifikusságot, hogyan rendeződnek át a szabályozó kaszkádok. Ez pedig alapvető szempontból nagyon fontos lehet, mert itt sokkal tovább lehet menni. Az ember és a csimpánz vagy akár az egér közötti különbség aligha a gének halmazából adódik: ezek gyakorlatilag megegyeznek az emlősökben, ha a funkciókészletet összehasonlítjuk. Az ok inkább a szabályozásban keresendő: mely gének, mikor és mely szövetekben aktívak.

Valószínűleg az evolúció „ugrásai”, a morfológiai jellemzők hirtelen megváltozása pontosan a szabályozás szintjén biztosított. Ismerünk már ilyen példákat baktériumokban, élesztőben és más viszonylag egyszerű organizmusokban. A legtöbb baktériumnak egy vasrepresszora van, amely reagál a vasionok jelenlétére és számos gént szabályoz: a vas tárolását és szállítását biztosító fehérjéket, vasfüggő enzimeket. Más baktériumoknak pedig három különböző represszora van, amelyek ezekbe a funkcionális csoportokba vannak osztva: egyesek szabályozzák a vasraktározást, mások a szállítást és a szintézist, mások pedig az enzimeket. Ez tulajdonképpen gyökeres változás, a hardverre egy válasz volt, de kiderült, hogy három különböző.

Csodálatos kísérleti munkákat végeznek többsejtű élőlényeken. Miért a tengeri sün az egyetlen a tüskésbőrűek közül, amelynek kemény csontváza van? A választ Eric Davidson, a California Institute of Technology munkatársa javasolta. Tanulmányozta azt a szabályozó kaszkádot, amely ennek a csontváznak a kialakulásáért felelős, majd megtalálta ezt a kaszkádot a tengeri csillagban, csak nála sokkal később kapcsol be, így csak a tűk egymáshoz nem kapcsolódó töve fejlődik ki. A sündisznóban ugyanaz a kaszkád bizonyos számú sejtosztódást korábban bekapcsol, ennek megfelelően nagyobb számú sejtet fog be, és folyamatos váz alakul ki. Így egy tisztán szabályozási változás teljesen új tulajdonságot hoz létre.

Bízom benne, hogy a szabályozás összehasonlító elemzése választ ad arra a kérdésre, amely a szintetikus evolúcióelmélet jelenlegi fejlődési szakaszában aggasztja a paleontológusokat és morfológusokat: hogyan hoz létre a kis változások felhalmozódása radikálisan új karaktereket? Úgy tűnik, hogy ez a szabályozás újrakonfigurálásával magyarázható. Már tudjuk, hogyan kell ezt megtenni egyszerű organizmusokon, de előbb-utóbb az összetettebbek felé fordul a fordulat. És amikor ez megtörténik, akkor megtörténik a harmadik nagy áttörés ebben az irányban, ha a darwini természetes szelekciót tekintjük az elsőnek, az evolúciós biológia és a genetika kombinációját pedig a másodiknak.



Előző cikk: Következő cikk:

© 2015 .
Az oldalról | Kapcsolatok
| Webhelytérkép