A Nature és a Science legújabb számaiban bemutatott ENCODE projekt minden korábbinál mélyebb bepillantást enged az emberi genom szabályozási kapcsolatainak rengetegébe.
Az emberi örökítőanyag teljes szövegének feltárása, a Humán Genom Projekt (HGP) 2003-as befejezése óta egyre világosabb, hogy ez az óriási eredmény sokkal inkább egy új korszak kezdeteként, semmint egy régi lezárásaként értékelendő.
A HGP jó néhány meglepetést hozott. Az egyik a fehérjéket kódoló DNS-szakaszok, vagyis a gének számának a korábbi elképzeléseknél jóval szerényebb száma: kiderült, hogy a korábban várt 100 ezer helyett mindössze 20-25 ezer gén van a genetikai állományunkban (a genomban). Ráadásul ezeknek a fehérjekódoló régióknak a DNS teljes mennyiségéhez viszonyított elenyészően alacsony, az 1 százalékot alig meghaladó aránya komoly hiányérzetet és bizonytalanságot hagyott maga után a kutatói társadalomban. Sokan elfogadhatatlannak tartották, hogy az emberi génállomány csaknem 99 százaléka nem egyéb, mint "szemét" (junk DNA), ahogy az a komoly tudományos fórumoktól a bulvármédiáig azóta sok helyütt elhangzott.
Végleg el kell felejteni a hulladék-DNS-t
A Nature legfrissebb számában ismertetett, az egykori Humán Genom Projekthez hasonlóan ambiciózus feladatot felkaroló, ám az utóbbi évtizedben kifejlesztett legmodernebb technikákat is felhasználó megaprojekt, az ENCODE bebizonyította: a kétkedőknek volt igazuk. Az ENCODE legfontosabb számszerű eredménye az, hogy az emberi DNS-nek legalább 80 százalékához konkrét funkció rendelhető - még ha e funkciót sok esetben nem ismerjük is pontosan. Az emberi genom eme "sötét anyagáról" a Science is több cikket közöl.
A két számadat közötti óriási eltérést az magyarázza, hogy távolról sem csak a szoros értelemben vett fehérjekódoló DNS-szakaszok tekinthetők "funkcionálisnak". Feladat köthető ugyanis valamennyi olyan kromoszóma-régióhoz, amely a fehérjekódoló DNS-szakaszok kifejeződésének szabályozásában részt vesz akár serkentő, akár gátló módon. S bár szerepükre csak az utóbbi évek felfedezései nyomán kezd lassan fény derülni, szinte bizonyosan funkcióval rendelkezik az ún. nemkódoló - vagyis a DNS-ről lemásolódó, de fehérjévé át nem fordítódó - RNS-ek jelentős hányada is, jobbára azáltal, hogy a fehérjekódoló RNS-ek mennyiségét szabályozzák.
Ez is magyarázza az emberek közötti különbségeket
Az ENCODE - Encyclopedia of DNA Elements, vagyis a DNS-elemek (értsd: funkcióval bíró DNS-szakaszok) enciklopédiája - a 2003 óta eltelt évek biotechnológiai vívmányainak felhasználásával az emberi genetikai állomány jóval mélyebb megismerésére törekedett, mint amit a DNS puszta bázissorrendjének meghatározása nyújtott akkoriban. A DNS-szekvencia adatfolyamának leíró jellegén túllépve a 2007-ben útjára indított ENCODE immár sokkal inkább az emberi genom funkcionális összefüggéseire koncentrált: arra, hogy a genomon belüli komplex szabályozási kölcsönhatások miként teszik lehetővé egy emberi szervezet felépítését és működtetését.
Az adatelemzést ráadásul 147-féle sejttípuson és számos emberből származó DNS-en elvégezték, így bepillantást nyerhettek abba, mi teszi eltérővé szervezetünk változatos feladatokra specializált szöveteit, és mi tesz egymástól különbözővé minket, embereket. Mivel az emberek közti különbségek egy része a betegségekre való hajlamokkal, az egyedi érzékenységek hátterében meghúzódó genetikai változatossággal kapcsolatos, az ENCODE eredményeinek a tudományos érdekességen túl közvetlen gyógyászati hozadéka is lehet.
Jobban értik, melyik gén szólal meg
A projekt keretében nagyfelbontású térképet készítettek arról, hogy a DNS-állomány különböző régióiban milyen kémiai módosulások találhatók magán a DNS-en, illetve a hisztonokon - azokon a fehérjéken, amelyek köré a DNS-szál tekeredik (mint fonal az orsóra), és amelyeknek különbözőképpen módosított állapotai nagymértékben befolyásolják a DNS hozzáférhetőségét az RNS-átírás (s így a génkifejeződés) számára.
Régóta ismeretes, hogy a DNS meghatározott régióinak - a gének bevezető szakaszaiként funkcionáló ún. promotereknek - metilcsoportokkal való kémiai módosítása olyan eszköz a sejt számára, amellyel szabályozhatja az adott promotert követő gén kifejeződésének hatékonyságát. Tudott dolog az is, hogy hisztonokon a sejtek változatos címkéket - apró kémiai jeleket, leginkább acetil- és metilcsoportokat - helyeznek el, s ezek a jelzések szintén az érintett régió génátírási aktivitását hivatottak szabályozni. A DNS-metilációs és hisztonmódosítási mintázat feltérképezésével, illetve az egyes sejttípusok közötti különbségek feltárásával egyebek mellett az egyedfejlődés, a szöveti specializáció kérdései nyernek jobb megvilágítást.
Ugyanehhez a feladathoz - a génkifejeződés szabályozásának pontosabb megértéséhez - kapcsolódóan az ENCODE keretében feltérképezték a DNS azon szakaszait, amelyekhez biztosan vagy nagy valószínűséggel génátírást szabályozó fehérjék - ún. transzkripciós faktorok - kötődnek. E szakaszokat részben közvetlen módon, a fehérjékkel kölcsönható DNS-szekvenciák "kihalászásával" és szekvenálásával (bázissorrend-meghatározásával), részben pedig közvetetten, a szabályozó fehérjékkel komplexált DNS enzimhasítással szembeni fokozott érzékenységét kihasználva azonosították. Ezzel egyidejűleg azt is tanulmányozták, hogy a kromatin nagy léptékű, "távolsági" kölcsönhatásai miként hozzák a látszólag messze eső szabályozó és szabályozott régiókat egymás térbeli közelségébe.
Nagy RNS-leltár is készült
Az ENCODE feladatai közé tartozott a DNS-ről átíródó RNS-ek - mind a fehérjekódoló, mind a nemkódoló átiratok - minél teljesebb leltárának elkészítése is. A nemkódoló átiratok meglepően hatalmas száma, valamint a tény, hogy - a hagyományos nézettel ellentétben - a DNS-nek gyakran nem csak az egyik, hanem mindkét szála mintául szolgál az RNS-átírás számára, a génkifejeződésről alkotott hagyományos kép átrajzolását, sőt, magának a gén fogalmának az újragondolását sürgeti.
Az ENCODE óvatos becslése szerint is az emberi DNS-állománynak legalább a 75 százalékáról készül az élet valamely pontján, legalább valamelyik sejtféleségben RNS-átirat.
Majdnem az egész genomban zajlik az evolúció
Ez az adat már önmagában kételyt ébreszt afelől, hogy DNS-ünk csaknem 99 százaléka puszta történeti hordalék volna. E kétely tovább fokozódik, ha az ENCODE-nak azt az eredményét is hozzávesszük, hogy a genomunk 95 százaléka fekszik valamely szabályozófehérjével kölcsönható DNS-régió "karnyújtásnyi" közelségében. S ha a kutatói elme intuitív ellenkezése nem volna még elég, az ENCODE résztvevői közvetlen evolúciós bizonyítékot is találtak arra, hogy DNS-ünk java része nem lehet értelmetlen töltelék.
Egy funkcióval nem bíró hordalék-DNS-re ugyanis nem nehezedik szelekciós nyomás, ezért az evolúció során viszonylag gyorsan változik. Azonban a legközelebbi evolúciós rokonságunkhoz tartozó főemlősök és a mi DNS-ünk összevetéséből kiderült, hogy genomunknak az a része, melyen majom-unokatestvéreinkkel osztozunk, 65 százalékban valamilyen funkcionális DNS-elemet hordoz, s e területeknek számottevő hányada rostáló szelekció alatt áll - vagyis nem változhat meg előnytelen következmények nélkül, ahogy azt a "szemét"-DNS-től várnánk.
A betegségek okai is jobban felderíthetők
Végezetül az ENCODE eredményei arra is ráirányítják a figyelmet, hogy a betegségekhez kapcsolható genetikai variánsokat nem csak a fehérjekódoló régiókban kell keresnünk. A betegségekkel kapcsolatba hozható DNS-változatok zöme valamilyen funkcióhordozó DNS-elemre esik, ám ennek nem kell okvetlenül fehérjét kódolnia: lehet szabályozófehérjét kötő DNS-szakasz éppúgy, mint nemkódoló RNS átíródásáért felelős terület.
A fehérjekódoló géneken kívül eső DNS-változatok és a betegségek közötti kapcsolatok régóta ismertek, ám ezek oksági viszonyai mindeddig jobbára homályban maradtak. E nemkódoló DNS-régiók funkciójának azonosítása közelebb vihet a DNS-változatok és a velük összefüggésbe hozható betegségek közötti ok-okozati láncolat megértéséhez.