Проект ENCODE — енциклопедия на функционалните елементи в човешкия геном
ENCODE е енциклопедията на елементите на ДНК. Енкод стартира през 2003 г., за да идентифицира всички функционални елементи (работни битове) в човешкия геном. Работата е извършена от над 400 учени в 32 лаборатории в САЩ, Обединеното кралство, Испания, Сингапур и Япония. Техните открития бяха публикувани в 30 статии със свободен достъп в три списания: Nature, Genome Biology и Genome Research. Това е най-подробният анализ на човешкия геном до момента.
Опростено описание на основните им констатации е следното:
- Само 1% от генома кодира протеини. Това са около 21 000 гена.
- 70 000 последователности се кодират в "промоторни" области. Те се намират преди гените, където протеините се свързват, за да контролират генната експресия.
- Съществуват около 400 000 "усилващи" области, които регулират отдалечени гени.
- Съществуват четири милиона генни "превключватели". Това са ДНК последователности, които контролират включването или изключването на гените. Често те се намират на голямо разстояние в генома от гена, който контролират.
- Около 80% от генома има определена биохимична функция. Идеята, че по-голямата част от ДНК е "ненужна ДНК", е определено погрешна. "Огромното мнозинство от човешкия геном не кодира белтъци и досега не изглеждаше да съдържа определени генно-регулаторни елементи. Защо еволюцията би поддържала големи количества "безполезна" ДНК, оставаше загадка и изглеждаше разточително. Оказва се обаче, че има основателни причини да се запази тази ДНК. Резултатите от проекта ENCODE показват, че повечето от тези участъци от ДНК крият области, които свързват протеини и РНК молекули, като ги привеждат в позиции, от които те си сътрудничат, за да регулират функцията и нивото на експресия на кодиращите протеини гени".
- Еволюцията се дължи както на промени в гените, които кодират протеините, така и на промени в ДНК, която кодира регулаторния контрол.
"Едно от големите предизвикателства в еволюционната биология е да се разбере как разликите в ДНК последователността между видовете определят разликите в техните фенотипове. Еволюционната промяна може да настъпи както чрез промени в кодиращите протеини последователности, така и чрез промени в последователността, които променят генната регулация".
Методите, използвани в работата, включват:
- Те изолират и секвенират РНК, транскрибирана от генома.
- Те идентифицираха местата за свързване на около 120 транскрипционни продукта.
- Те изследват моделите на химичните модификации, направени върху хистоните. Целта е била да се открият области, в които генната експресия се засилва или потиска.
- Проведени са 1648 експеримента върху 147 вида клетки.
Новините, свързани с тази работа, са:
Основни новини и значимост на резултатите
- Регулаторна сложност: ENCODE показа, че регулирането на генната експресия е много по-сложно, отколкото се е предполагало — стотици хиляди промотори и усилватели и милиони потенциални регулаторни елементи, като много от тях са специфични за типа клетка или за състоянието на тъканта.
- Преосмисляне на "некодиращата" ДНК: Числото, че до ~80% от генома проявява някаква биохимична активност (напр. свързване на протеини, транскрипция, модификации на хистоните), доведе до широк дебат за това какво означава "функция" в генома и какво от тази активност е еволюционно и биологично значимо.
- Връзка с болести и вариации: Множество области, идентифицирани от ENCODE, съвпадат с генетични варианти, открити чрез асоциирани изследвания (GWAS), което предполага, че много варианти, свързани с риска за заболяване, действат чрез промяна на регулаторни елементи, а не чрез директна промяна на кодиращи последователности.
- Ресурси за научната общност: Данните и анализите от ENCODE станаха важен референтен ресурс — интегрирани данни са достъпни чрез публични портали и могат да се визуализират в браузъри на генома, което подпомага последващи изследвания.
Подробности за методите (какво е направено)
- Комбинация от високопроизводителни техники за профилиране на транскрипция (напр. RNA-seq), картографиране на свързване на белтъци с ДНК (напр. ChIP-seq за транскрипционни фактори и модификации на хистоните) и картографиране на отворена/достъпна хроматинова среда (напр. DNase-seq).
- В някои проучвания са използвани и методи за картографиране на пространствената организация на хроматина и взаимодействия между регулаторни елементи и промотори (напр. ChIA-PET и други подходи), което помага да се свържат далечни усилватели с конкретни гени.
- Експериментите са приложени към голям набор от клетъчни линии и тъкани (147 вида), за да се улови клетъчно-специфичната активност на регулаторните елементи.
Какво означава "биохимична функция" и критики
Тълкуване на 80%-овия резултат: ENCODE дефинира "функционална" ДНК като участък, който показва някаква биохимична активност (напр. е транскрибиран, свързва белтъци или има маркери на хроматина). Това е различно от по-строгото еволюционно определение за функция, което изисква доказателство за селективна поддръжка в популации или между видове.
Този по-широк подход предизвика критики — част от научната общност (напр. статии и писма, публикувани след излизането на резултатите) посочиха, че биохимичната активност не винаги означава биологично значима или еволюционно поддържана функция. Дискусията подчерта необходимостта от последващи функционални експерименти, които да докажат ефекта върху клетъчната физиология или организма.
Последствия и приложения
- ENCODE улесни идентифицирането на кандидатни регулаторни обяснения за асоциирани с болести генетични варианти и насочи изследвания към некодиращата част от генома.
- Данните помагат при интерпретирането на резултати от генетични изследвания, при избора на цели за функционални проучвания и при разбирането на клетъчно-специфичната регулация.
- Резултатите ускориха развитието и прилагането на нови експериментални методи (включително функционални скрийнове, CRISPR-базирани подходи за манипулация на регулаторни елементи и др.) за директно тестване на ролята на отделни елементи.
Достъп до данните и бъдещи посоки
- Всички данни от ENCODE са публично достъпни и разпространени като ресурси за общността — това включва профили на транскрипция, карти на свързване на транскрипционни фактори, маркировки на хистоните и др.
- След ENCODE се появиха и свързани инициативи (напр. Roadmap Epigenomics), както и продължителни проекти за даване на все по-фино клетъчно- и тъканно-специфично картографиране на регулаторните ландшафти.
- Бъдещите изследвания се насочват към функционални валидиращи експерименти, разбиране на динамиката на регулацията в развитие и болести и към интегриране на 3D хроматиновата архитектура с регулаторните карти.
Кратко заключение
Проектът ENCODE промени възприятието за човешкия геном — от идея за "кодираща" и "прашна" некодираща ДНК към виждане на генома като сложен, многопластов регулаторен редактор. Резултатите разшириха полето на изследвания върху некодиращите елементи, насочиха вниманието към механизмите на генната регулация и подчертаха, че много генетични вариации, свързани с човешките заболявания, действат чрез регулаторни механизми. В същото време дебатът за това как най-добре да се дефинира и измери "функция" остава активен и стимулира по-задълбочени експериментални подходи.
Въпроси и отговори
В: Какво е ENCODE?
О: ENCODE е съкращение от Енциклопедия на елементите на ДНК. Тя стартира през 2003 г. с цел да се идентифицират всички функционални елементи (работни битове) в човешкия геном.
В: Кой извърши работата по ENCODE?
О: Работата беше извършена от над 400 учени в 32 лаборатории в САЩ, Обединеното кралство, Испания, Сингапур и Япония.
В: Какво откриха те за човешкия геном?
О: Установиха, че само 1 % от генома кодира протеини, което е около 21 000 гена. Освен това откриха, че 70 000 последователности кодират "промоторни" области преди гените, където протеините се свързват, за да контролират генната експресия; 400 000 "усилващи" области, които регулират отдалечени гени; и четири милиона генни "превключватели", които са ДНК последователности, контролиращи включването или изключването на гените. Освен това е установено, че 80 % от генома има определена биохимична функция.
В: Как са провели изследването си?
О: Използваните методи включват изолиране и секвениране на РНК, транскрибирана от генома; идентифициране на местата за свързване на продуктите на транскрипцията; изследване на моделите на химическа модификация на хистоните, за да се открият областите, в които генната експресия се засилва или потиска; и провеждане на 1648 експеримента върху 147 вида клетки.
В: Какво показват тези изследвания за еволюцията?
О: Това изследване показва, че еволюцията се дължи както на промени в гените, кодиращи протеини, така и на промени в ДНК, кодиращи регулаторен контрол. То също така показва, че еволюционните промени могат да настъпят както чрез промени в последователностите, които променят генната регулация, така и чрез промени в последователностите, кодиращи протеини.
В: Къде са публикувани техните открития?
О: Техните открития са публикувани в 30 статии със свободен достъп в три списания - Nature, Genome Biology и Genome Research.