Геном человека
Геном человека — совокупность наследственного материала, заключённого в клетке человека[1]. Согласно этому определению человеческий геном состоит из 23 пар хромосом, находящихся в ядре, а также множества копий митохондриальной ДНК. Существует и другое определение генома, в котором под геномом подразумевают совокупность генетического материала гаплоидного набора хромосом[2][3]. Когда говорят о размере генома человека, то имеют в виду данный вариант определения генома. Так, двадцать две аутосомы, две половые хромосомы Х и Y, а также митохондриальная ДНК человека содержат вместе 3 099 734 149 пар оснований[4]. К 2003 году было секвенировано 85 % генома человека, а полное секвенирование генома человека было завершено лишь в 2022 году[5].
В ходе выполнения проекта «Геном человека» была определена последовательность ДНК всех хромосом и митохондриальной ДНК. В настоящее время эти данные активно используются по всему миру в биомедицинских исследованиях. Полное секвенирование выявило, что человеческий геном содержит 19 969 активных генов, что составляет лишь очень небольшую часть генома, только 1,5 % всего генетического материала кодирует белки или функциональные РНК.[4] Всего насчитывается 63 494 генов, большинство из которых являются генами некодирующей РНК, которую часто называют мусорной ДНК[6], но которая, как оказалось, играет важную роль в регуляции активности генов[7][8].
Основную часть генома (92%) расшифровали к 2003 году в рамках проекта «Геном человека». В апреле 2022 года было сообщено, что международная команда исследователей секвенировала последние 8% генома человека[9].
Особенности
Хромосомы
В геноме присутствует 23 пары хромосом: 22 пары аутосомных хромосом, а также пара половых хромосом X и Y. У человека мужской пол является гетерогаметным и определяется наличием Y-хромосомы. Нормальные диплоидные соматические клетки имеют 46 хромосом[10][11].
Гены
Предварительные оценки предполагали наличие в геноме человека более 100 тысяч генов. По результатам проекта «Геном человека» количество генов, а точнее открытых рамок считывания, составило около 23 000 генов. В связи с усовершенствованием методов поиска (предсказания) генов предполагается дальнейшее уменьшение числа генов.
Число генов у человека лишь ненамного больше, чем у более простых организмов, например, круглого червя Caenorhabditis elegans или мухи Drosophila melanogaster. Так происходит из-за того, что в человеческом геноме широко представлен альтернативный сплайсинг. Альтернативный сплайсинг позволяет получить несколько различных белковых цепочек с одного гена. В результате человеческий протеом оказывается значительно больше протеома рассмотренных организмов. Большинство человеческих генов имеют множественные экзоны, и интроны часто оказываются значительно более длинными, чем граничные экзоны в гене.
Гены неравномерно распределены по хромосомам. Каждая хромосома содержит богатые и бедные генами участки. Эти участки коррелируют с хромосомными бендами (полосы поперёк хромосомы, которые видно в микроскоп) и с CG-богатыми участками. В настоящий момент значимость такого неравномерного распределения генов не вполне изучена.
Кроме генов, кодирующих белки, человеческий геном содержит тысячи РНК-генов, кодирующих транспортные РНК (tRNA), рибосомные РНК, микроРНК и прочие РНК, не кодирующие белок.
Регуляторные последовательности
В человеческом геноме найдено множество различных последовательностей, отвечающих за регуляцию генов. Под регуляцией понимается контроль экспрессии гена (процесс построения матричной РНК по участку молекулы ДНК). Обычно это короткие последовательности, находящиеся либо рядом с геном, либо внутри гена. Иногда они находятся на значительном расстоянии от гена (энхансеры). Систематизация этих последовательностей, понимание механизмов работы, а также вопросы взаимной регуляции группы генов группой соответствующих ферментов на текущий момент находятся только на начальной стадии изучения. Взаимная регуляция групп генов описывается с помощью сетей регуляции генов. Изучение этих вопросов находится на стыке нескольких дисциплин: прикладной математики, высокопроизводительных вычислений и молекулярной биологии. Знания появляются из сравнений геномов различных организмов и благодаря достижениям в области организации искусственной транскрипции гена в лабораторных условиях.
Идентификация регуляторных последовательностей в человеческом геноме частично была произведена на основе эволюционной консервативности (свойства сохранения важных фрагментов хромосомной последовательности, которые отвечают примерно одной и той же функции). Согласно данным молекулярных часов, эволюционные линии человека и мыши разделились около 100 миллионов лет назад[12]. Для двух геномов компьютерными методами были выявлены консервативные последовательности (последовательности, идентичные или очень слабо отличающиеся в сравниваемых геномах) в некодирующей части и оказалось, что они активно участвуют в механизмах регуляции генов у обоих организмов[13].
Другой подход получения регуляторных последовательностей основан на сравнении генов человека и рыбы фугу. Последовательности генов и регуляторные последовательности у человека и рыбы фугу существенно схожи, однако геном рыбы фугу содержит в 8 раз меньший объём «мусорной ДНК». Такая «компактность» рыбьего генома позволяет значительно легче искать регуляторные последовательности для генов[14].
Прочие объекты в геноме
Кодирующие белок последовательности (множество последовательностей составляющих экзоны) составляют менее чем 1,5 % генома[6]. Не учитывая известные регуляторные последовательности, в человеческом геноме содержится масса объектов, которые выглядят как нечто важное, но функция которых, если она вообще существует, пока не выяснена. Эти объекты занимают до 97 % всего объёма человеческого генома. К таким объектам относятся:
- повторы
- транспозоны
- псевдогены
Соответствующие последовательности, скорее всего, являются эволюционным артефактом. В современной версии генома их функция выключена, и эти участки генома многие называют мусорной ДНК. Однако есть масса свидетельств в пользу того, что эти объекты обладают некоторой функцией, которая пока неясна.
Псевдогены
Эксперименты с ДНК-микрочипами показали, что много участков генома, не являющихся генами, вовлечены в процесс транскрипции[15].
Вирусы
Около 1 % в геноме человека занимают встроенные гены ретровирусов (эндогенные ретровирусы). Эти гены обычно не приносят пользы хозяину, но существуют и исключения. Так, около 43 млн лет назад в геном предков обезьян и человека попали ретровирусные гены, служившие для построения оболочки вируса. У человека и обезьян эти гены участвуют в работе плаценты[16]. Большинство ретровирусов встроились в геном предков человека свыше 25 млн лет назад. Среди более молодых человеческих эндогенных ретровирусов полезных на настоящий момент не обнаружено[17][18].
Информационное содержание генома человека
Азотистые основания в ДНК (аденин, тимин, гуанин, цитозин) соответствуют 4 различным логическим состояниям, что эквивалентно 2 битам информации[19]. Таким образом, геном человека содержит более 6 гигабит информации в каждой цепи, что эквивалентно 800 мегабайтам и сопоставимо с количеством информации на компакт-диске[20]. Логика хранения данных в парных основаниях аналогична системе репликации (дублирования) данных RAID 1.
Примечания
- ↑ Talking glossary of genetic terms: genome (англ.). National Human Genome Research Institute. Дата обращения: 1 ноября 2012. Архивировано 4 ноября 2012 года.
- ↑ A Dictionary of genetics (англ.) / R.C. King, W.D. Stansfield, P.K. Mulligan. — 7th. — Oxford University Press, 2006. — ISBN 13978-0-19-530762-7.
- ↑ Генетика: энциклопедический словарь / Картель Н. А., Макеева Е. Н., Мезенко А. М.. — Минск: Тэхналогія, 1999. — 448 с.
- ↑ 4,0 4,1 GRCh38.p14 . ncbi. Genome Reference Consortium (3 February 2022). Дата обращения: 1 апреля 2022. Архивировано 1 апреля 2022 года.
- ↑ Учредитель: Некоммерческое партнерство «Международное партнерство распространения научных знаний» Адрес: 119234, г Москва, ГСП-1, Ленинские горы, МГУ, Д. 1. Ученые полностью расшифровали геном человека . «Научная Россия» - электронное периодическое издание. Дата обращения: 29 октября 2022.
- ↑ 6,0 6,1 International Human Genome Sequencing Consortium. Initial sequencing and analysis of the human genome. (англ.) // Nature. — 2001. — Vol. 409, no. 6822. — P. 860—921. — doi:10.1038/35057062. — PMID 11237011.
- ↑ «Мусорная» ДНК помогает включать гены . Дата обращения: 24 ноября 2018. Архивировано 24 ноября 2018 года.
- ↑ «Мусорная» ДНК играет важнейшую роль в поддержании целостности генома . Дата обращения: 24 ноября 2018. Архивировано 25 ноября 2018 года.
- ↑ Матвеева, Т. Ученые полностью расшифровали геном человека . Научная Россия (1 апреля 2022). Дата обращения: 5 апреля 2022. Архивировано 13 мая 2022 года.
- ↑ Tjio J. H., Levan A. The chromosome number of man (англ.) // Hereditas[англ.]. — 1956. — Vol. 42. — P. 1—6. — doi:10.1111/j.1601-5223.1956.tb03010.x. — PMID 345813. Первая работа с точно установленным числом хромосом у человека.
- ↑ Human Chromosome Number Архивная копия от 3 ноября 2020 на Wayback Machine, здесь рассказана история подсчёта хромосом у человека
- ↑ Nei M., Xu P., Glazko G. Estimation of divergence times from multiprotein sequences for a few mammalian species and several distantly related organisms. (англ.) // Proceedings of the National Academy of Sciences of the United States of America. — 2001. — Vol. 98, no. 5. — P. 2497—2502. — doi:10.1073/pnas.051611498. — PMID 11226267.
- ↑ Loots G., Locksley R., Blankespoor C., Wang Z., Miller W., Rubin E., Frazer K. Identification of a coordinate regulator of interleukins 4, 13, and 5 by cross-species sequence comparisons. (англ.) // Science. — 2000. — Vol. 288, no. 5463. — P. 136—140. — doi:10.1126/science.288.5463.136. — PMID 10753117. Summary Архивная копия от 6 ноября 2009 на Wayback Machine
- ↑ Meunier, Monique Genoscope and Whitehead announce a high sequence coverage of the Tetraodon nigroviridis genome (англ.) (недоступная ссылка). Genoscope. Дата обращения: 12 сентября 2006. Архивировано 20 августа 2002 года.
- ↑ Claverie J. Fewer genes, more noncoding RNA. (англ.) // Science. — 2005. — Vol. 309, no. 5740. — P. 1529—1530. — doi:10.1126/science.1116800. — PMID 16141064.
- ↑ Предки человека заимствовали полезные гены у вирусов . Дата обращения: 19 сентября 2017. Архивировано 20 сентября 2017 года.
- ↑ Eugene D. Sverdlov. Retroviruses and primate evolution // BioEssays. — Vol. 22, № 2. — P. 161—171. — doi:10.1002/(SICI)1521-1878(200002)22:2<161::AID-BIES7>3.0.CO;2-X. — PMID 10655035.
- ↑ Anders L Kjeldbjerg, Palle Villesen, Lars Aagaard, Finn Skou Pedersen. Gene conversion and purifying selection of a placenta-specific ERV-V envelope gene during simian evolution // BMC Evolutionary Biology. — 2008. — Vol. 8. — P. 266. — doi:10.1186/1471-2148-8-266. — PMID 18826608.
- ↑ Деньгуб В. М., Смирнов В. Г. Единицы величин. Словарь-справочник. — М.: Издательство стандартов, 1990. — С. 25. — 240 с. — ISBN 5-7050-0118-5.
- ↑ How much information does human DNA store? - Quora
Литература
- Тарантул В. З. Геном человека. Энциклопедия, написанная четырьмя буквами. — Языки славянской культуры, 2003. — 396 с. — ISBN 5-94457-108-X.
- Ридли Мэтт. Геном: автобиография вида в 23 главах. — М.: Эксмо, 2008. — 432 с. — ISBN 5-699-30682-4
- Миролюбова С.Ю. ГЕНЕТИЧЕСКИЙ ПАСПОРТ, ГЕНЕТИЧЕСКИЙ ПРОФИЛЬ НАСЕЛЕНИЯ И ГЕНОФОНД НАРОДОВ В СФЕРЕ ОБЕСПЕЧЕНИЯ НАЦИОНАЛЬНОЙ БЕЗОПАСНОСТИ РОССИЙСКОЙ ФЕДЕРАЦИИ // Вестник Сургутского государственного университета. 2022-07-07. вып. 2 (36). С. 70–80. ISSN 2312-3419. — doi:10.34822/2312-3419-2022-2-70-80
Ссылки
- Всеобщая декларация о геноме человека и правах человека ЮНЕСКО, 1997
- Lindblad-Toh K. et al. Genome sequence, comparative analysis and haplotype structure of the domestic dog. (англ.) // Nature. — 2005. — Vol. 438, no. 7069. — P. 803—819. — doi:10.1038/nature04338. — PMID 16341006.
- The National Office of Public Health Genomics (англ.)