– по 21. Начальная частота аллеля А
пусть будет по-прежнему равна 0,5. Только теперь мы рассмотрим популяции с разной численностью (N).
На рисунке (см. ниже) показано, как будет меняться частота А
в том случае, если его носители имеют пятипроцентное адаптивное преимущество. Мы видим, что в большой популяции (N = 5000) частота А
неуклонно растет, приближаясь к единице. Так работает отбор в идеальных для него условиях, т. е. в больших популяциях, где влияние дрейфа на полезные и вредные аллели пренебрежимо мало. Форма у кривой довольно правильная, и это наводит на мысль, что ее можно описать какой-нибудь математической формулой. Это действительно так, но выводить формулу мы не будем, чтобы не утомить читателей (а любители математики могут сделать это самостоятельно)[19 - Ответ такой: q = (F
? k)/(1 + F
? k), где q – частота аллеля А
по прошествии X поколений, F – относительная приспособленность аллеля А
по сравнению с конкурирующим аллелем А
(в нашем случае F = 21/20 = 1,05), k = q
/(1 ? q
), где q
– частота аллеля А
в начальный момент времени. В бесконечно большой популяции динамика q должна в точности соответствовать этой формуле. В маленьких популяциях соответствие будет неточным из-за генетического дрейфа.].
Перед нами, между прочим, важнейший эволюционный процесс – аллельное замещение, т. е. вытеснение более приспособленным аллелем менее приспособленного. Процесс идет не слишком быстро. В большой популяции, например состоящей из миллиона особей, для того чтобы зафиксировалась новая полезная мутация, дающая 5-процентное адаптивное преимущество, требуется около 560 поколений. А ведь 5 % – это серьезное преимущество. Такие мутации – редкость. Ждать, пока зафиксируется мутация с преимуществом в 1 %, придется уже 2800 поколений! Тем не менее в большой популяции отбор «чувствует» даже самую незначительную разницу в приспособленности. Это обеспечивает эффективную (пусть и медленную) фиксацию слабополезных мутаций и элиминацию слабовредных[20 - Медленность элиминации слабовредных мутаций может пойти на пользу популяции. Ведь некоторые мутации, вредные здесь и сейчас, могут оказаться полезными в перспективе. Главное, чтобы это потенциальное преимущество успело реализоваться до того, как отбор элиминирует мутацию. Мы рассмотрим такие коллизии в следующих главах.].
На среднем графике мы видим, какая судьба ждет такую же полезную мутацию, повышающую приспособленность на 5 %, в популяции меньшего размера (N = 200). Частота полезного аллеля и в этом случае росла и в конце концов достигла 1 (мутация зафиксировалась), но путь был труден и извилист. Пожалуй, нашей мутации могло и не повезти, ее шансы на фиксацию не были стопроцентными.
Наконец, на правом графике мы видим, что происходит с точно таким же полезным аллелем в совсем крошечной популяции (N = 30). На рисунке показаны результаты двух запусков модели. В одном случае мутация зафиксировалась, в другом – элиминировалась. Не правда ли, картинка похожа на результат работы дрейфа, а не отбора?
Так оно и есть. В этом заключается главный урок, который мы можем извлечь из наших экспериментов. Чем меньше популяция, тем слабее в ней власть отбора и тем могущественнее дрейф. В маленьких популяциях слабополезные и слабовредные мутации начинают вести себя фактически как нейтральные. Их частоты «случайно блуждают», пока не наткнутся на верхний или нижний порог. В маленьких популяциях, где царствует дрейф, небольшие различия в приспособленности становятся невидимыми для отбора. Поэтому слабовредная мутация запросто может зафиксироваться, а слабополезная – элиминироваться.
Хорошо это или плохо? В большинстве случаев, конечно, плохо. Потеря слабополезных мутаций мешает маленькой популяции приспосабливаться к меняющимся условиям. Бесконтрольное накопление слабовредных мутаций и вовсе может поставить ее на грань вымирания. Именно в этом, между прочим, видят биологи одну из причин того, что крупные животные вымирают в среднем чаще, чем мелкие. У крупных животных, таких как носороги или слоны, популяции не могут быть такими же большими, как у мышей или насекомых. Это снижает приспособляемость крупных животных.
Но у этой медали есть и обратная сторона. У маленьких популяций больше шансов выйти из «ловушки локального оптимума», т. е. сползти с невысокого пика ландшафта приспособленности и взобраться на другой, повыше. Ведь отбор гонит организмы вверх и только вверх. Если популяция велика и малейшее различие в приспособленности «заметно» для отбора, спуск по склонам становится невозможен. Однажды взобравшись на одинокий холм, большая популяция уже никогда с него не слезет. Что касается дрейфа, то он ведет организмы по ландшафту приспособленности хаотическим образом, не замечая подъемов и спусков. Если популяция невелика и дрейф силен, у организмов есть шанс иногда двигаться не только вверх, но и немного вниз (и в сторону). Спустившись в ложбинку, организмы могут «обнаружить», что отсюда есть другой, более перспективный подъем. Если, конечно, не вымрут раньше, чем на него наткнутся.
Вселенная древних белков продолжает расширяться
В 2010 году журнал Nature опубликовал интересную статью об эволюционном движении белков по ландшафтам приспособленности (Povolotskaya, Kondrashov, 2010). Авторы работы решили сравнить аминокислотные последовательности 572 древних белков, которые имелись уже у последнего общего предка всего живого[21 - Читатели, знакомые с книгой «Рождение сложности», помнят, что этого предка звали Лукой (LUCA – Last Universal Common Ancestor, Последний Универсальный Общий Предок), что он жил свыше 3,5 млрд лет назад и представлял собой, скорее всего, сообщество примитивных микроорганизмов, уже имевших систему синтеза белка (аппараты транскрипции и трансляции, включая рибосомы) и обменивавшихся генами друг с другом. Биологи реконструируют строение Луки, сравнивая гены и белки современных организмов. Мы многого не знаем про Луку, но, как ни странно, нам известны кое-какие подробности из его личной жизни. Мы знаем, например, почти наверняка, что ближайшие потомки Луки разошлись по двум направлениям: одна их часть дала начало надцарству бактерий (Bacteria), а другая – надцарству архей (Archaea). До появления третьего и последнего надцарства – эукариот (Eukarya) – оставалось ждать еще 1,5 или 2 млрд лет.] и были унаследованы его потомками, а также нуклеотидные последовательности соответствующих генов 836 прокариот (бактерий и архей). Эти белки называют древними, потому что после более чем 3,5 млрд лет эволюции в телах разнообразных потомков LUCA они до сих пор сохранили сходство своих аминокислотных последовательностей (вплоть до поразительного 40-процентного сходства рибосомных белков L14 у бактерий и архей) и продолжают выполнять те же функции, что и у Луки.
Расширение физической и белковой Вселенной. Стрела времени направлена сверху вниз. Слева: в ходе расширения физической Вселенной увеличиваются расстояния от произвольно выбранного объекта (например, Земли) до других объектов, причем скорость удаления пропорциональна расстоянию. Справа: в ходе расширения «белковой вселенной» дочерние молекулы удаляются в пространстве последовательностей от исходной точки, которая соответствует одному из белков LUCA. При этом дистанции между произвольно выбранным объектом (например, белком, принадлежащим эволюционной линии, которая привела к кишечной палочке E. coli) и другими объектами (родственными белками других эволюционных линий) постепенно растут. Однако белки с данной функцией не могут выйти за пределы «своей» подобласти в пространстве последовательностей – иначе это будет уже другой белок, выполняющий другую функцию (эволюционные события, связанные со сменой функции белка, в обсуждаемой работе не рассматриваются). Границы этой функциональной области показаны внутренним кругом. Рано или поздно расходящиеся белки достигнут этой границы, и дальнейшее расхождение станет невозможным. Стрелочками показано направление движения белков в пространстве последовательностей. По рисунку из Povolotskaya, Kondrashov, 2010.
Для начала Поволоцкая и Кондрашов решили выяснить, достигли уже эти белки максимального расхождения в пространстве последовательностей или их расхождение (накопление различий) все еще продолжается. Сохранение сходства после 3,5 млрд лет независимой эволюции, казалось бы, говорит о том, что возможности изменения этих белков ограниченны. Можно предположить, что области в пространстве последовательностей, соответствующие их функциям, невелики и предел расхождения давно достигнут. Но возможно и другое объяснение. Эти области могут быть велики, но труднопроходимы. Например, они могут представлять собой лабиринт из узких хребтов, разделенных пропастями, и поэтому на «освоение» всего доступного пространства не хватило миллиардов лет, прошедших со времен LUCA.
Исследователи проводят аналогию между эволюцией белков и расширением Вселенной. Эдвин Хаббл обнаружил, что галактики удаляются друг от друга, причем расстояние между галактиками положительно коррелирует со скоростью их разлетания. Экстраполируя эту тенденцию в прошлое, Хаббл пришел к выводу, что разлетание должно было начаться из одной точки. Эта идея легла в основу теории Большого взрыва. Нечто подобное происходит и с белками, расходящимися от общего предка – исходного белка с данной функцией, который был закодирован в геноме LUCA.
Принцип анализа белковых последовательностей, примененный Поволоцкой и Кондрашовым. Использовались четверки гомологичных белков, родственные отношения между которыми изображены в виде дерева. Анализ такой четверки позволяет понять, растет или снижается сходство между первыми двумя белками и четвертым. В данном случае считается, что у первого белка «предковая» (имеющаяся у белков 2 и 3) аминокислота R в 11-й позиции (выделенажирным шрифтом) заменилась на E, что привело к росту сходства первого белка с четвертым, т. е. к их сближению в пространстве последовательностей. У второго белка «предковая» аминокислота K в 3-й позиции (выделенаполужирным шрифтом) заменилась на Y, что привело к снижению сходства второго белка с четвертым, т. е. к их расхождению в пространстве последовательностей. По рисунку из Povolotskaya, Kondrashov, 2010.
Чтобы выяснить, закончилось ли уже расширение «вселенной древних белков» или оно продолжается до сих пор, авторы применили оригинальные методы анализа белковых последовательностей. Нам будет полезно с ними ознакомиться – хотя бы для того, чтобы понять логику биоинформатики, молодой науки, занимающейся сравнением и осмыслением генетических текстов.
Использовались четверки гомологичных (происходящих от одного предка) и выполняющих одну функцию белков. Первые два белка в каждой четверке – это близкородственные молекулы с похожими аминокислотными последовательностями. Эти два белка назывались «сестринскими», и именно их эволюция анализировалась в рамках данной четверки.
Третий белок отличался от сестринских белков сильнее, чем они друг от друга. Он выполнял роль «внешней группы», позволяя понять, какие аминокислотные замены произошли в первом, а какие во втором сестринском белке. Например, если у внешнего белка в данной позиции стоит аминокислота K (лизин) и такая же аминокислота стоит здесь у первого из двух сестринских белков, а у второго в этом месте находится другая аминокислота (например, Y – тирозин), то считалось, что K в данной позиции – это «предковое», исходное состояние, а у второго сестринского белка произошла замена K на Y.
К этим трем белкам добавлялся четвертый, еще более далекий от сестринских, чем третий. Если у четвертого белка в данной позиции стоит аминокислота K (как на рисунке), то делался вывод, что у второго сестринского белка произошло эволюционное изменение, увеличившее дистанцию между белками 2 и 4: белки разошлись. Если бы у четвертого белка здесь стояла аминокислота Y, то был бы сделан вывод, что в результате изменения, затронувшего белок 2, белки 2 и 4 сблизились.
В общей сложности было обработано 13,6 млн таких четверок. Для каждой четверки определялось число замен, ведущих к сближению последовательностей и к их расхождению. По соотношению этих двух величин можно понять общую тенденцию: расходятся ли белки, сближаются или балансируют вокруг некого постоянного уровня сходства последовательностей.
Оказалось, что даже у наиболее удаленных друг от друга гомологичных белков тенденция к расхождению значительно преобладает над тенденцией к сближению. Следовательно, «вселенная древних белков» продолжает расширяться и пределы областей, соответствующих их функциям, за 3,5 млрд лет так и не были достигнуты. Эволюция этих белков была крайне медленной. Что же ее сдерживало? Решению этой проблемы посвящена вторая часть статьи, приводящая на память другой рассказ Борхеса – «Сад расходящихся тропок».
Лабиринт расходящихся тропок
Обычного отрицательного отбора, отсеивающего вредные мутации, явно недостаточно для того, чтобы объяснить медленную эволюцию древних белков. Предположение о том, что каждая аминокислота, стоящая в данной позиции, влияет на приспособленность одинаковым образом независимо от «контекста» (т. е. от того, какие аминокислоты стоят в других позициях в том же белке или в других белках, взаимодействующих с ним), соответствует представлению о легкопроходимом ландшафте приспособленности (см. рисунок ниже). Но со времен LUCA в каждом синонимичном сайте (так называют те нуклеотиды в цепи ДНК, изменение которых не влияет на структуру кодируемого белка) произошло уже свыше 100 замен. Синонимичные нуклеотидные замены – это пример движения по ровным горизонтальным поверхностям ландшафта приспособленности. Из этого следует, что в случае хорошей проходимости ландшафта изучаемые белки давным-давно должны были освоить всю потенциально доступную им область в пространстве последовательностей, и тогда мы не наблюдали бы их продолжающегося расхождения.
Резко уменьшить проходимость ландшафта приспособленности – превратить его в лабиринт узких тропок или горных хребтов – может эпистаз. Так называют взаимное влияние разных мутаций (аллелей) на вредность или полезность друг друга. Замена одной аминокислоты может менять эффективность работы белка не сама по себе, а в зависимости от комбинации других аминокислот, занимающих определенные позиции в том же белке. Также эффект мутации может зависеть от других белков, находящихся в непосредственном взаимодействии с белком-мутантом. Иными словами, для определения смысла биологического текста важен контекст. В этом и состоит суть эпистаза. Мы еще не раз встретимся с этим явлением в последующих главах.
Наличие эпистаза предполагает, что многие аминокислотные замены являются допустимыми только в определенном окружении. Если окружение (контекст) неподходящее, то данная замена будет снижать приспособленность, и отбор ее выметет. Это явление в эволюции белков изучалось ранее на конкретных примерах[22 - Об одном из таких исследований мы рассказали в книге «Рождение сложности» в разделе «Пути эволюции предопределены на молекулярном уровне». На примере приспособления бактерий к антибиотикам удалось показать, что эволюция белков – в данном случае речь шла о белке, способном обезвреживать новый антибиотик, – может использовать лишь малую часть из множества теоретически возможных путей достижения цели. Каждая отдельная мутация должна повышать приспособленность, чтобы ее поддержал отбор. При этом положительный или отрицательный эффект многих мутаций, как выяснилось, зависит от того, какие мутации уже успели зафиксироваться ранее. Поэтому приобретение пяти мутаций, позволяющих белку эффективно справиться с новой функцией – защитой от антибиотика, – может идти не в любой последовательности из 120 возможных, а лишь несколькими, как бы «заранее предопределенными» путями (Weinreich et al., 2006).]. Если эпистаз широко распространен, белок может добраться до многих потенциально достижимых пунктов в пространстве последовательностей только долгим обходным путем.
Для проверки гипотезы о действенности эпистаза в эволюции белков Поволоцкая и Кондрашов придумали хитроумный тест, основанный на сопоставлении темпов накопления «сближающих» и «разводящих» мутаций с дистанциями между белками. Основная идея состояла в том, что гипотезы о наличии и отсутствии эпистаза дают противоположные предсказания о частоте закрепления сближающих и разводящих мутаций. Если влияние эпистаза невелико, то у двух близких белков темп накопления разводящих мутаций должен быть высоким, а по мере расхождения последовательностей он должен снижаться (если ландшафт приспособленности легкопроходимый, то белки сначала свободно и быстро «блуждают» по ровному плато, соответствующему данной функции, уходя все дальше от исходной точки, но по мере приближения к его краям их расхождение замедляется). Темп накопления сближающих мутаций при этом должен оставаться примерно постоянным. Если же эпистаз оказывает сильное влияние на эволюцию белков, все должно быть наоборот: разводящие мутации должны накапливаться с примерно постоянной скоростью, а темп накопления сближающих мутаций по мере расхождения белков должен снижаться.
Пространство последовательностей можно изобразить в графа, вершины которого соответствуют разным последовательностям (в данном случае показаны последовательности из двух нуклеотидов), а ребра – единичным эволюционным событиям (нуклеотидным заменам). В первом случае (a) ландшафт приспособленности представляет собой сплошное ровное плато: все 16 последовательностей имеют одинаково высокую приспособленность и все возможные мутации разрешены (не будут отбракованы отбором). Два кратчайших пути, соединяющие последовательности AT и GC, состоят всего из двух мутационных шагов (жирные стрелки). Во втором случае (б) половина последовательностей имеют пониженную приспособленность (отмечены жирными кругами). При этом снижение приспособленности определяется не конкретным нуклеотидом в конкретной позиции, а уникальной комбинацией обоих нуклеотидов (т. е. имеется эпистаз). Это резко снижает проходимость ландшафта: число доступных траекторий уменьшается и кратчайший путь между двумя пунктами (например, от AT к GC) удлиняется. В третьем случае (в) тоже половина последовательностей имеют пониженную приспособленность, но эпистаза нет: нуклеотиды A и G во второй позиции снижают приспособленность независимо от состояния первой позиции. Отсутствие эпистаза способствует тому, что ландшафт остается легкопроходимым, и от AT к GC можно прийти всего за два шага, как и в первом случае. По рисунку из Povolotskaya, Kondrashov, 2010.
Проведенные расчеты подтвердили гипотезу о сильном влиянии эпистаза на эволюцию белков. Оказалось, что темп накопления разводящих мутаций не зависит от дистанции между белками. В каждый момент времени лишь около 2 % аминокислотных позиций могут быть изменены без снижения приспособленности, хотя в долгосрочной перспективе более 90 % позиций могут измениться – но к этим изменениям нужно идти долгими обходными путями по лабиринту узких «горных хребтов» ландшафта приспособленности. У близких, недавно разошедшихся белков темп накопления сближающих мутаций очень высок, потому что у близких белков аминокислотный «контекст» для каждой позиции является сходным. Поэтому та аминокислота, которая недавно стояла в данной позиции, с большой вероятностью может «вернуться» на свое место, и это не снизит приспособленность. Напротив, у сильно различающихся белков данная позиция уже находится в разных контекстах, и поэтому «возвращение» аминокислоты, которая стояла здесь у далекого предка, скорее всего, снизит приспособленность, и мутация будет отсеяна.
В снижении вероятности сближающих мутаций по мере расхождения белков проявляется правило необратимости эволюции. Чем сильнее разошлись белки, тем меньше у них шансов снова стать похожими (мы еще вернемся к этому правилу в главе 5).
Таким образом, ландшафт приспособленности древних белков отличается повышенной «складчатостью». Он похож на сложный лабиринт узких горных хребтов, передвигаться по которому эволюционирующие белки могут лишь очень медленно. Мало того, некоторые узкие мостики норовят обрушиться в бездну после того, как по ним «прополз» эволюционирующий белок, – совсем как в голливудских боевиках, – что придает эволюции элемент необратимости.
Между прочим, полученные результаты – еще один аргумент в пользу единства происхождения всего живого. Подобно тому как разбегающиеся галактики указывают на существовавший в прошлом единый центр, из которого все объекты во Вселенной начали свое движение, так и продолжающееся «разбегание» древних белков указывает на их происхождение от единого предка.
Глава 2. Полезные ошибки
Все здание теории эволюции, а значит и биологии в целом, основано на том, что некоторые случайные наследственные изменения оказываются полезными, т. е. повышают эффективность размножения (по-другому называемую приспособленностью). Термин «полезные мутации» означает только это. В эволюционной биологии бессмысленно говорить о пользе, не имея при этом в виду размножение. Если организм-мутант лучше подлаживается к своей среде, лучше себя чувствует и дольше живет, но при этом проигрывает в размножении, то мутация, какой бы полезной она ни казалась, является вредной. Обычно все эти вещи коррелируют друг с другом, но не всегда.
Для биолога существование полезных мутаций – самоочевидный, банальный факт. Однако многие непрофессионалы склонны усматривать здесь парадокс. Ведь мутации – это ошибки, сбои в системе копирования наследственной информации. Из повседневного опыта мы знаем, что случайные ошибки ничего не улучшают, а только портят. Разве можно улучшить текст, внося в него случайные ошибки?
Это рассуждение верно, если текст совершенен. Действительно, не будем же мы подправлять «Евгения Онегина» или кое-что переписывать в «Женитьбе Фигаро». А если текст черновой и небрежный? Тогда можно и исправить, и улучшить, в том числе путем внесения случайных изменений с отбором удачных вариантов.
Рассмотренная в главе 1 модель с эволюционирующими фразами показывает, как постепенно текст становится лучше. Если нет даровитого цепкого редактора, то особенно важно, чтобы текст тиражировался во множестве копий. В каждую из них вносятся разные ошибки, и для последующего тиражирования раз за разом отбираются лучшие варианты.
В отличие от «Евгения Онегина» биологические тексты редко бывают совершенными[23 - О причинах несовершенства организмов (таких как ловушки локальных оптимумов, «близорукость» естественного отбора, противоречивость требований оптимизации разных частей и подсистем организма, переменчивость среды и др.) написано очень много. Хороший обзор есть в книге Р. Докинза «Расширенный фенотип», недавно изданной на русском языке. Там есть специальная глава, посвященная этой теме; она называется «Пределы совершенства».]. К тому же мир имеет обыкновение меняться. То, что было превосходным вчера, сегодня уже устарело и никуда не годится. Если вчера пределом мечтаний считалось обладание игровой приставкой, то сегодня продвинутый подросток должен иметь последнюю модель айпада (кое-кто из отставших и устаревших уже путают айпад и айпод). Так и в мире природы – меняется биологическое окружение, климат, очертания континентов, и нужно постоянно им соответствовать… Правда, в природе перемены обычно происходят медленнее, чем в современной моде и технологиях, но из этого правила тоже есть исключения.
Итак, мутации – случайные изменения ДНК – бывают полезными. Процесс приспособления неостановим и бесконечен. Но общие рассуждения, как бы громко, уверенно и веско они ни были высказаны, не убедят нашего вдумчивого и скептического читателя. Поэтому постараемся показать на простых примерах, что полезные мутации – это повседневная реальность. В этой главе мы познакомим читателя с несколькими ясными случаями.
Один верный шаг – и на полях вырастает рис