Читать книгу «Протокол EDEN» онлайн полностью📖 — Эдуард Сероусов — MyBook.
image

Глава 2. Вставка

Сингапур. Институт молекулярной медицины. День второй – четвёртый.


Кластер ответил на следующее утро.

Не сразу – сначала пришло стандартное уведомление о постановке в очередь, потом ещё одно, через шесть часов, о начале обработки. Рейчел провела промежуток между ними дома, в квартире на двадцать третьем этаже над улицей, где ночью не было совсем тихо – проспект внизу никогда не засыпал полностью, и через закрытые окна всё равно проникал глухой шум машин, далёкий, как прибой. Она легла в половине первого. В три сорок пять встала, потому что лежать с открытыми глазами в темноте было бессмысленно, и сварила кофе – настоящего, не из автомата, – и сидела за кухонным столом, пока небо за окном не начало светлеть.

Она думала о механизме.

Это помогало. Когда страшно – или когда то чувство, которое ещё не стало страхом, но уже что-то делает с дыханием – лучше всего думать о конкретном. О механизме. О том, как именно то, что она видит, могло бы работать.

Проблема с паттерном метилирования как хранилищем информации была не в том, существует ли он. Он существовал. Статистика это доказала с достаточностью, которая в науке называется «подавляющей». Проблема была в другом: почему он не разрушился.

ДНК – не жёсткий носитель. Она мутирует. Радиация, репликационные ошибки, мутагены. За полтора миллиарда лет эволюции любая случайная последовательность превратилась бы в белый шум. Паттерн метилирования – тем более: метилирование динамично, оно меняется в процессе жизни клетки, стирается и восстанавливается, зависит от ферментов, от среды, от возраста организма.

Но если паттерн существует, и если ему действительно полтора миллиарда лет – значит, у него есть механизм воспроизведения. Что-то его копирует. Что-то следит за тем, чтобы копия соответствовала оригиналу.

Это была ключевая деталь. Это было то, что не давало ей спать.

Метилирование копируется. Не идеально – но достаточно хорошо. Существует целый класс ферментов, называемых метилтрансферазами обслуживания: они узнают полуметилированные сайты после репликации и достраивают метилирование на новой цепи по образцу старой. Именно поэтому эпигенетические паттерны передаются из клетки в клетку. Именно поэтому клетка печени остаётся клеткой печени, а не превращается в нейрон – несмотря на то что ДНК у них одинаковая.

Но это работало для кодирующих регионов, для регуляторных элементов – для всего, что имело биологический смысл и под что были заточены конкретные ферменты.

Для теломерного региона Т2-Т4 специализированной метилтрансферазы обслуживания не было. Не должно было быть.

Рейчел сидела над кофейной кружкой и думала, и постепенно из фрагментов складывалось нечто, что можно было назвать объяснением.

А если фермент есть – но никто его не искал? А если он замаскирован? А если его активность настолько низкая, что стандартные протоколы не детектируют, но для поддержания паттерна с высокой избыточностью – достаточно? Код с высокой избыточностью не требует безупречного копирования. Он требует лишь того, чтобы ошибки не накапливались быстрее, чем система их исправляет.

Это было бы элегантно. Это было бы именно то, что нужно, если проектировать хранилище информации для работы в условиях несовершенного биологического носителя.

Она поставила кружку. Встала. Пошла к окну.

Сингапур в шесть утра: влажный, плоский свет, огни перед рассветом. Внизу – такси, уборочные машины, человек с собакой. Всё на месте. Мир вёл себя как обычно.

Она подумала: если она права – если в теломерах каждого живого существа с ядром в клетке зашита информация, которую кто-то или что-то намеренно туда поместило, – то это не имеет никакого отношения к тому, как выглядит Сингапур в шесть утра. Небо не меняется от того, что ты об этом узнал.

Это было странно успокоительно.


Результаты пришли в 09:22.

Рейчел была уже в лаборатории – пришла в семь, ещё до Ма Лэя. Кластер вернул 847 гигабайт выходных данных и сопроводительный отчёт на двести страниц автоматической статистики. Она не стала читать его целиком. Она знала, что искать.

Первое: детализированная карта субъединиц. Кластер подтвердил и расширил её вчерашние результаты: 47 базовых субъединиц, три уровня иерархии, разделители. Расположение субъединиц не случайно – они группируются в блоки, блоки разделены маркерами. Это выглядело как алфавит из 47 знаков, организованный в слова, слова – в предложения.

Второе: консервация по всем 847 видам. Кластер прогнал сравнительный анализ со значительно более высоким разрешением, чем она могла себе позволить на рабочей станции. Консервация оказалась выше, чем она ожидала. Не 95% – 99.97%. Три тысячных процента отклонения. На полтора миллиарда лет эволюции.

Рейчел сидела и смотрела на эту цифру. 99.97%.

Для сравнения: консервация функционального гена гистона H4 – одного из самых консервативных генов в эволюции, кодирующего ключевой структурный белок хроматина – составляет около 98%. Она была в учебниках как пример экстремальной консервации. Студенты на лекциях делали большие глаза.

Паттерн в регионе Т2-Т4 был консервативнее гистона H4 в три раза. По ошибке на позицию.

Третье: информационная ёмкость. Это был новый параметр, который она добавила в запрос вчера вечером, уже после того как запустила обработку, – через API дополнительного модуля. Если паттерн – код, сколько информации он потенциально хранит в пересчёте на один организм?

Ответ был: от 2.1 до 4.7 мегабайт. В зависимости от метода кодирования.

Рейчел произнесла это вслух, тихо, как бывает, когда произносишь вслух, чтобы проверить, как слово звучит:

– Четыре мегабайта.

В каждой клетке. В каждом ядре. У каждого живого существа с хромосомами.

Маленький объём – в пересчёте на современные стандарты хранения данных, ничто. Но достаточный для передачи сложного сообщения. Достаточный для сжатого описания биологической системы. Достаточный для координат. Для инструкции. Для сигнала.

Она написала в своём журнале: Механизм кодирования подтверждён. Метилирование как вторичный информационный слой поверх первичной последовательности. Воспроизводство обеспечивается, предположительно, высокоточной метилтрансферазой с неизвестной специфичностью, действующей на теломерный регион. Ёмкость: 2-5 Мб на организм. Консервация: 99.97%.

Потом остановилась. Написала ещё одну строку:

Рабочее название – Вставка.


Датировка была следующей задачей. И она оказалась проще, чем Рейчел рассчитывала, потому что данные уже были у неё – нужно было только спросить их правильно.

Логика была стандартной для эволюционной биологии: если признак присутствует у всех представителей группы, значит, он возник не позже, чем возникла сама группа. Если Вставка есть у всех 847 видов её выборки – а они охватывали весь диапазон эукариот, от одноклеточных дрожжей до позвоночных – то Вставка возникла не позже последнего общего предка всех эукариот.

Последний общий предок всех эукариот. Это было не просто «давно». Это был конкретный момент в истории жизни на Земле: около 1.5–1.8 миллиарда лет назад, протерозойский эон, когда первые клетки с настоящим ядром и линейными хромосомами появились в древнем океане. Момент, который называют эукариотогенезом – рождением ядерной клетки.

Но Рейчел хотела проверить это точнее. У неё в выборке было несколько видов, принадлежащих к наиболее ранним ветвям эукариотического дерева – так называемые «глубокоотходящие» линии, дивергировавшие практически сразу после эукариотогенеза. Если Вставка есть у них – это нижняя граница датировки: не позже начала.

Она запустила целевой анализ по пяти видам: Giardia intestinalis, Trichomonas vaginalis, Microsporidia двух разных родов, и один малоизвестный морской протист, образцы которого она получила три года назад из биобанка Океанографического института Вудс-Хол в обмен на две пробирки с собственным материалом.

Все пятеро. Вставка присутствует у всех пятерых. С той же консервацией. С теми же субъединицами.

Рейчел сидела и смотрела на результат.

Потом набрала в поисковике: «эукариотогенез дата возникновения последние данные». Не потому что не знала – потому что хотела убедиться, что не перепутала.

1.5–1.8 миллиарда лет. Данные молекулярных часов, 2041 год, Nature. Консенсус.

Значит, Вставка возникла примерно тогда, когда возникла ядерная клетка. Не после. Не как адаптация к уже существующей эукариотической организации. Одновременно. В самом начале.

Или – и это была мысль, которую она не смогла не додумать – как часть того процесса, который создал ядерную клетку.

Она встала из-за стола и пошла к раковине. Открыла воду, умылась холодной водой, вытерлась бумажными полотенцами. Посмотрела на себя в зеркало над раковиной – узкое, в металлической рамке, давно требовавшее замены.

Выглядела нормально. Немного бледная. Глаза с красными прожилками – не выспалась. В остальном – нормально.

Она вернулась к столу.

Написала в журнале: Датировка: ≥1.5 млрд лет. Совпадает с эукариотогенезом. Вставка не является вирусной вставкой (ВВ присутствуют не у всех видов, имеют следы горизонтального переноса, демонстрируют дрейф). Вставка – не ВВ. Вставка – часть архитектуры.

Последнее слово она написала, потом посмотрела на него, потом не стёрла.

Архитектура. Не случайность, не побочный продукт, не адаптация.

Спроектировано.


В три часа дня пришёл запрос от Ма Лэя – формальный, через рабочую переписку, хотя он сидел в пяти метрах от неё:

Доктор Чен, образцы из группы B-7 готовы к следующему этапу секвенирования. Подтвердите приоритет.

Она ответила: Отложите до следующей недели. Сосредоточьтесь на протоколе G-12.

Принято.

Больше он не отвлекал. Она слышала его – тихое движение, осторожные шаги к холодильнику, щелчок дверцы, звук пипетки. Привычный фон, почти неслышимый.

Она думала о том, как именно сообщить о своих данных – или сообщать ли вообще. Это был вопрос, который она обычно не задавала: в науке данные публикуют, это основное правило, это весь смысл. Но сейчас.

Если она права, ей нужны независимая проверка и дополнительные образцы. Не её 847 видов – другие лаборатории, другие линии, другие методы секвенирования. Это означало коллаборации, обмен данными, объяснения.

Объяснения – это где проблема.

Она представила, как отправляет препринт. Рейчел Чен, Институт молекулярной медицины, Сингапур: Доказательства намеренной информационной вставки в теломерный регион всех эукариотических организмов с датировкой 1.5 млрд лет. Она представила рецензентов. Она представила свой инбокс после публикации.

Нет.

Не потому что она боялась. Потому что ещё не верила сама.

Это была другая вещь. Важная. В науке нужно верить своим данным – не в смысле слепой веры, а в смысле готовности отстаивать интерпретацию под давлением. Рейчел не была готова. Не потому что данные были плохими. Потому что данные требовали объяснения, которое она ещё не могла сформулировать с достаточной точностью, чтобы его защищать.

Ей было нужно ещё время.

Ей было нужно ещё одно доказательство – другого рода. Не статистическое. Механистическое.

Если Вставка существует как хранилище информации, и если её воспроизводство обеспечивается специализированной метилтрансферазой – эта метилтрансфераза должна существовать. У неё должна быть аминокислотная последовательность. Эта последовательность должна быть где-то закодирована в геноме. И если фермент настолько фундаментален, что присутствует у всех 847 видов – он должен быть консервативен не меньше, чем его субстрат.

Это была проверяемая гипотеза. Конкретная. Это была та работа, которую нужно было сделать дальше.

Она начала составлять план.


К вечеру план был готов.

Это была задача на несколько недель как минимум – поиск неизвестного фермента через функциональную геномику, коиммунопреципитацию, возможно ChIP-seq. Стандартный арсенал, но трудоёмкий. Ей нужны были определённые реагенты, которых не было в лаборатории, нужен был доступ к базе данных Uniprot с расширенными фильтрами, нужно было написать несколько новых скриптов для анализа структуры белков.

Она сделала список. Разбила на этапы. Расставила приоритеты.

В шесть Ма Лэй сказал «спокойной ночи» и ушёл. Она ответила, не отрываясь от экрана. Дверь закрылась. Лаборатория снова принадлежала ей.

Она работала ещё два часа – писала скрипты, заказывала реагенты через институтскую систему, отвечала на накопившиеся письма по другим проектам. В 20:15 поняла, что голодна: она не ела с утра, если не считать половины банана из сумки, который она съела в четыре дня, не прерывая работы.

Она сохранила все файлы. Дважды. На локальный диск и на облачный бэкап.

Потом остановилась.

Бэкап.

Облачный бэкап использовал институтский сервер. Её рабочие данные синхронизировались автоматически – это было удобно, это было политикой Института для защиты данных от потери. Стандартная процедура. Никогда не создавала проблем.

Она посмотрела на папку с данными по Вставке. Потом на статус синхронизации в нижнем правом углу экрана: маленькая иконка облака с галочкой. Синхронизировано.

Все её данные – карты метилирования, результаты кластерного анализа, расшифрованные субъединицы, датировка, рабочие гипотезы – лежали не только на её рабочей станции. Они лежали на сервере. Сервере, к которому у Института был стандартный административный доступ.

Она смотрела на иконку облака.

Потом закрыла ноутбук. Взяла сумку. Выключила свет.

Это было стандартной процедурой. Это не было поводом для беспокойства. Все сотрудники Института хранили данные на институтском сервере. Это не было ничем особенным.

Она вышла из лаборатории.


Дома она поела – что-то из холодильника, не запомнила что – и открыла ноутбук на кухне. Хотела посмотреть на данные ещё раз, свежим взглядом.

Вместо этого открыла папку архивов.

Не рабочую. Личную. Ту, которую она не открывала несколько месяцев.

Она знала, что ищет – или думала, что знает. После того, как она сегодня увидела биоптат из базы данных Giardia и впервые подумала о механизме воспроизводства Вставки, у неё зацепилась мысль – маленькая, неудобная, которую она весь день держала в стороне и не разрешала себе трогать.

Её мать умерла от теломеразной дисфункции.

Рейчел занималась теломерами. Это не было случайностью – это была причина. Она никогда не притворялась, что интерес к теломерам возник из абстрактного научного любопытства.

Но за шестнадцать лет работы – сначала аспирантура, потом постдок, потом собственная лаборатория – она никогда не применяла свои инструменты к данным матери напрямую. Это казалось чем-то, что она не должна делать. Не этика – скорее суеверие. Или страх. Или различие между «знать» и «знать точно».

Папка архивов. Папка «Семья». Папка «Мама – медицинское».

Последний раз она открывала её два года назад – после смерти тёти, когда разбирала старые документы.

Там были снимки. Выписки. Результаты анализов, переданные её отцом после смерти матери, которые он получил из больницы и не знал, что с ними делать, и Рейчел взяла их к себе – на всякий случай, не зная зачем, просто потому что казалось неправильным выбрасывать.

Она нашла файл с лабораторными данными. Открыла.


Биоптат был взят за девять дней до смерти матери.

Дата – Рейчел помнила её, не потому что специально запоминала, а потому что помнила всё из тех шести месяцев в деталях, с той отчётливостью, с которой запоминается время, когда боишься. Ноябрь. Холодный для Сингапура. Мать была уже почти без движения – нейродегенерация дошла до моторных областей коры.

Биоптат: фрагмент нейронной ткани из образца люмбальной пункции. Цель – секвенирование теломерной области для оценки дисфункции. Стандартный протокол того времени – 2027 год, пиросеквенирование, не нанопоровый метод. Считывали последовательность, не метилирование.

Рейчел прочитала заключение. «Подтверждается критическое укорочение теломер в нейрональных образцах. Теломеразная активность: не детектирована. Заключение: соответствует клинической картине теломеразной нейродегенерации.»

Потом – приложение. Сырые данные.

Она не открывала их раньше никогда. Они были в формате старого протокола, нечитаемом без специального конвертера. Она открыла конвертер – нашла его за три минуты, библиотека биоинформатических инструментов, стандартная.

Данные развернулись.

Рейчел смотрела на экран.

Пиросеквенирование 2027 года – грубый метод. Он не читал метилирование отдельных сайтов с базовым разрешением, он давал усреднённые показатели метилирования по регионам. Шумные данные, неточные. Но – данные.

Для региона Т2-Т4 пиросеквенирование показывало: метилирование нестандартное. Выше ожидаемого. Асимметричное.

Рядом с этой строкой – пометка, сделанная лаборантом 2027 года, который проводил анализ: «Артефакт секвенирования. Не учитывать».

Рейчел смотрела на эту пометку долго.

Артефакт секвенирования.

Так это выглядело в 2027 году – с инструментами 2027 года. Аномальное метилирование в нетранскрибируемом теломерном регионе без известной функции. Конечно – артефакт. Что ещё? Что ещё можно было подумать?

Она закрыла файл.

Открыла фотографии в той же папке. Нашла ту, которую помнила: мать в больничной палате, снимок сделан, наверное, в сентябре – ещё до того, как стало совсем плохо. Мать смотрела в окно, не в камеру. Лицо в профиль. Свет боковой, больничный. На больничном одеяле – книга, раскрытая лицом вниз: Рейчел не помнила, какая.

Фотография была распечатана когда-то давно и перенесена в цифру – поэтому углы слегка загнуты на скане, видна фактура бумаги.

Рейчел смотрела на неё.

Потом закрыла ноутбук.

Сидела в темноте за кухонным столом. На плите был чайник – она не помнила, когда включила его. Уже давно остыл.

Мать умерла от теломеразной дисфункции. Рейчел искала причины этой дисфункции шестнадцать лет. Она нашла – возможно нашла – нечто в теломерах, что не имеет отношения к дисфункции. Что-то совершенно другое. Что-то, что там было намеренно.

Эти две вещи были несвязанными. Она должна была думать о них как о несвязанных.

Она не была уверена, что может.


На третий день она вернулась в лабораторию в шесть утра и сразу открыла институтскую базу данных архивных образцов.

База данных хранила метаданные обо всех образцах, когда-либо проходивших через Институт или поступавших через партнёрские соглашения. Это был огромный архив – сотни тысяч записей, уходящих в начало двухтысячных. Большинство – просто идентификаторы, даты, протоколы.

Рейчел знала, что данные матери – её собственные, семейные – не находятся в этой базе. Их никогда не передавали в Институт. Они оставались у неё.

Но.

Существовали другие источники. Когда мать болела – в 2027 году – и диагноз был неясен, её наблюдал не один специалист. Был консилиум. Несколько лабораторий брали образцы для анализа. Один из них – лаборатория нейрогенетики НУС, Национального университета Сингапура. Рейчел помнила: тогда, в 2027-м, это казалось просто ещё одним мнением. Ещё одной попыткой.

Лаборатория НУС имела соглашение об обмене данными с Институтом. Их архив был частично интегрирован в общую базу.

Она набрала имя матери в строке поиска.

Результат появился.

Один образец: биоптат нейронной ткани, НУС-2027-11-03. Получен в ходе исследовательского протокола по нейродегенерации. Статус: в архиве. Физическое местоположение: криохранилище НУС, уровень B2, ячейка 447.

Рейчел смотрела на запись. Потом посмотрела на правую часть строки – там, где были метаданные о доступе к файлу.

Последнее обращение к записи: сотрудник Института – то есть она сама, только что.

Предпоследнее обращение: внешний запрос. Дата – три недели назад.

Рейчел перечитала это дважды.

Предпоследнее обращение: внешний запрос.

Три недели назад.

Идентификатор запроса – зашифрованный, не расшифровывался на её уровне доступа. Только тип: внешний. И дата: три недели назад.

Она сидела неподвижно.

Кто-то три недели назад запрашивал метаданные образца её матери. Через внешний запрос – не сотрудник Института, не НУС. Кто-то снаружи. С доступом к интегрированной базе. Это был не публичный доступ – для этого нужна была авторизация.

Вентиляция гудела. Пахло изопропанолом. За стеклом криобанка мигал синий огонь.

За три недели до того, как её запрос к суперкомпьютерному кластеру получил статус «маршрутизация».


...
6