Так как структурные и функциональные МРТ-изображения очень похожи, большинство неспециалистов, а также многие профессионалы не из цеха нейровизуализации, не поняли, что теперь томограммы больше не передают то, «что существует на самом деле», как это было в случае с рентгеновскими снимками. Видеть значит верить – для человека, по природе склонного к иконофилии, красочные томографические изображения автоматически обретают соблазнительную силу истинного образа.
Но на самом деле все обстоит совершенно иначе. Нейровизуализационные изображения – это не просто нечеткие фотографии работающего мозга низкого разрешения, а результат множества технологических процессов. До получения итогового образа необходимо принять длинный ряд технических решений. От обработки исходных данных со сканера до окончательных статистических расчетов. Целая «цепь заключений», как было сказано в одной из переводных статей журнала Nature Neuroscience[125].
При этом слепо верить этой «цепи заключений» обычно не стоит: «…в итоговой [научной] публикации обычно содержится сильно редуцированная часть оригинальных данных, отфильтрованная в результате серии преобразований и оценок, часто довольно своеобразных. Не существует единого мнения о „правильном“ способе проведения этих исследований; каждое из них имеет свои сильные и слабые стороны, кроме того, постоянно разрабатываются новые методы»[126]. Один лишь выбор уровня статистической значимости требует достижения сложного баланса между возможными ложнопозитивными и ложнонегативными результатами.
В Nature Neuroscience также указывалось, что «трудно создавать научные статьи, описывающие (и, самое главное, объясняющие) сложные закономерности активации мозга. Поэтому часто наблюдается тенденция к консервативным ограничениям, что позволяет сократить количество фактов активации и представить более простой результат»[127].
Однако сложности нейровизуализационных исследований начинаются задолго до того, как будут проведены измерения. Главная проблема заключается в разработке содержательного общего проекта исследования с надежными экспериментальными параметрами и соответствующими контрольными условиями. «Нынешняя проблема визуализации состоит в том, что бесконечно сложно выполнять правильные исследования, тогда как получить изображения очень легко», – делает вывод пионер нейровизуализации Стивен Петерсон[128].
Вне зависимости от всех оговорок, видеть значит верить. Психологи Дэвид Маккейб и Алан Кастел изучили, как испытуемые оценивают достоверность фиктивных результатов нейронаучных исследований, когда им показывают или не показывают изображения мозга[129]. Во время трех различных экспериментов, в которых сфабрикованные данные когнитивной науки были представлены просто в виде текста, в виде текста и диаграммы и в виде текста и изображений мозговой активности, тестируемые студенты всегда считали «научно наиболее убедительными» тексты, сопровождаемые изображениями. Маккейб и Кастел заключили, что «часть очарования – и правдоподобия – исследования с применением метода визуализации заключается в убедительности самих изображений мозга»[130]. Мозговые сканеры – это доказательные машины. Для историка науки Хагнера – также и в том смысле, что они «сводят до сих пор плохо понятные причинные связи к поверхностному рассмотрению»[131].
Арифметика любвиС другой стороны, в общественном восприятии сканеры для проведения МРТ имеют репутацию настоящей «машины объективности»[132]. Внушительные, футуристические, почти магические высокотехнологичные объекты, которые обнажают скрытое нутро человека. При этом существует множество веских причин скептически относиться к претендующим на объективность фМРТ-изображениям. Чтобы обосновать это, сделаем обзор множества проблемных областей функциональной магнитно-резонансной томографии.
Во-первых: обычно в качестве итога функциональных нейровизуализационных исследований мы получаем разностные изображения. То, что мы видим, является результатом процесса субтракции. Процедура подчиняется простой и, прежде всего, очевидной логике. Чтобы иметь возможность засвидетельствовать определенную работу мозга, испытуемый в сканере подвергается двум опытам. Измеряется изменение местного потребления кислорода крови в интересующих экспериментальных условиях (условиях испытания), а также в контрольных условиях. В поисках, скажем, участка мозга, отвечающего за романтическую любовь, влюбленным показывают фотографии их любимого партнера, а также фотографии друзей того же возраста и пола, к которым у них нет «истинной, глубокой и сумасшедшей» привязанности[133].
Затем МРТ-изображение, выполненное в контрольных условиях, просто субтрактируют (вычитают) из снимка, который сделан при созерцании испытуемым предмета его страсти. Так надеются устранить с изображения все неспецифические активности мозга, которые не имеют отношения к влюбленности[134]. Расчет для корректировки активности делают следующим образом: (влюбленный + все остальное) – (не влюбленный + все остальное) = влюбленный. В представленном здесь примере изучения влюбленности расчеты руководителя исследований Андреаса Бартельса и Семира Зеки дают следующий результат: влюбленный = = активация передней части поясной извилины и срединной части островковой доли коры головного мозга, а также путамена и хвостатого ядра. Кроме того, деактивация задней части поясной извилины и миндалин, а также правых лобной, теменной и височной долей коры головного мозга.
Логично, что через несколько лет Семир Зеки, видный нейроученый из лондонской Лаборатории нейробиологии Wellcome, посвятил себя темной стороне человеческих эмоций. В рамках исследования «Нейронные корреляты ненависти» испытуемым, находившимся в сканере, теперь уже нужно было не любить от всего сердца, а искренне ненавидеть[135]. Для этого были подобраны люди, которые «демонстрируют сильную ненависть к тому или иному индивидууму». При этом объектами ненависти всегда являлись бывший сексуальный партнер или коллега по работе. Таким образом был обеспечен надежный натуралистический подход к исследованию. Степень враждебности получила количественную психометрическую оценку по «шкале страстной ненависти».
Аналогично опыту с романтическими чувствами, испытуемые приносили с собой фотографии ненавистных им людей. Затем эти фотографии демонстрировали им в сканере, чередуя с нейтральными лицами. Опять же, изображение мозга, реагирующего на нейтральные изображения, вычли из снимка мозга ненавидящего.
Итак, по словам Зеки и его коллеги Джона Пола Ромайи, мозг ненавидит так: активируются средняя лобная извилина, путамен, премоторная зона, островковая доля и прецентральная извилина правого полушария, тогда как верхняя лобная извилина правого полушария, напротив, не активна. Авторы заключают: «Исследование показывает, что активация мозга ненавидящего человека происходит по определенной схеме»[136].
Особенно внимательный читатель сможет заметить, что активация островковой доли и путамена уже отмечалась выше при описании влюбленных испытуемых. Хотя авторы исследования ненависти в обсуждении этого примечательного обстоятельства благоразумно отделываются общими словами («текущее состояние знаний не позволяет сделать точную интерпретацию»), онлайн-выпуск журнала Deutsche Arzteblatt предлагает даже биологическое объяснение: «Дружба и вражда активируют путамен правого полушария. Эту область исследователи мозга связывают с подготовкой тела к движениям. В случае чувства любви движения могут быть связаны с желанием приблизиться к любимому человеку или защитить его. Ненависть способна стать причиной агрессивных действий или противодействия противнику. Второй центр, который активируют оба чувства, – это островковая доля. Ее Зеки считает ответственной за стресс, связанный как с чувством ненависти, так и с романтической любовью (в форме ревности)»[137]. Не существует результатов фМРТ, которые нельзя было бы объяснить с помощью богатого воображения и, в еще больше степени, с помощью смелого упрощения.
Морское сравнениеПомимо базовых редукционистских оговорок разностный метод связан также с технической проблемой доступной точности измерения. Поскольку мозг постоянно активен[138], уже «фоновый шум», вычитаемый при субтракции контрольных данных, оказывается в большинстве случаев намного существеннее, чем предполагаемый специфический результат, например, при принятии решения нравственного характера. Исследования показали, что при решении когнитивной задачи затраты энергии мозгом увеличиваются по сравнению с основным состоянием менее чем на 5 %[139].
Образно говоря, разностный метод похож на определение веса капитана путем взвешивания яхты с капитаном, а затем яхты без капитана. Нейробиолог Герхард Рот в передаче «Баварского радио» ссылается на еще одну фундаментальную трудность, а именно на техническую необходимость статистического усреднения большого количества замеров: «Это осложняется тем фактом, что получаемые изображения обычно являются артефактами. А именно усредненными изображениями мозга, который много раз измерялся, или даже результатами многократных измерений множества мозгов, позволяющими нам видеть какие-то отличия… Эти артефакты очень интересны, но их нужно интерпретировать крайне осторожно. И интерпретация зачастую очень сложна»[140].
Кроме того, схемы мозговой активности сильно варьируются от субъекта к субъекту. В случае одинаковых испытаний в одном и том же сканере при постоянных экспериментальных условиях индивидуальные результаты могут выглядеть совершенно по-разному. Как это часто бывает при изучении сложных биологических систем, одна лишь природная вариативность приводит к значительным различиям между результатами исследования отдельных испытуемых.
Эти естественные различия затем проявляются в статистических расчетах как значительные отклонения или же как наложения в данных. Поэтому обычно на уровне отдельного человека полученный результат фМРТ невозможно связать с определенными условиями эксперимента или с конкретным диагнозом.
Статистически значимые различия обнаруживаются только при интраиндивидуальном (один и тот же человек сканируется дважды, один раз в состоянии покоя и один раз – при выполнении когнитивной задачи) или при групповом сравнении (когда сравниваются усредненные схемы мозговой активности целых групп). Так, например, можно увидеть, что при просмотре изображений алкогольных напитков мозг алкоголиков в среднем реагирует иначе, чем мозг неалкоголиков. (Что, конечно, совсем не удивительно.) При рассмотрении только одного частного результата измерения соотнести его с чем-либо, как правило, невозможно.
Как в первые дни фотографииМало внимания обычно уделяется также тому, что временное разрешение функциональных методов МРТ на один или два порядка отстает от возможности зафиксировать фактически происходящие нейронные процессы. «Гемодинамический ответ», который измеряется как признак реальной активности мозга, требует для собственного формирования в лучшем случае несколько сотен миллисекунд. Однако результаты электроэнцефалографии показывают, что активность коры головного мозга меняется в течение нескольких миллисекунд, например, под воздействием визуального стимула. То, что фиксирует фМРТ, – это накопленные во времени и совмещенные изображения всего, что происходило в мозге в пределах нескольких секунд.
Сравнение с начальным периодом фотографии неизбежно. Около 1840 года время экспозиции, требовавшееся для получения дагерротипа, составляло примерно 20 минут. Поэтому первоначально можно было фотографировать только неподвижные объекты – скажем, собор Парижской Богоматери. Хотя во время съемок около храма проходили десятки гуляющих, на готовом изображении не было ни одного человека. Только бледный и расплывчатый собор. Вполне возможно, что МРТ ожидает такой же быстрый технический прогресс, который выпал на долю фотографии. Совсем недавно физики и нейроученые из Беркли и Оксфорда продемонстрировали техническое усовершенствование, которое позволяет сканировать в семь раз быстрее[141]. Предполагается, что полное 3D-сканирование мозга можно будет делать всего за четыреста миллисекунд. В настоящее время типичное время сканирования варьируется от двух до трех секунд.
Тем не менее проблема далекого от действительности результата, в лучшем случае, может быть решена лишь частично. И это меньше связано с техническими особенностями МРТ, чем с непрямым принципом измерения. И, таким образом, с биологией мозга, которому все равно требуется непрактично долгое время, чтобы отреагировать на изменение активности нейронов изменением кровотока и потребления кислорода.
Дипломатичная критикаНедооцененным источником ошибок является также привязка анатомических зон к сигналам, получаемыми при фМРТ. Проблемы вызывают небольшие органы, например миндалины. Особенно при получении фМРТ-изображений на сканерах с напряженностью магнитного поля менее 5 Тесла. Немецкие и швейцарские ученые исследовали вопрос, насколько велик фактический локализационный коэффициент совпадений в случае миндалин.
Грубо говоря: есть ли на красочных фМРТ-изображениях миндалины, если они на них обозначены? Путем сравнения с атласами мозга с клеточным разрешением Тонио Балл и его коллеги рассчитали вероятность правильной идентификации миндалин в 114 исследованиях, в которых сообщалось об активации или деактивации этих областей мозга[142]. Результат оказался скромным. Из привязанных к миндалинам 339 BOLD-сигналов едва ли половина исходила от них с вероятностью более 80 %. Вероятность соответствия миндалинам 12 % «их» сигналов вообще была оценена как нулевая. В реальности за эти сигналы были приняты сигналы от гиппокампов. В остальных случаях коэффициент вероятности совпадений находился где-то между этими результатами.
Работа Балла и его коллег также стала образцом дипломатии. Все изученные исследования ученые распределили по авторам, а анатомическое расположение предполагавшихся миндалин представили в виде набора MNI-координат[143]. Было бы несложно выполнить таблицу и в ее колонках указать вычисленные вероятности правильного соотнесения сигналов с миндалинами для каждого исследования. Однако от такой формы решили воздержаться, очевидно, чтобы не компрометировать некоторых коллег.
Большинство фМРТ-исследований внушают, что можно визуализировать конкретные мозговые процессы, которые лежат в основе конкретного опыта восприятия. Но есть ли на самом деле какие-то специфические нейронные корреляты зависти, любви, морали или ревности, отделимые от другой работы мозга? Возможна ли в действительности фМРТ-фиксация лжи? Или мы наблюдаем только глобальные, неспецифические схемы мозговой активности, которые были бы одинаковыми или очень похожими во множестве разных опытов или в разных экспериментальных ситуациях? Если вы исследуете мозг и вас неожиданно спрашивают, где в нем происходит то или иное умственное действие, просто ответьте: в передней части поясной извилины коры головного мозга. Так вы с большой вероятностью ответите правильно. Недаром передняя часть поясной извилины считается особенно «неразборчивой областью мозга».
Вот несколько примеров. Активация этой области мозга обнаруживается не только среди недавно влюбленных и американских избирателей, которые видят изображения Хиллари Клинтон, но также когда китайско-английские билингвы при словообразовании отказываются от одного из языков[144], когда женщинам приходится выбирать между потенциальными сексуальными партнерами[145], когда голодный получает шоколадный молочный коктейль[146], когда мужчины вспоминают о собственной смертности[147], когда вегетарианцам показывают иллюстрации жестокого обращения с животными[148], когда оптимисты представляют позитивные события[149] или когда человека щекочут в МРТ-сканере[150]. Можно было бы долго продолжать этот список. Общераспространенным является предположение, что передняя часть поясной извилины отвечает за связь между эмоциями и познанием[151]. Это имеет смысл и способно объяснить, почему она заведомо активна, что бы мы ни измеряли. В то же время обнаружение активации этой зоны при МРТ становится теоретико-познавательной тривиальностью. Ведь какое человеческое действие не сопровождается эмоциями и познанием?
Лосось сомненийНа конференции организации Human Brain Mapping в Сан-Франциско в 2009 году одна научная работа молодых психологов недолговременно и развлекла, и разозлила публику. В стендовом докладе на тему «Построение модели и анализ» Крейг Беннетт, Майкл Миллер и Джордж Уолфорд представили своим коллегам – исследователям мозга поучительную работу. Ее название: «Нейронные корреляты межвидового восприятия мертвого атлантического лосося: аргумент в пользу поправки на множественные сравнения»[152].
Порядок проведения эксперимента был действительно инновационным. Психологи поместили в МРТ-сканер зрелую особь атлантического лосося (Salmo salar) и во время измерения показывали ему серию фотографий, изображающих людей в социальном взаимодействии. Обнимающихся, жмущих друг другу руки, спорящих и так далее. Точно так же, как это обычно делается при проведении исследований в области «социальных нейронаук». Однако пикантность эксперимента Беннетта и его коллег заключалась в том, что лосось в сканере давно умер. Получив данные фМРТ о восприятии мертвой рыбой вариантов социального человеческого взаимодействия, авторы провели стандартный статистический анализ, как это обычно делается в исследованиях такого рода[153]. В результате в мозге мертвого лосося были вычислены несколько сопряженных участков повышенной активности. И это при вполне обиходном уровне статистической значимости p = 0,001. На томограмме лосося зоны активности мозга выглядели как красные «капли», так же, как это бывает на других фМРТ-изображениях.
Что есть, то есть. Неужели мертвый лосось способен на межвидовое восприятие? Очень маловероятно. Авторы, которым не откажешь в чувстве юмора, хотели показать нечто совсем другое. А именно то, что почти наверняка получаются ложноположительные результаты, если не корректировать статистические данные с учетом поправки на множественные сравнения. Если бы перед анализом психологи скорректировали данные фМРТ по всем правилам статистического искусства, из мозга мертвого лосося исчезли бы все ложноположительные сигналы.
«Лосось сомнений», как он был прозван в профессиональной среде[154], является впечатляющим стимулом для последовательного использования вышеупомянутой статистической коррекции визуализационных данных. В ответ на исследование мозга лосося некоторые нейроученые нервно ответили, что это уже хорошо известно и что соответствующие поправки якобы приняты как должное в научной практике.
То, что дела обстоят совершенно иначе, показывает ретроспективный обзор фМРТ-исследований, опубликованных в таких известных журналах по нейровизуализации, как Cerebral Cortex, NeuroImage или Human Brain Mapping[155]. Доля работ, в которых не было сделано никакой поправки на множественные сравнения, колебалась между 25 и 40 %. Сколько красных и синих пятен на фМРТ-изображениях из этих исследований являются просто техническими и расчетными артефактами, вероятно, останется неизвестным.
В научной практике большинство исследователей хотят как можно меньше корректировать получаемые результаты визуализации, так как легко потерять даже настоящие свидетельства мозговой активности. Это тема для размышления. Определенно целесообразным представляется предложение приводить в научных публикациях как исправленные, так и неоткорректированные данные. У читателя-специалиста тогда была бы возможность самостоятельно решить, каким данным он доверяет. Во всяком случае, лосося Крейга Беннетта это бы не огорчило. Он был съеден экспериментаторами в день МРТ-сканирования.
«Если данные долго пытать, то они признаются»Из профессиональных кругов приходит и другая критика применяемых методов. Например, указывается, что многие визуализационные исследования проводятся без какой-либо первоначальной гипотезы. О том, что подавляющее большинство исследований проходят без конкретных, поддающихся проверке исходных предположений, говорил и популярный индийский невролог Вилейанур Рамачандран: «98 % нейровизуализаций – это слепое блуждание в темноте»[156]. Как гласит популярное возражение, данные, полученные бессистемно, позднее могут использоваться во множестве статистических расчетов. И это до тех пор, пока не будет обнаружено что-то значимое (испытанная стратегия «если данные долго пытать, то они признаются»). Далее оценивается масштаб выявленного результата, а затем подбирается объяснение, почему активен именно этот участок мозга.
Короче говоря, рыба ловится в мутной воде, а затем делается вид, что цель поиска была известна с самого начала. До сих пор среди исследователей нет единого мнения, какой статистический метод и способ интерпретации следует применять к тем или иным полученным данным визуализации. Не говоря уже об обязательных нормах. Диапазон возможных подходов очень велик. Это важная проблема, которая по-прежнему не решена. Потому что, если даже минимально изменить исходные параметры, можно легко получить совершенно другой результат. При этом все предшествующие произвольно подобранные этапы процесса не видны в итоговом изображении, так что оно кажется результатом строго эмпирических измерений, который мог получиться только таким и никаким другим.
Магия вуду в социальной нейронаукеЕще больше шума, чем юмористическое фМРТ-исследование мертвого лосося, вызвала в 2009 году методологическая работа Эдварда Вула и его коллег из Массачусетского технологического института. Когнитивные психологи очевидно намекали на свое противостояние с коллегами из сферы «социальных нейронаук». Первоначальное название их работы было «Вуду-корреляции в социальных нейронауках». Однако по просьбе журнала, в котором позднее появилась статья, название было изменено на «Удивительно высокие коэффициенты корреляции в фМРТ-исследованиях эмоций, личности и социального познания»[157].
Что критиковали авторы статьи? Вул и его коллеги предположили использование магии вуду при выявлении «таинственно» высоких значений взаимосвязи отдельных групп личностей или определенного поведения и сигналов мозга, продемонстрированных социальными нейроучеными в своих исследованиях. После предварительного отбора Вул и его коллеги связались с авторами 54 работ и опросили их о статистических методах, использованных ими в фМРТ-исследованиях.
Как утверждали психологи, более чем в половине случаев ученые использовали корреляционные методы, систематически искажавшие фактические связи и показывавшие слишком высокие значения взаимозависимостей, чтобы быть правдой. В деталях проблема, описанная Вулом и его коллегами, касается продвинутых специалистов по статистике[158]. Чтобы наглядно ее представить, можно привести притчу о техасском ковбое. Представьте головореза, стреляющего без разбора в складские ворота. Затем он рисует цель вокруг тех пулевых отверстий, которые находятся ближе друг к другу. Таким образом в результатах стрелка появляется сразу несколько прямых попаданий.
Аналогичным образом, по мнению авторов статьи, происходит выявление корреляций при фМРТ-экспериментах. При этом авторы не ограничились обычной методологической критикой. Они даже призвали предполагаемых исказителей статистических данных пересчитать результаты своих исследований: «Мы показываем, как данные этих исследований могут быть повторно проанализированы с помощью неискажающих методов… Мы настоятельно призываем авторов провести такой повторный анализ и уточнить научные записи»[159]. Настоящая провокация, если учитывать, что все исследования и авторы упоминаются в конце статьи. Среди них много знаменитостей в области «социальных нейронаук», имеющих публикации в таких ведущих журналах, как Science, Nature или Human Brain Mapping. Атакованные, конечно, быстро защитили себя и осудили работу Вула как ошибочную и некорректную. Научный спор продолжается и по сей день.
Месье Тан пишет историю медициныВ мире функциональной нейровизуализации есть ряд концептуальных изъянов, технических недостатков, статистических причин ошибок, самовольных решений и необоснованных основных предпосылок. Тем не менее еще более важным, чем все это, является вопрос, есть ли вообще принципиальный смысл в том, чтобы искать в мозге зоны, ответственные за справедливость, мораль или духовность.
Хотя не позднее чем с 18 апреля 1861 года известно, что есть умственные действия, которые довольно точно локализуются в определенном месте мозга. В тот день французский врач Поль Брока извлек мозг своего умершего днем ранее пациента господина Леборня, страдавшего нарушением речи. В мозге бедняги Леборня, который на любой вопрос мог ответить только «тан»[160], были выявлены серьезные изменения. Основываясь на локализации этих изменений и истории болезни, Брока пришел к выводу, что повреждение области между лобными долями и височными долями «господина Тана» должно было привести к потере возможности говорить. До сих пор область коры головного мозга, получившая название «центр Брока», считается местом обеспечения моторной организации речи.