Представители научной школы, получившей название «коннекционизм», во главе с психологами Дэвидом Румельхартом и Джеймсом Мак-Клелландом, утверждают, что простые сети сами по себе отвечают за преобладающую часть человеческого интеллекта. В своей крайней форме коннекционизм гласит, что мышление – это одна большая сеть обратного распространения ошибок скрытого уровня, или, возможно, группа из похожих или идентичных сетей, и интеллект формируется за счет того, что учитель – среда – настраивает веса связей. Единственная причина, по которой люди умнее крыс, состоит в том, что в наших сетях между стимулом и реакцией больше скрытых уровней, и мы живем в среде других людей, которые выступают в роли учителей сети. Правила и символы могут быть полезны как приближенная модель того, что происходит в сети, для психолога, который не может угнаться за миллионами потоков возбуждения, протекающих в связях, но не более того103.
Другой подход – который мне нравится больше – состоит в том, что одни только нейронные сети не могут выполнить всю работу. В значительной мере человеческий интеллект объясняется структурированием сетей на программы манипулирования символами. В частности, манипулирование символами лежит в основе языка и тех компонентов мышления, которые с ним взаимодействуют. Этим когнитивная способность не ограничивается, но это значительная ее часть. Это все, о чем мы можем рассуждать про себя и в разговоре с другими. Занимаясь психолингвистикой, я собрал множество доказательств того, что даже простейший навык, связанный с говорением на английском языке, – такой, как умение образовывать форму прошедшего времени от глагола (walked от walk, came от come) – с вычислительной точки зрения слишком сложен, чтобы его могла обслуживать одна нейронная сеть104. В этом разделе книги я представлю более общие доказательства. Требует ли содержание наших повседневных мыслей (информация, которой мы обмениваемся в разговоре) вычислительного устройства, предназначенного для реализации глубоко структурированного мыслекода, или с ним может справляться нейронная сеть общего назначения – то, что один остряк назвал «коннекто-плазмой»?105 Я покажу вам, что наши мысли отличаются тонким логическим структурированием, которое не под силу никакой сети однородных уровней, состоящей из узлов.
Зачем нам это, спросите вы? Затем, что эти доказательства ставят под сомнение наиболее авторитетную теорию устройства нашего мышления из когда-либо предложенных учеными. Сам по себе персептрон или сеть со скрытыми уровнями – это высокотехнологичное воплощение старой теории об ассоциации идей. Британские философы Джон Локк, Дэвид Юм, Джордж Беркли, Дэвид Хартли и Джон Стюарт Милль утверждали, что мысль подчиняется двум законам. Первый – закон смежности: между идеями, которые часто встречаются вместе, в мышлении образуются ассоциации. Впоследствии, когда активизируется одна идея, активизируется и вторая. Второй закон – это сходство: когда две идеи обладают сходством, все, что ассоциируется с первой идеей, автоматически начинает ассоциироваться со второй. Юм таким образом резюмировал суть этой теории в 1748 году:
Опыт лишь показывает нам ряд единообразных действий, производимых определенными объектами, и учит нас, что такие-то объекты в такое-то время обладали известными способностями и силами. Когда появляется новый объект, обладающий подобными чувственными качествами, мы ожидаем, что найдем в нем подобные же силы и способности, и ждем от него такого же действия. От тела одинакового с хлебом цвета и плотности мы ожидаем сходной же питательности и способности поддерживать организм106[12].
Ассоциацию по смежности и сходству считали тем самым писцом, который пишет на знаменитой «чистой доске» (так Локк метафорически называл мозг новорожденного). Теория, получившая название «ассоциационизм», веками играла доминирующую роль во взглядах британских и американских ученых на работу мышления, и в определенной степени доминирует и по сей день. Когда «идеи» заменили стимулы и реакции, ассоциационизм превратился в бихевиоризм. Чистая доска и два универсальных закона обучения являются психологической основой и стандартной социологической модели. Отзвуки этой теории мы слышим и в расхожих фразах о том, как наше воспитание заставляет нас «ассоциировать» еду с любовью, богатство со счастьем, рост с властью и т. д.
До недавнего времени ассоциационизм был слишком абстрактной теорией, чтобы быть проверенным на практике, однако модели нейронных сетей, которые сейчас ничего не стоит создать с помощью компьютера, позволяют сделать его идеи более точными. Схема обучения, в которой учитель дает сети вход и правильный выход, а сеть старается в будущем воспроизвести это соответствие, представляет собой очень хорошую модель закона смежности. Распределенная репрезентация входа, при которой концепт не получает собственного узла («попугай»), а представляется паттерном активности узлов, соответствующих его свойствам («покрытый перьями», «имеет крылья» и т. д.), позволяет добиться автоматического распространения на подобные концепты и, таким образом, прекрасно вписывается в закон об ассоциации по сходству. А если допустить, что все части мышления устроены как подобного рода сеть, то мы получим реализацию идеи чистой доски. Итак, коннекционизм открывает перед нами прекрасные возможности. Увидев, что могут и чего не могут делать модели нейронных сетей, мы можем подвергнуть серьезному испытанию многовековую доктрину ассоциации идей.
Прежде чем начать, необходимо сразу отмести несколько ложных аргументов. Коннекционизм – не альтернатива вычислительной теории сознания, а ее разновидность, которая утверждает, что основной вид обработки информации, выполняемый мозгом, – это многомерный статистический анализ. Коннекционизм не является необходимой коррективой теории о том, что мозг подобен серийному компьютеру с действующим быстро и безошибочно центральным процессором, – никто этого и не утверждает. В реальной жизни нет Ахилла, который заявлял бы, что всякая форма мышления заключается в прокручивании в голове тысячи правил из учебника по логике. Наконец, сети связей не являются особенно реалистичными моделями мозга, невзирая на приклеившееся к ним оптимистичное название «нейронные сети». К примеру, так называемый «синапс» (вес связи) может переходить из возбужденного состояния в заторможенное, а по «аксону» (соединению) информация может поступать в обоих направлениях. С анатомической точки зрения и то и другое невозможно. Когда стоит выбор между тем, чтобы поскорее решить задачу, и тем, чтобы как можно точнее воспроизвести работу мозга, коннекционисты нередко выбирают первое; это говорит о том, что сети используются как форма искусственного интеллекта, лишь косвенно основанная на сравнении с нейронами, и не являются формой моделирования нейронной активности. Вопрос в том, действительно ли они осуществляют такие вычисления, которые можно считать моделью человеческого мышления?
Грубая коннектоплазма не способна воспроизвести пять особенностей повседневного мышления. Эти особенности на первый взгляд кажутся малозаметными, о их существовании даже не подозревали до тех пор, пока логики, лингвисты и специалисты по информатике не начали разглядывать под микроскопом значение предложений. Тем не менее именно они дают человеческой мысли ее неповторимую точность и силу, являясь, как мне кажется, важным элементом ответа на вопрос «Как работает мышление?».
Первая особенность – это способность работать с индивидным объектом. Давайте вернемся к первому отличию нейронных сетей от их компьютероподобных моделей. Вместо того, чтобы символически представлять объект в виде произвольного шаблона из последовательности битов, мы представляли его в виде шаблона из узлов одного уровня, каждый из которых соответствовал одному из свойств объекта. Перед нами тут же встает проблема: мы уже не можем отличить друг от друга два отдельных объекта с идентичными свойствами. Они представлены совершенно одинаковым образом, и система не обращает внимания на то, что перед ней – не один и тот же кусок физической материи. Мы потеряли индивидуальность объекта: мы можем создать репрезентацию овоща или лошади как понятия, но не конкретного овоща и не конкретной лошади. Все, что система узнает об одной лошади, будет сливаться с тем, что она знает о другой лошади, идентичной первой. Естественного способа представить двух разных лошадей нет. Если увеличить активность узлов, представляющих свойства лошади, вдвое, это не поможет, потому что система может решить, что это двойная степень уверенности в том, что присутствуют свойства лошади или что свойства лошади присутствуют в двойной степени.
Легко спутать отношение между классом и подклассом (например, между классом «животное» и подклассом «лошадь», с которыми сеть легко справляется) с отношением между подклассом и отдельным объектом (например, подклассом «лошадь» и отдельной особью по кличке «Мистер Эд»). У этих двух примеров отношений, естественно, есть кое-что общее. В обоих случаях свойства высшего порядка передаются и объектам низшего порядка. Если животные дышат, а лошади – это животные, то лошади дышат. Если у лошадей есть копыта, а Мистер Эд – лошадь, то у Мистера Эда есть копыта. Следуя этой логике, разработчик может соблазниться тем, чтобы рассматривать индивидуализированный объект как очень-очень узкий подкласс, используя при этом некое едва заметное различие между этими двойниками – например, крапинку, которая присутствует у одного объекта и отсутствует у другого.
Как и многие постулаты коннекционизма, эта идея уходит корнями в британский ассоциационизм. Как писал Беркли, «уберите ощущение мягкости, влажности, красноты, кислоты и вы уберете вишню, потому что она не существует отдельно от ощущений. Вишня, заявляю я, не что иное, как множество ощущаемых чувствами впечатлений»107. Тем не менее предположение Беркли себя не оправдало. Можно иметь совершенно идентичные знания о свойствах двух объектов и при этом все равно знать, что они разные. Представьте комнату с двумя одинаковыми стульями. В комнату входит человек и меняет стулья местами. Осталась ли комната прежней или стала другой? Всем ясно, что комната изменилась. Но нам не известны признаки, которые бы отличали один стул от другого – кроме того, что можно говорить об одном из них как о стуле № 1, а о втором – как о стуле № 2. Мы снова вернулись к произвольным ярлыкам, присваиваемым слотам памяти, как в презренном цифровом компьютере! Та же идея лежит в основе шутки комика Стивена Райта: «Пока меня не было дома, кто-то вытащил все вещи из моей квартиры и заменил их точными копиями. Когда я сказал об этом соседу по комнате, он спросил: “Мы с вами знакомы?”»
Есть, правда, одна характеристика, позволяющая отличить один индивидный объект от другого: они не могут находиться в одном и том же месте одновременно. Вероятно, мозг способен запечатлеть в памяти время и место нахождения каждого объекта и постоянно обновлять эти координаты, что позволяет ему различать индивидные объекты с идентичными свойствами. Тем не менее даже это не объясняет нашу способность отделять индивидные объекты друг от друга в мысленном восприятии. Предположим, что перед нами бесконечная белая плоскость, на которой нет ничего кроме двух идентичных друг другу кругов. Один из них, двигаясь, постепенно находит на второй и остается поверх него в течение несколько секунд, а затем продолжает двигаться дальше. Думаю, ни у кого не возникнет затруднений в том, чтобы воспринимать круги как отдельные сущности даже в те моменты, когда они находятся в одном и том же месте в одно и то же время. Это доказывает, что нахождения в определенном месте в определенное время тоже недостаточно для нашего ментального определения «индивидного объекта»108.
Мораль из всего сказанного заключается не в том, что индивидные объекты нельзя представить в нейронной сети. Это довольно просто: нужно лишь выделить несколько узлов для установления тождества каждого индивидного объекта вне зависимости от свойств данного объекта. Можно присвоить каждому индивиду собственный узел, а можно присвоить каждому индивиду что-то вроде серийного номера, закодированного в форме паттерна из возбужденных узлов. Мораль в том, что сети, моделирующие мышление, должны быть сделаны таким образом, чтобы воплощать абстрактное логическое представление об отдельном объекте, аналогично роли, которую играет произвольно маркированная ячейка памяти компьютера. Единственное, что не получается, – это ассоциатор паттернов, ограниченный наблюдаемыми свойствами объекта, современная реализация аристотелевской сентенции «нет ничего в уме, чего бы не было прежде в чувствах».
Можно ли сказать, что все эти рассуждения – всего лишь казуистика? Вовсе нет: понятие индивидного объекта – это один из ключевых элементов нашей способности рассуждать о жизни. Позвольте привести два примера из реальной жизни, включающих в себя две грандиозные сферы человеческого взаимодействия: любовь и правосудие.
Монозиготные близнецы схожи в большей части своих характеристик. Они не только выглядят одинаково, но и думают, чувствуют и действуют схожим образом. Но не совершенно идентично, конечно; это и есть лазейка, с помощью которой можно попытаться представить их как очень узкие подклассы. Вместе с тем любое живое существо, представляющее их как подклассы, должно по крайней мере тяготеть к тому, чтобы воспринимать идентичных близнецов одинаково. Живое существо должно переносить свое мнение с одного близнеца на другого, по крайней мере, в вероятностном смысле или в какой-то мере; помните? это один из самых привлекательных моментов ассоциационизма и его воплощения в форме коннектоплазмы. Например, если что-то привлекает вас в одном из близнецов (то, как он ходит, говорит, выглядит и т. д.), оно должно привлекать вас и в другом. А это подразумевает, что идентичные близнецы должны вечно фигурировать в историях, замешанных на ревности и предательстве поистине готического масштаба. На деле же ничего подобного не происходит. Супруга одного из идентичных близнецов не испытывает романтического влечения к другому. Любовь привязывает нас к человеку как к данному человеку, а не как к типу людей – сколь бы малочисленным ни был этот тип людей109.
10 марта 1988 года кто-то откусил половину уха офицеру полиции Дэвиду Дж. Стортону. Ни у кого не было сомнений относительно того, кто это сделал: это был либо Шон Блик, молодой человек (21 год), живущий в Пало-Альто (Калифорния), либо Джонатан Блик, его идентичный близнец. Оба брата оказались вовлечены в потасовку с полицейским, и один из них откусил офицеру часть уха. Обоим братьям были предъявлены обвинения в нанесении увечья, попытке ограбления, нападении на офицера полиции и нанесении увечья при отягчающих обстоятельствах. Последнее правонарушение (укушенное ухо) карается пожизненным заключением. Офицер Стортон, давая показания, сообщил, что у одного из близнецов были длинные волосы, а у другого – короткие, и укусил его длинноволосый. К сожалению, через три дня, когда близнецы сдались полиции, у них были одинаковые короткие стрижки, и от дачи показаний они отказались. Их адвокаты утверждали, что ни одному из них нельзя назначить суровое наказание, предполагаемое обвинением в нанесении тяжкого увечья. В отношении каждого из братьев есть разумные основания для сомнения по поводу того, действительно ли преступление совершил он, потому что это вполне мог быть и второй брат. Аргумент представляется весомым потому, что наше чувство справедливости велит нам выбрать индивида, который совершил поступок, а не какие-либо характеристики этого индивида110.
Наша одержимость индивидуальностью человека – это не необъяснимая причуда; вероятно, она развилась у нас из-за того, что каждый человек, которого мы встречаем, независимо от каких-либо наблюдаемых его свойств, непременно имеет неповторимый багаж воспоминаний и желаний, что обусловлено уникальной эмбриологической и биографической историей. В главе 6, когда мы перейдем к обратному проектированию чувства справедливости и романтической любви, мы увидим, что в их основе – ментальный акт регистрирования отдельного индивида.
Люди – не единственный класс схожих между собой индивидуальных объектов, которые нам приходится различать; еще один пример из реальной жизни – игра в «угадайку» в животном мире. Многим животным приходится играть в «угадайку» и таким образом следить за местонахождением отдельных объектов. Один из примеров – мать, следящая за своим потомством, которое может выглядеть точно также, как все остальные детеныши этого вида, но при этом обладать ее генетическим набором. Другой пример – хищник, охотящийся на стадных животных, который отслеживает одного представителя стада, следуя стратегии игры в салочки: если ты водишь, то не переключайся с намеченной жертвы на другую; не давай отдохнуть никому, кроме себя. Когда кенийские зоологи, желая упростить сбор данных об антилопах гну, решили пометить краской рога усыпленных с помощью транквилизатора особей, они обнаружили, что, как бы они ни старались восстановить силы и энергию помеченного животного перед его возвращением в стадо, в первый же день или чуть позже его убивали гиены. Одно из возможных объяснений состоит в том, что цветная метка позволяет гиенам выделить именно эту антилопу и загнать ее до изнеможения. Одна из последних версий того, зачем нужны полоски зебрам, – не для того, чтобы сливаться с высокой травой (это объяснение всегда представлялось сомнительным), а для того, чтобы превратить стадо зебр в живые «наперстки», сбить с толку льва или другого хищника, который пытается сосредоточить внимание на одной особи. Конечно, мы не можем быть уверены, что у гиен или львов есть понятие индивидного объекта; может быть, им просто кажется более аппетитным животное, не похожее на собратьев по стаду. Тем не менее эти примеры хорошо иллюстрируют стоящую перед вычислительной техникой проблему отличия индивидных объектов от классов и акцентируют важность присущей человеку способности решать эту задачу111.
Вторая проблема ассоциационизма известна как композициональность: способность репрезентации состоять из частей и обладать значением, которое исходит из значений составляющих и из того, каким образом они соединяются между собой. Композициональность – типичная черта всех естественных языков. Значение предложения The baby ate the slug («Ребенок съел слизняка») можно вывести из значений слов baby, ate, the и slug и из их положения в предложении. Целое не является простой суммой компонентов: если мы переставим слова в предложении, получив The slug ate the baby («Слизняк съел ребенка»), оно будет выражать совсем другую идею. Поскольку вы не слышали раньше ни то предложение, ни другое, вы наверняка интерпретировали их, применив к последовательности слов совокупность алгоритмов (включающих в себя правила синтаксиса). Конечный продукт в каждом случае – это совершенно новая мысль, которую вы собрали на ходу. Имея в своем распоряжении такие концепты, как «ребенок», «слизняк» и «есть», плюс способность располагать соответствующие им символы на мысленной доске объявлений в соответствии со схемой, которую могут прочитать демоны, вы можете впервые в жизни получить именно такую мысль.
Журналисты говорят, что когда собака кусает человека, это не новость, а вот когда человек кусает собаку— это новость. Композициональность ментальных репрезентаций – вот что позволяет нам воспринимать новости. Мы готовы принять любые нелепые и удивительные новые идеи, какими бы невообразимыми они ни казались. Корова перепрыгнула через луну; Гринч украл Рождество; Вселенная началась с Большого Взрыва; пришельцы высадились в Гарварде; Майкл Джексон женился на дочери Элвиса Пресли. Благодаря математике комбинаторики у нас никогда не будет недостатка в новостях; в мире есть сотни миллионов триллионов мыслей, которые еще никогда и никому не приходили в голову.
Вы, вероятно, подумали, что композициональность легко воспроизвести в модели нейронной сети: просто включить узлы «ребенок», «есть» и «слизняк». Но если бы процессы, происходящие в нашем мозге, ограничивались этим, мы бы не могли знать наверняка, что произошло: ребенок съел слизняка, слизняк съел ребенка или ребенок и слизняк поели. Концепты должны быть привязаны к ролям (в логике их называют «аргументами»): кто является едоком, а кто съеденным.
Тогда, может быть, можно прикрепить отдельный узел к каждой комбинации концептов и ролей? У нас получится узел «ребенок-ест-слизняка» и узел «слизняк-ест-ребенка». Ведь в мозге огромное количество нейронов, скажете вы, почему бы не поступить так? Одна из причин, почему так поступить нельзя, – в том, что для этого нужно не просто огромное, а огромное-преогромное количество. Количество комбинаций растет пропорционально допустимому размеру, приводя к комбинаторному взрыву, в результате которого количество комбинаций превысит возможности мозга даже по самым оптимистичным оценкам. Легенда гласит, что визирь Сисса Бен Дахир попросил у короля Инди Ширхама скромную награду за изобретение шахмат. Он просил всего лишь положить на первую клетку шахматной доски одно зернышко пшеницы, на вторую – два зернышка пшеницы, на третью – четыре, и так далее. Они не успели даже дойти до последней, шестьдесят четвертой клетки, когда король обнаружил, что, сам того не зная, потратил все запасы зерна в королевстве. Награда составила четыре триллиона бушелей – это количество зерна, произведенного во всем мире за две тысячи лет. Точно так же комбинаторные способности мыслей могут легко превзойти количество нейронов в мозге. Сотню миллионов триллионов значений предложений нельзя впихнуть в мозг, в котором всего сто миллиардов нейронов, отводя для каждого значения собственный нейрон.
Впрочем, даже если бы это и было возможно, сложные мысли все равно не хранились бы в мозге в готовом виде, по одной на каждый нейрон. На это указывает то, что наши мысли связаны между собой. Представим, что у каждой мысли есть собственный узел. Тогда нужно было бы иметь отдельные узлы для случаев, когда ребенок съел слизняка, слизняк съел ребенка, курица съела слизняка, слизняк съел курицу, ребенок увидел слизняка, слизняк увидел ребенка, курица увидела слизняка и т. д. Отдельные узлы пришлось бы выделить для каждой из этих мыслей и для многих других мыслей; ведь любой человек, способный подумать о том, что ребенок увидел курицу, также способен подумать о том, что курица увидела ребенка. И все же в этом арсенале мыслеблоков есть кое-что подозрительное: в нем сплошь и рядом встречаются совпадения. То ребенок что-то увидел, то слизняк что-то увидел, то слизняк что-то съел, то ребенок что-то съел, и т. д. Мысли сами собой выстраиваются в ячейки, образующие ряды, колонны, уровни, гиперряды, гиперколонны и надуровни обширной матрицы. Но эта замечательная система может показаться сложной для понимания, только если допустить, что мысли – это очень большой набор отдельных узлов, а эти узлы – совокупность изолированных фактов, никак не связанных друг с другом. Когда природа представляет нашему вниманию объекты, идеально подходящие для заполнения такого прямоугольного модуля ячеек, она как бы подсказывает нам, что эти объекты наверняка состоят из меньших компонентов, соответствующих рядам и колоннам. Именно так периодическая система химических элементов привела к пониманию структуры атома. По аналогичным причинам мы можем сделать вывод, что канву всех наших мыслей составляют образующие их концепты. Мысли состоят из концептов; они не хранятся в мозге в готовом виде112.
Композициональность, как ни странно, представляет большие сложности для коннектоплазмы. Все напрашивающиеся для решения проблемы методы оказываются недостаточными. Предположим, что мы отвели по одному узлу для каждого сочетания одного концепта и одной роли. Допустим, один узел будет означать «ребенок ест», а другой – «слизняк съеден», или, допустим, один узел будет означать «ребенок выполняет действие», а другой – «слизняк является объектом действия». Это позволит значительно сократить число комбинаций – но лишь за счет новой неопределенности относительно того, кто совершил какое действие и над кем. Мысль «Ребенок съел курицу, когда пудель съел слизняка» будет невозможно отличить от мысли «Ребенок съел слизняка, когда пудель съел курицу». Проблема в том, что блок «ребенок ест» не содержит информации о том, что ребенок съел, а блок «слизняк съеден» не содержит информации о том, кто его съел.
Шагом в правильном направлении будет встроить в систему способность различать концепты (ребенок, слизняк и др.) и роли, которые они выполняют (деятель, объект действия и т. д.). Допустим, мы создадим отдельные фонды узлов – один для роли деятеля, а другой для роли объекта действия. Чтобы представить суждение, каждый фонд узлов дополняется шаблоном для выполняющего роль в данный момент концепта, поступающим из отдельного раздела памяти. Если бы мы соединили каждый узел с соседними узлами, мы бы получили автоассоциатор для суждений, способный немного работать с комбинаторными мыслями. Мы бы могли хранить в готовом виде суждение «ребенок съел слизняка»; в этом случае, получая любые два компонента в форме вопроса (скажем, «ребенок» и «слизняк» в форме вопроса «Каково отношение между ребенком и слизняком?»), система дополняла бы шаблон, включив узлы, соответствующие третьему компоненту (в данном случае «съел»).