Книга Как мы учимся. Почему мозг учится лучше, чем любая машина… пока - читать онлайн бесплатно, автор Станислас Деан+. Cтраница 2
bannerbanner
Вы не авторизовались
Войти
Зарегистрироваться
Как мы учимся. Почему мозг учится лучше, чем любая машина… пока
Как мы учимся. Почему мозг учится лучше, чем любая машина… пока
Добавить В библиотекуАвторизуйтесь, чтобы добавить
Оценить:

Рейтинг: 0

Добавить отзывДобавить цитату

Как мы учимся. Почему мозг учится лучше, чем любая машина… пока

Вместе с тем человеческому мозгу свойственны индивидуальные вариации. В крайних случаях они могут носить патологический характер. В настоящее время реальность таких нарушений развития, как дислексия, дискалькулия, диспраксия и расстройства внимания, уже не вызывает сомнений. К счастью, благодаря лучшему пониманию архитектуры, порождающей данные отклонения, мы обнаружили, что существуют простые стратегии их диагностики и компенсации. Посему одной из целей данной книги я вижу распространение этих научных знаний с тем, чтобы каждый учитель и каждый родитель мог выбрать оптимальную тактику обучения. Хотя дети сильно отличаются друг от друга по содержанию своих знаний, все они пользуются одними и теми же алгоритмами научения. Следовательно, педагогические приемы, успешно внедряемые в работе со всеми детьми, будут эффективны и для детей с нарушениями обучаемости – только применять их следует с большим вниманием, терпением, систематичностью и толерантностью к ошибкам.

Последнее особенно важно: хотя обратная связь по ошибкам необходима, многие дети со временем не только теряют уверенность в себе, но и утрачивают всякое любопытство. Проблема в том, что их зачастую наказывают за ошибки, а не помогают исправиться. В школах по всему миру обратная связь синонимична наказанию и стигматизации (в одной из глав мы подробно поговорим о том, какую роль играют в этой путанице школьные отметки). Отрицательные эмоции снижают учебный потенциал мозга, в то время как безопасная среда, не вызывающая чувства страха, наоборот, содействует восстановлению нейропластичности. Любой прогресс в образовании возможен только в том случае, если мы одновременно учитываем и эмоциональные, и познавательные аспекты нашего мозга – в современной когнитивной нейронауке оба считаются ключевыми элементами успешного научения.

Человек и машина

Сегодня перед человеческим интеллектом встает новая проблема: с недавних пор мы больше не являемся единственными чемпионами по способности учиться. Во всех областях знаний алгоритмы машинного обучения бросают вызов уникальному статусу нашего вида. Благодаря им современные смартфоны умеют распознавать лица и голоса, транскрибировать речь, переводить с одного языка на другой, управлять различными устройствами и даже играть в шахматы или го намного лучше, чем мы. Машинное обучение превратилось в многомиллиардную индустрию, черпающую вдохновение из организации и функционирования нашей собственной нервной системы. Но как работают эти искусственные алгоритмы? Помогут ли их принципы понять, что такое научение? Способны ли они уже сейчас имитировать работу живого мозга или им еще предстоит пройти долгий путь?

Хотя последние достижения в области информационных технологий завораживают, их ограничения очевидны. Классические алгоритмы глубокого обучения копируют лишь малую часть функционирования нашего мозга. По моему убеждению, эта часть соответствует первым стадиям сенсорной обработки, первым двумстам или тремстам миллисекундам, в течение которых наш мозг работает бессознательно. Данный тип обработки никоим образом не следует считать поверхностным: за долю секунды человеческий мозг может распознать лицо или слово, поместить его в контекст, понять и даже интегрировать в небольшое предложение… Проблема в том, что это сугубо восходящий процесс, не предполагающий каких-либо серьезных размышлений. Только на последующих стадиях обработки информации – более медленных и сознательных – наш мозг задействует все свои способности к рассуждению, умозаключению и анализу. Как с точки зрения логики, так и с точки зрения гибкости живой мозг значительно превосходит все современные машины. Даже самые продвинутые компьютерные архитектуры и те уступают человеческому младенцу в способности создавать абстрактные модели мира.

Даже в пределах своей основной специализации – например, в области быстрого распознавания форм – существующие алгоритмы гораздо менее эффективны, чем наш мозг. Современные компьютеры требуют миллионов, если не миллиардов, обучающих попыток. В самом деле, машинное обучение стало чуть ли не синонимом больших данных: в отсутствие гигантских объемов информации алгоритмы практически не способны извлечь абстрактные знания, которые можно перенести на новые ситуации. Другими словами, они не используют данные оптимальным образом.

В этом состязании младенческий мозг одерживает победу без труда: чтобы выучить новое слово, малышам достаточно одного или двух повторений. Их мозг выжимает максимум из минимума данных – умение, которое по-прежнему ускользает от компьютеров. Нейрональные алгоритмы научения умудряются извлечь суть из малейшего наблюдения. Если ученые желают добиться такой же производительности в машинах, им следует черпать вдохновение из механизмов, которые интегрировала в наш мозг сама эволюция. Это может быть внимание, которое позволяет нам отбирать информацию и усиливать релевантные сигналы, или, например, сон – алгоритм, посредством которого наш мозг синтезирует усвоенное в течение дня. Новые машины с такими свойствами уже появились, и их производительность неуклонно растет – в ближайшем будущем они, безусловно, составят серьезную конкуренцию нашему мозгу.

Согласно одной из новых теорий, причина, по которой человеческий мозг до сих пор превосходит машины, заключается в том, что он действует, как ученый-статистик. Постоянно вычисляя вероятности, он оптимизирует свою способность к научению. Судя по всему, в процессе эволюции наш мозг приобрел сложные алгоритмы, которые беспрерывно оценивают его знания и сопряженную с ними неуверенность (неопределенность). Такое систематическое внимание к вероятностям является в математическом смысле наилучшим способом в полной мере использовать каждую единицу инфор- мации4.

Недавние эксперименты подтверждают эту гипотезу. Даже младенцы понимают вероятности: по всей видимости, они с рождения встроены в их нейронные сети. Дети ведут себя как маленькие ученые: их мозг изобилует гипотезами, которые напоминают научные теории и проверяются на опыте. Способность оперировать вероятностями, по большей части бессознательно, вписана в саму логику нашего научения. Она позволяет любому из нас постепенно отвергать ложные гипотезы и сохранять только те теории, которые согласуются с данными. В отличие от других видов животных люди используют это чувство вероятностей для построения научных теорий о внешнем мире. Только мы – представители Homo sapiens – систематически генерируем абстрактные символические мысли и регулярно оцениваем их правдоподобие на основе новых наблюдений.

Инновационные компьютерные алгоритмы, учитывающие этот новый подход к научению, называются «байесовскими» – в честь преподобного Томаса Байеса (1702–1761), который сформулировал отдельные элементы этой теории еще в XVIII веке. Я предполагаю, что байесовские алгоритмы произведут настоящую революцию в машинном обучении: уже сегодня они способны извлекать абстрактную информацию не хуже любого ученого.

Наше путешествие в современную науку о научении состоит из трех частей.

Первая часть под названием «Что такое научение?» начинается с определения того, что значит для человека или животного – и для любого алгоритма или машины – учиться новому. Идея проста: учиться – значит последовательно формировать как в искусственных, так и в естественных нейронных сетях внутреннюю модель внешнего мира. Гуляя по незнакомому городу, я составляю его мысленную карту – миниатюрную модель улиц и переулков. Точно так же ребенок, который учится кататься на велосипеде, формирует подсознательную симуляцию того, как движения ног, нажимающих на педали, и рук, поворачивающих руль, влияют на устойчивость велосипеда. Аналогичным образом компьютерный алгоритм, который учится распознавать лица, собирает шаблонные модели возможных форм глаз, носов, ртов и их комбинаций.

Но как мы создаем правильную ментальную модель? Как мы увидим далее, ум учащегося можно уподобить гигантской машине с миллионами регулируемых параметров; настройки этих параметров в совокупности и определяют то, чему мы научились (например, где скорее всего будут находиться улицы на нашей ментальной карте окрестностей).

В головном мозге параметры – это синапсы, связи между нейронами, сила которых варьируется; в большинстве современных компьютеров параметры – это регулируемые веса или вероятности, определяющие силу каждой приемлемой гипотезы. Таким образом, научение – как в мозге, так и в машинах – требует поиска оптимального сочетания параметров, которые вместе определяют ментальную модель во всех ее подробностях. В этом смысле научение – проблема поиска; чтобы лучше понять, как научение работает в человеческом мозге, необходимо изучить, как алгоритмы обучения работают в современных компьютерах.

Сравнивая компьютерные алгоритмы с алгоритмами мозга in silico[5] и in vivo[6], мы постепенно получим более четкое представление о том, что означает научение на уровне мозга. Конечно, математикам и специалистам в области вычислительных систем не удалось разработать алгоритмы обучения, столь же мощные, как человеческий мозг, – пока. Тем не менее они все больше склоняются к теории оптимального алгоритма обучения, который должна использовать любая система, если она стремится к максимальной эффективности. Согласно этой теории, лучший ученик действует, как ученый, рационально использующий вероятности и статистику. Возникает новая модель: модель мозга как статистика, при которой корковые области мозга обрабатывают данные о вероятностях событий. Данная теория подчеркивает четкое разделение труда между наследственностью и средой: гены создают обширные пространства априорных гипотез, из которых впоследствии среда выбирает те, которые наилучшим образом описывают внешний мир. Иными словами, набор гипотез задан генетически, но их отбор зависит от опыта.

Согласуется ли эта теория с тем, как на самом деле работает мозг? И как научение реализуется в биологических нейронных сетях? Какие изменения происходят в нашем мозге, когда мы приобретаем новую компетенцию? Во второй части книги, «Как учится наш мозг», мы обратимся к психологии и нейробиологии. Особое внимание будет уделено младенцам – подлинным и непревзойденным самообучающимся машинам. Согласно новейшим исследованиям, они действительно ведут себя как юные специалисты по статистике. Их поразительная интуиция в сферах языка, геометрии, чисел и статистики подтверждает: младенцы могут быть чем угодно, но только не «чистым листом», tabula rasa[7]. При рождении детский мозг уже организован, он проецирует гипотезы на внешний мир с самого первого дня. Кроме того, дети обладают значительным запасом пластичности, которая отражается в беспрерывных изменениях синапсов. В пределах этой статистической машины наследственность и среда не противостоят друг другу – напротив, они действуют сообща. Результатом является структурированная, но пластичная система с уникальной способностью к самовосстановлению после травм и переориентации уже существующих нейронных сетей на овладение навыками, не предусмотренными эволюцией, – например, чтением или математикой.

В третьей части книги, «Четыре столпа научения», я подробно расскажу о некоторых хитростях, которые делают наш мозг самым эффективным самообучающимся устройством, известным на сегодняшний день. В значительной степени нашу способность к научению модулируют четыре основных механизма. Первый – это внимание, система нейронных сетей, которые отбирают, усиливают и передают сигналы, считающиеся нами релевантными, тем самым усиливая их воздействие в нашей памяти в сто раз. Второй столп – активное вовлечение: пассивный организм почти ничему не научится, ибо научение требует активного генерирования гипотез, мотивации и любопытства. Третий столп – обратная связь: всякий раз, когда реальность не совпадает с нашими ожиданиями, в нашем мозге распространяются сигналы ошибки. Они корректируют имеющиеся ментальные модели, исключают непригодные гипотезы и стабилизируют наиболее точные. Наконец, четвертый столп – это консолидация: периодически наш мозг компилирует (собирает воедино) то, что он усвоил, и переносит это в долговременную память, тем самым высвобождая нейронные ресурсы для дальнейшего научения. Важную роль в этом процессе консолидации играет повторение. Мозг активен даже во сне; во время сна он в ускоренном темпе воспроизводит свои прошлые состояния и перекодирует знания, приобретенные в течение дня.

Эти четыре столпа универсальны: младенцы, дети и взрослые всех возрастов используют их каждый раз, когда задействуют свою способность к научению. Вот почему все мы должны научиться владеть ими – именно так мы сможем научиться учиться. В заключении мы обсудим практические последствия этих научных открытий. Изменить наши подходы к научению и обучению в школе, дома или на работе вовсе не так сложно, как кажется. Простые рекомендации касательно игр, любознательности, социализации, концентрации и сна помогут еще больше развить то, что и так является величайшим талантом нашего мозга, – способность учиться.

Часть I

Что такое научение?

По сути, интеллект можно рассматривать как процесс преобразования неструктурированной информации в полезные и актуальные знания.

Демис Хассабис, исследователь искусственного интеллекта, основатель компании DeepMind (2017)

Что такое научение? Во многих языках это слово имеет тот же корень, что и латинский глагол apprehendere («схватывать»): apprehending в английском, apprendre во французском, aprender в испанском и португальском. И действительно, научиться – значит уловить некий фрагмент реальности и перенести его в мозг. В когнитивных науках принято считать, что научение состоит в формировании внутренней модели мира. В процессе научения первичные данные, которые улавливают наши органы чувств, превращаются в более или менее абстрактные идеи, пригодные для повторного использования в новом контексте, – малые модели реальности.

Ниже мы узнаем, что обо всем этом говорит когнитивистика и наука об искусственном интеллекте. Как возникают такие внутренние модели в мозге и машинах? Как меняется репрезентация (представление) информации, когда мы учимся? Что происходит на уровне, общем для любого организма – будь то человек, животное или компьютер? Обсудив различные инженерные хитрости, позволяющие машинам учиться, мы получим более четкое представление о той невероятной работе, которую проделывает мозг всякого ребенка, когда он учится видеть, говорить и писать. Как ни странно, детский мозг сохраняет преимущество: несмотря на все технические и научные достижения, современные алгоритмы машинного обучения копируют лишь малую часть способностей человеческого мозга. Разобравшись, где заканчивается машинное обучение и в чем мозг ребенка превосходит даже самый мощный компьютер, мы точно определим, что значит «научение».

Глава 1

Семь определений научения

Что значит «научение»? Мое первое и самое общее определение таково: научиться – значит сформировать внутреннюю модель внешнего мира.

Вы можете этого не осознавать, но ваш мозг хранит тысячи таких моделей. Образно говоря, они похожи на миниатюрные муляжи, более или менее точно повторяющие реальность. Например, у всех нас есть ментальная карта района и дома, в котором мы живем, – достаточно закрыть глаза и мысленно представить их в мельчайших подробностях. Разумеется, никто из нас не родился с этой картой – мы приобрели ее посредством научения.

Богатство и разнообразие наших ментальных моделей, по большей части бессознательных, поражает воображение. Так, у любого англоговорящего читателя имеется обширная ментальная модель английского языка; благодаря ей он понимает слова, которые сейчас читает, и может догадаться, что слово plastovski – не английское, слова swoon и wistful – точно английские, а слово dragostan – возможно[8]. Помимо языковой модели, мозг содержит и несколько моделей тела, которые он постоянно использует для коррекции положения конечностей при движении и для поддержания равновесия. Другие ментальные модели кодируют наши знания о физических объектах и взаимодействии с ними: вы знаете, как держать ручку, писать или ездить на велосипеде. Третьи описывают близких нам людей: у каждого человека имеется огромный ментальный каталог его родственников и знакомых, в котором задокументированы их внешность, голоса, вкусы и причуды.

Эти ментальные модели способны генерировать гиперреалистичные симуляции окружающей нас вселенной. Вы замечали, что иногда ваш мозг устраивает самые настоящие виртуальные реалити-шоу, в которых вы ходите, танцуете, посещаете новые места, ведете интересные беседы или испытываете сильные эмоции? Конечно, я говорю о снах! Кажется невероятным, но все мысли, которые приходят к нам в сновидениях, есть не что иное, как продукт неконтролируемой работы внутренних моделей мира.

Впрочем, мы «изобретаем» реальность не только во сне: бодрствуя, наш мозг постоянно проецирует гипотезы и интерпретативные системы на внешний мир. Это происходит потому, что каждое изображение, попадающее на сетчатку глаза, неоднозначно. Например, всякий раз, когда мы видим тарелку, ее изображение подобно бесконечному количеству эллипсов. Почему же мы видим тарелку круглой, хотя органы чувств говорят нам, что она овальная? Все дело в дополнительных данных, которые поставляет наш мозг: он знает, что круглая форма – наиболее вероятная интерпретация. За кулисами сенсорные области непрерывно вычисляют вероятности, и в сознание попадает только наиболее вероятная модель. Именно проекции мозга в конечном счете придают смысл потоку данных, поступающему от органов чувств. В отсутствие внутренних моделей необработанные сенсорные данные остались бы бессмысленными.

В процессе научения наш мозг захватывает фрагмент реальности, который он ранее упустил, и использует его для построения новой модели мира. Такие модели могут отражать как внешнюю реальность, так и внутреннюю: первые формируются, когда мы изучаем историю, ботанику или карту города; вторые – когда мы учимся координировать движения во время игры на скрипке. В обоих случаях мозг интернализирует (т.е. встраивает внутрь) некий новый аспект реальности: фактически, чтобы усвоить неизвестный материал, он соответствующим образом перенастраивает свои нейронные сети.

Такие изменения, безусловно, не совершаются наугад. Научение – это прежде всего способность приспосабливаться к внешнему миру и способность исправлять ошибки. Но откуда мозг «знает», как обновить внутреннюю модель, если, скажем, он заблудился и не может найти свой дом, упал с велосипеда, проиграл партию в шахматы или неправильно написал слово «экстаз»? Рассмотрим семь ключевых идей, которые лежат в основе современных алгоритмов машинного обучения и которые применимы и к человеческому мозгу, – семь различных определений того, что значит «научение».

Научение – это регулировка параметров ментальной модели

Иногда корректировка ментальной модели не представляет сложностей. Вообразите, что вы видите некий предмет и протягиваете к нему руку. Что происходит? Еще в XVII веке Рене Декарт (1596–1650) предположил, что наша нервная система должна содержать особые нейронные сети, преобразующие зрительные сигналы в мышечные команды (см. рисунок ниже). Вы можете убедиться в этом сами: попробуйте схватить предмет, надев очки другого человека, желательно близорукого. Еще лучше, если вам удастся раздобыть призматические очки, смещающие видимое изображение на дюжину градусов влево5. Естественно, первая попытка закончится провалом: из-за призм вы протянете руку не в сторону самого предмета, а гораздо правее. Путем последовательных проб и ошибок вы скорректируете свои движения и впредь будете брать левее. С каждым разом ваши движения будут все более и более точными – это ваш мозг учится компенсировать смещение. Но если снять очки и попробовать снова, вы с удивлением обнаружите, что ваша рука тянется не туда. Вы взяли слишком далеко в левую сторону!



Что такое научение? Учиться – значит корректировать параметры внутренней модели. Например, чтобы научиться указывать на предмет пальцем, необходимо устранить смещение видимого изображения: каждая ошибка несет в себе полезную информацию, позволяющую сократить разрыв. В искусственных нейронных сетях применяется та же логика, хотя число возможных регулировок значительно больше. Распознавание рукописного знака требует тонкой настройки миллионов связей. Опять же, каждая ошибка – в данном случае это неверный выходной сигнал «8» – может быть использована для корректировки параметров соединений, что позволяет улучшить производительность в следующем испытании.


Что же произошло? Всего за несколько минут ваш мозг скорректировал внутреннюю модель зрения. Параметр этой модели, отвечающий за несоответствие между видимым изображением и положением вашего тела, был установлен на новое значение. Во время процесса корректировки методом проб и ошибок ваш мозг делает то, что делает всякий охотник, регулирующий оптический прицел своего ружья: он совершает пробный выстрел и на основании результатов сдвигает видоискатель в нужном направлении. Данный тип научения протекает быстро: достаточно нескольких попыток, чтобы компенсировать смещение видимых объектов. Однако новые параметры несовместимы со старыми – отсюда систематическая ошибка, которая возникает всякий раз, когда мы снимаем призмы и возвращаемся к нормальному зрению.

Бесспорно, данный вид научения является весьма специфичным, поскольку требует корректировки только одного параметра (угла обзора). Обычно научение носит гораздо более сложный характер и предполагает регулировку десятков, сотен и даже тысяч миллионов параметров (каждого синапса в соответствующей сети нейронов). Тем не менее сам принцип остается неизменным: все сводится к поиску тех настроек внутренней модели, которые наилучшим образом отвечают состоянию внешнего мира.

Представим младенца, который недавно родился в Токио. В течение следующих двух-трех лет его внутренняя речевая модель должна будет адаптироваться к особенностям именно японского языка. Мозг этого малыша подобен машине с миллионами настроек на каждом уровне. Некоторые из этих настроек – например, на слуховом уровне – определяют, какой набор согласных и гласных используется в японском языке и какие правила позволяют их комбинировать. Ребенку, родившемуся в японской семье, предстоит узнать, какие фонемы составляют японские слова и где следует проводить границы между звуками. Один из параметров, в частности, касается различий между звуками [р] и [л]. Во многих языках между ними существует разительный контраст, но только не в японском: японцы не видят разницы между «ложей» и «рожей». Следовательно, каждый ребенок обязан отрегулировать целый набор параметров, которые в совокупности определяют, какие категории речевых звуков релевантны для его родного языка.

Похожая процедура научения повторяется на каждом уровне – от звуковых паттернов до лексики, грамматики и смыслового содержания. Мозг организован в виде иерархии моделей реальности, вложенных одна в другую наподобие матрешки. Учиться – значит использовать поступающие данные для корректировки параметров на каждом уровне этой иерархии. Рассмотрим пример высокого уровня: усвоение грамматических правил. Еще одна ключевая особенность японского языка заключается в порядке слов. В каноническом предложении с подлежащим, сказуемым и дополнением сначала идет подлежащее, затем сказуемое и, наконец, дополнение: «Джон + ест + яблоко». В японском языке, наоборот, сначала стоит подлежащее, затем дополнение – и только потом глагол: «Джон + яблоко + ест»[9]. Примечательно, что тот же порядок характерен для предлогов (которые фактически становятся послелогами), притяжательных местоимений и многих других частей речи. Например, безобидная фраза «Мой дядя мечтает работать в Бостоне» превращается в изречение, достойное Йоды из «Звездных войн»: «Дядя мой Бостоне в работать мечтает».

Любопытно, но все эти инверсии имеют нечто общее. Лингвисты считают, что они обусловлены одним-единственным параметром – так называемой «позицией вершины». В английском, русском и других языках определяющее слово конструкции – ее вершина – обычно стоит на первом месте (в Париже, мой дядя, хочет жить), а в японском – на последнем (Париже в, дядя мой, жить хочет). Этот бинарный параметр отличает многие языки, даже те, которые не связаны исторически (язык навахо, например, подчиняется тем же правилам, что и японский). Таким образом, чтобы овладеть родным языком – скажем, английским или японским, – ребенок должен соответствующим образом настроить параметр «позиция вершины» в своей внутренней языковой модели («до» или «после»).

Научение – это использование комбинаторного взрыва