Яна Хлюстова
Поймать вавилонскую рыбку: Человеческий мозг, нейронные сети и изучение иностранных языков
Научный редактор: Елизавета Носова
Редактор: Анна Щелкунова
Издатель: Павел Подкосов
Руководитель проекта: Александра Шувалова
Ассистент редакции: Мария Короченская
Художественное оформление и макет: Юрий Буга
Корректоры: Елена Рудницкая, Елена Сметанникова
Верстка: Андрей Ларионов
Все права защищены. Данная электронная книга предназначена исключительно для частного использования в личных (некоммерческих) целях. Электронная книга, ее части, фрагменты и элементы, включая текст, изображения и иное, не подлежат копированию и любому другому использованию без разрешения правообладателя. В частности, запрещено такое использование, в результате которого электронная книга, ее часть, фрагмент или элемент станут доступными ограниченному или неопределенному кругу лиц, в том числе посредством сети интернет, независимо от того, будет предоставляться доступ за плату или безвозмездно.
Копирование, воспроизведение и иное использование электронной книги, ее частей, фрагментов и элементов, выходящее за пределы частного использования в личных (некоммерческих) целях, без согласия правообладателя является незаконным и влечет уголовную, административную и гражданскую ответственность.
© Хлюстова Я., 2024
© ООО «Альпина нон-фикшн», 2024
* * *Введение
Искусственный интеллект все глубже проникает в нашу жизнь, вписываясь в нее настолько органично, что мы порой даже не задумываемся об этом. Например, ставшие привычными нам «умные» колонки и часы, голосовые помощники в смартфонах, навигаторы, системы рекомендации фильмов и сериалов в киносервисах – все это основано на искусственном интеллекте. Технология может решать и гораздо более серьезные задачи. Так, основанные на искусственном интеллекте программы по анализу снимков помогают врачам ставить диагнозы. Специалисты из Гарвардского университета научили компьютер выполнять необходимые для прогнозирования землетрясений расчеты. Причем делает он это примерно в 500 раз быстрее человека, работающего с обычным программным обеспечением, – значит, у жителей опасных районов будет намного больше времени на эвакуацию. Благодаря искусственному интеллекту время, в течение которого пилоты управляют самолетом в ручном режиме, измеряется минутами, а не часами. Беспилотные автомобили уже ездят по улицам некоторых городов мира. Нейросети пишут музыку и создают картины.
Но что вообще мы называем искусственным интеллектом? Умение компьютера думать? Если так, то сможет ли он заменить или превзойти человека в творческих сферах? Как тогда изменится наша жизнь?
Эти вопросы волнуют людей не одно десятилетие, и я не дам на них исчерпывающего ответа – думаю, для этого понадобится слишком много страниц. Мы посмотрим на искусственный интеллект применительно всего лишь к единственной сфере – переводу письменной и устной речи.
Итак, сократим список вопросов до одного: заменит ли компьютер переводчика? Чтобы найти ответ, сначала мы разберемся в том, как вообще люди (и животные) осваивают языки, узнаем, где они «хранятся» и как работает мозг синхронного переводчика. А потом поговорим про искусственный интеллект – затронем историю разработки систем машинного перевода и поймем, на каком этапе развития эти системы находятся сейчас. И конечно, дадим слово переводчикам, лингвистам и специалистам по машинному обучению – они расскажут о том, каково, на их взгляд, будущее перевода.
Лично я думаю, что по крайней мере до конца века компьютеры не заменят людей в этой сфере. Не исключаю, что я излишне оптимистична (или пессимистична – как посмотреть), но мне нравится думать, что изучать разные языки и говорить на них – это уникальный навык, присущий только человеку. Не отрицаю, что мое отношение к этой теме предвзято: благодаря родителям я начала учить английский язык в три года. К концу школы свободно владела английским и французским. В университете моей специальностью был китайский язык: за четыре года мы прошли длинный путь от освоения тонового произношения и прописей (в китайском они необходимы, поверьте) до синхронного перевода отрывков из выступлений китайских политиков и биржевых сводок. (Работать с китайским я, правда, так и не начала, поняв на втором курсе, что ни эта специальность, ни регион меня не привлекают.) Потом я начала учить немецкий и испанский – просто так, потому что хотелось. Сегодня последним в этом списке стоит карельский (да, это не опечатка: недавно я начала учить собственно-карельское наречие, одно из трех основных наречий карельского языка).
Так что сейчас я с разной степенью уверенности могу говорить на шести языках, не считая родного русского. Для работы мне постоянно пригождается только английский, еще я преподаю французский, испанский и русский как иностранный, но в целом весь мой языковой арсенал приобретался не для каких-то определенных практических целей. Я учу языки, потому что они помогают мне чувствовать себя комфортно во многих странах мира. Мне нравится читать книги, видя оригинальную игру слов и понимая оттенки эмоций автора. Я люблю сравнивать языки: находить фразеологизмы с общей структурой, проводить параллели между грамматическими конструкциями, видеть различия в том, как люди из разных стран говорят об одних и тех же вещах.
Но представьте на минуту: что, если в один прекрасный день все эти знания и навыки станут ненужными? Если появятся программы для перевода текстов – не привычные нам, встроенные в браузер и делающие смешные ошибки, а настолько качественные, что они смогут переводить художественные книги и стихи не только без потери смысла, но и с сохранением красоты авторского слога? Если станет возможным купить устройство, которое будет не хуже профессионального синхрониста переводить устную речь? Перестанем ли мы тогда нуждаться в переводчиках, пропадет ли целый пласт профессий, связанных с адаптацией лингвистических реалий носителей одного языка для носителей другого?
В книге я попробовала ответить на эти вопросы, и думаю, что у меня получилось. Но мне трудно было бы справиться без помощи тех людей, которые поделились со мной своими знаниями и опытом. Я хочу поблагодарить:
● полиглотов Викторию, Кристину, Анастасию, Евгению и Максима;
● переводчиков и экспертов по межкультурной коммуникации Кристину Роппельт, Викторию Волошину, Марию Кленницкую, Риту Ключак;
● переводчиков и специалистов по машинному переводу Руслана Мурашкина и Дениса Лазука;
● профессора Женевского и Венского университетов, руководителя исследовательского центра «Лаборатория по изучению мозга и языка» (Brain and Language Lab) Нэрли Голестани;
● научного журналиста и специалиста по нейронаукам, главного редактора портала Neuronovosti.ru Алексея Паевского;
● научного редактора книги Елизавету Носову – специалиста по компьютерной лингвистике, занимающуюся обучением и внедрением моделей для обработки естественного языка;
● друга и коллегу Николая Подорванюка, из дискуссии с которым родилась идея этой книги;
● моего мужа Алексея Шередегу, ставшего первым читателем и критиком книги, а также моих родителей Светлану и Игоря Хлюстовых за поддержку во всех начинаниях.
ГЛАВА 1
Что такое язык?
Начнем разговор с совсем, казалось бы, простого вопроса: что такое язык? Базовое и очень короткое определение может звучать так: это инструмент коммуникации, который мы используем, чтобы обмениваться информацией.
Такое определение, однако, в свою очередь вызовет множество вопросов и замечаний, и первое из них будет таким: но ведь информацией обмениваются не только люди. Мы прекрасно знаем, что животные постоянно взаимодействуют между собой. Они координируют свои действия (например, птицы, стаей летящие на юг, или косатки во время охоты на тюленей) и передают важную информацию (пчелы, обнаружившие нектар, сообщают об этом другим обитателям улья, исполняя специальный танец). А что насчет наших домашних питомцев? Любой владелец собаки знает, как красноречиво пес может заявить о своем желании пойти на прогулку или получить внеочередную порцию угощения. Значит ли это, что язык не привилегия людей?
«Говорящие» обезьяны
Обезьяны максимально похожи на человека, поэтому логично, что именно они стали основными участниками экспериментов по обучению животных языку. Особенности строения голосовых связок, гортани и челюсти не позволяют обезьянам управлять своим голосом так же, как это делаем мы, и произносить те же звуки. Впрочем, эксперименты по обучению обезьян говорению все же проводились. Так, например, шимпанзе Вики за несколько лет научилась произносить четыре английских слова: mama (мама), papa (папа), cup (чашка), up (вверх). И это самые значительные достижения, потому что остальные участники таких опытов (шимпанзе Джонни, Рената и Кокомо) могли выговорить лишь слово mama. После этих неудачных экспериментов ученые сконцентрировались на обучении животных американскому жестовому языку – амслену. Его используют глухие люди в США, некоторых частях Канады, ряде стран Западной Африки и Юго-Восточной Азии. Каковы же были результаты?
Горилла КокоНаверное, одной из самых известных в мире обезьян, говорящих на амслене, стала горилла Коко. Она родилась в 1971 году в зоопарке Сан-Франциско и прожила бóльшую часть жизни на западе Калифорнии, в заповеднике Санта-Круз.
Приматолог Франсин Паттерсон начала обучение Коко жестовому языку, когда той был один год. Через две недели горилла научилась использовать жесты, чтобы говорить о еде и напитках. Организаторы эксперимента утверждают, что через 40 лет словарный запас Коко составлял более тысячи слов – согласно исследованиям, примерно таким же лексиконом владеют трехлетние дети. Паттерсон также сообщала, что вдобавок к этому Коко понимала на слух около 2000 слов на английском языке.
Горилла была в состоянии не просто уведомить сотрудников заповедника о своих базовых потребностях или поддерживать с ними разговор на простые темы. Паттерсон рассказывает, что однажды Коко показали скелет и спросили, живой это объект или мертвый. Горилла ответила: «Мертвый». Потом ее спросили: «Куда попадают животные после смерти?» На это Коко, продемонстрировав прощальный поцелуй, ответила: «В удобную нору».
Паттерсон поясняет, что к этому моменту горилла была знакома с концепцией смерти: на прогулках смотрители заповедника обращали ее внимание на погибших птиц и мелких зверьков, которые иногда встречались на дороге. В понимании того, что такое смерть, Коко не была уникальной. Ученые отмечают, что гориллы в зоопарках иногда хоронят мертвых животных.
Коко обладала способностью самостоятельно расширять свой словарный запас: так, однажды она сконструировала слово «кольцо» при помощи комбинации жестов, обозначающих «палец» и «браслет». На Рождество горилла попросила подарить ей котенка (Коко понимала, что такое праздники, и с нетерпением ждала дня рождения и подарков). Получив игрушечного кота, Коко расстроилась и продолжала сообщать о своем желании сотрудникам заповедника. В конце концов ей разрешили завести настоящего котенка, которого она очень любила, пытаясь заботиться о нем так же, как о собственном детеныше. Не обходилось и без забавных случаев: однажды Коко разозлилась и в приступе гнева вырвала из стены своей комнаты умывальник. Когда смотритель спросил, зачем она это сделала, горилла попыталась свалить вину на кота, сказав жестами, что это натворил он.
К несчастью, жизнь кота оборвалась трагически: он сбежал из вольера и попал под машину. Коко очень расстраивалась и скучала по нему, и сотрудники заповедника разрешили завести ей новых любимцев – двух котов, которых горилла назвала Липс (Lips) и Смоуки (Smoky).
Шимпанзе УошоВпрочем, пальма первенства в освоении амслена принадлежит не всемирно известной Коко (которая дважды появлялась на обложке журнала National Geographic). Первопроходцем стала шимпанзе Уошо. В 1967 году, когда ей было около двух лет, американские зоологи Аллен и Беатрис Гарднер начали учить ее жестовому языку, причем делали это максимально естественным образом. Они обращались с Уошо почти как с ребенком: обезьяна часто носила одежду, ела за столом, с ней гуляли и брали на автомобильные прогулки. У нее был свой небольшой домик с кроватью, другой мебелью и даже холодильником. Гарднеры, в отличие от Франсин Паттерсон, общались с Уошо только на амслене, не используя обычную английскую речь: они считали, что без смешивания двух языков шимпанзе будет проще.
Эксперимент Аллена и Беатрис длился пять лет, за это время Уошо освоила около 350 слов, что было подтверждено независимыми специалистами в ряде экспериментов. (Слово считалось выученным, если Уошо использовала его на протяжении 14 дней подряд в спонтанной речи и в уместной ситуации.) Как и Коко, Уошо демонстрировала не только отличные умственные способности, но и незаурядный эмоциональный интеллект. Так, например, когда однажды к ней пришли студенты, шимпанзе разговаривала с ними на языке жестов нарочито медленно, как бы предполагая, что у них не хватит опыта, чтобы понять ее беглую речь. Была и еще одна примечательная история: Кэт, одна из смотрительниц, работавших с Уошо, несколько недель не появлялась на работе – у нее случился выкидыш. Когда женщина наконец-то пришла к шимпанзе, та дала ей понять, что обижена – ведь Кэт так давно ее не навещала. Смотрительница извинилась и показала на языке жестов: «Мой ребенок умер». Уошо опустила глаза, потом посмотрела на Кэт и показала слово «плакать», а затем провела пальцем по собственной щеке, изображая текущую слезу (физиологически шимпанзе не способны плакать). Позже Кэт отмечала, что один этот жест сказал ей о способностях Уошо гораздо больше, чем все составленные шимпанзе длинные фразы.
Шимпанзе ЛанаДля обучения шимпанзе использовались и искусственные языки. Шимпанзе Лана стала первой обезьяной, которая освоила язык йеркиш (такое название он получил в честь Роберта Йеркса, специалиста в области поведения животных и одного из основоположников зоопсихологии). Ученые разработали йеркиш специально для того, чтобы учить обезьян речи. В нем применяются лексиграммы – небольшие картинки-символы, обозначающие слова и комбинирующиеся по определенным правилам (рис. 1). Лексиграммы специально сделали непохожими на предметы, которые они обозначают, и сгруппировали по классам: неодушевленные объекты, приматы, другие живые существа, разные типы действий и т. п.
Лексиграммы размещались на устройстве, похожем на клавиатуру. Положение каждой клавиши не было фиксированным – иногда их меняли местами, чтобы обезьяна запоминала не расположение лексиграммы, а ее значение. Когда шимпанзе нажимала на клавиши, символы выводились на экран.
Грамматика йеркиша различает три типа предложений: утверждение, просьба, вопрос. Каждый из них оформляется по своим правилам (например, просьба начинается с лексиграммы «пожалуйста», вопрос – с лексиграммы «вопрос»). В конце предложения должна ставиться точка. Эти правила были введены для того, чтобы объективно оценивать действия шимпанзе и четко различать сознательно выстроенные фразы и случайные комбинации символов, которые могут нести какой-то смысл.
Рис. 1 A, B. Примеры лексиграмм
Шимпанзе Лану начали учить йеркишу в 1971 году. Она довольно быстро научилась просить еду или, например, сообщать исследователям, что хочет посмотреть слайд-шоу из фотографий. Если Лана делала ошибку в процессе написания предложения и понимала это, то сразу нажимала кнопку для стирания фразы, после чего могла начать заново.
Рис. 2. Шимпанзе Лана печатает предложения из лексиграмм
Источник: Georgia State University
К 1974 году Лана выучила около сотни лексиграмм и составляла предложения длиной до семи символов. Она могла называть цвета предметов, спрашивала у работавшего с ней исследователя Тима, как называется тот или иной объект. Шимпанзе научилась читать лексиграммы на экране компьютера – так ученые получили возможность задавать ей вопросы. Иногда, если Лану спрашивали одно и то же несколько раз подряд (чтобы проверить, что она действительно понимает вопрос, а не случайно жмет на клавиши), она раздражалась и могла ответить фразой: «Тим, пожалуйста, выйди из комнаты».
Результаты этих и других подобных экспериментов отражены в десятках научных публикаций и подтверждены многими учеными. Значит ли это, что говорить могут не только люди?
Речь или не речь?
Несмотря на впечатляющие успехи обезьян, далеко не все ученые согласны с тем, что описанные опыты демонстрируют освоение этими приматами речи. Так, профессор Дьюэйн Румбо, руководитель эксперимента с йеркишем, полагал, что употребление Ланой языка имело ограничения. «Она никогда не использовала силу своих языковых навыков для расширения своего понимания мира», – писал Румбо[1].
Хотя шимпанзе и научилась самостоятельно читать проецируемые на экран строки лексиграмм, а также могла комбинировать символы, чтобы просить предметы, названия которых она не знала (например, называя огурец «банан, который зеленый»), она никогда не понимала аналогичного словотворчества экспериментаторов.
Ряд всемирно известных ученых, например лингвист Ноам Хомский и психолингвист Стивен Пинкер, также скептически относятся к «говорящим» обезьянам. Они отмечают невозможность точно установить, действительно ли обезьяны сознательно поддерживают разговор, понимают ли суть синтаксиса и значение жестов, которыми овладевают. И лингвисты, и обычные люди, говорящие на амслене, утверждают одно: запомнить значение отдельных жестов не то же самое, что выучить жестовый язык (равно как и знание сотни японских слов не делает нас способными поддержать разговор на японском языке). Возможно, что беседа для обезьян – это имитация действий ученых, выполнение определенных трюков, пусть и весьма сложных, ради получения награды или похвалы.
Кроме того, приматологи работают с животными годами, даже десятилетиями, ежедневно общаются с ними. Нет ли у экспериментаторов предвзятого отношения к своим подопечным, которое приводит к тому, что ученые видят речь там, где ее нет? За необъективность критиковали и Гарднеров, которые относились к Уошо как к своему ребенку, и Паттерсон, также выстроившую личные отношения с Коко. Наверняка играет определенную роль и эмоциональный интеллект обезьян: когда шимпанзе выражает сочувствие потерявшей ребенка женщине, а горилла заботится о котенке и почти философски рассуждает о смерти, это не может оставить экспериментаторов равнодушными. Кроме того, вспомните, как двигаются обезьяны, – ведь действительно довольно сложно определить, где заканчивается один их жест и начинается другой.
Еще один аргумент противников (в том числе и Ноама Хомского) идеи о том, что обезьяны могут освоить речь, звучит так: человек осваивает родной язык очень легко и быстро по сравнению с другими приматами, обезьянам же на это требуются годы специального обучения, и его результаты весьма ограничены.
Не значит ли это, что способность к речи – врожденное качество, присущее только людям? С другой стороны, если изолировать ребенка от общества, он не заговорит сам по себе. Так где же правда? Это мы обсудим в следующей главе, а пока продолжим разговор о животных.
Как общаются не приматы
Пока что мы говорили только о приматах – людях и обезьянах. Но ведь и другие животные используют системы коммуникации, подчас не менее сложные, чем настоящий язык.
Танец пчелВ самом начале этой главы я уже упоминала танец пчел. Главную роль в его расшифровке и «переводе» на человеческий язык сыграл австрийский специалист по поведению животных Карл фон Фриш. Совместно с Конрадом Лоренцем и Николасом Тинбергеном он получил Нобелевскую премию по физиологии или медицине 1973 года с формулировкой «за открытия, связанные с созданием и установлением моделей индивидуального и группового поведения животных».
Свое главное открытие фон Фриш сделал в январе 1919 года. К тому времени он занимался изучением пчел уже семь лет, и в новом эксперименте исследователь обратил внимание на поведение пчелы, которая нашла пищу и вернулась в улей.
«Я едва мог поверить своим глазам, когда она исполнила круговой танец на медовых сотах, чем привела в сильнейшее возбуждение находящихся рядом с ней пчел, помеченных краской, которые немедленно полетели к месту кормежки… Это было, как я думаю, наиболее важное наблюдение в моей жизни, во всяком случае имеющее самые далеко идущие последствия»[2], – писал ученый.
Фон Фриш исследовал танцы пчел всю свою жизнь. Он узнал, что движениями пчелы передают информацию о расстоянии до источника пищи (если он близко, то танец круговой, если далеко – «вихляющий», в виде восьмерки), о том, каков угол между местонахождением пищи и солнцем. Выяснил, что при переменной облачности пчелы ориентируются по плоскости поляризации света от просветов чистого неба. Во время танца пчела может издавать разные звуки, которые зависят от количества еды, и выделяет особые вещества.
Впечатляет, правда? Вот только с точки зрения лингвистики, семиотики и прочих связанных с языком наук такой тип общения правильнее будет назвать системой коммуникации, а не языком. В «речи» пчел нет ни синтаксиса (правил, согласно которым отдельные слова объединяются в словосочетания и предложения), ни наборов символов, которые обозначают звуки или объекты.
Общение морских львовОгромный вклад в изучение когнитивных способностей морских львов внес морской биолог, специалист по поведению животных и сравнительной психологии Рональд Шустерман. В 1970-х годах он начал работу с этими тюленями и на протяжении следующих десятилетий сделал ряд важнейших открытий.
Те из вас, кто встречался с морскими львами, наверняка слышали разнообразные звуки, которые они издают: рычание, лай, писк, щелчки, рев. Весь этот арсенал животные используют, чтобы общаться с сородичами (например, самцы лают, устанавливая границы своей территории, а самки и детеныши узнают друг друга по голосу). Дополнительным средством коммуникации им служит язык тела.
Однако биологам удалось выяснить, что морские львы способны на гораздо большее. Оказалось, что они могут осваивать определенные логические операции, которые считаются «предшественниками» овладения языком. Более того, в 1992 году Шустерман и его коллеги обучали самку калифорнийского морского льва по имени Рокки понимать язык жестов – Рокки оказалась в состоянии не только запомнить значения жестов, но и усвоила базовые правила, по которым жесты следовали друг за другом.
Шустерман приводит такой пример. Дрессировщик показывал Рокки знаки, обозначавшие слова: вода, белая маленькая бутылка, принеси. Последовательность действий была следующей:
Дрессировщик: показывает знак «вода».
Рокки, находящаяся в бассейне: оглядывается в поисках источника воды (питьевой фонтанчик).
Дрессировщик: делает паузу, необходимую для разделения двух понятий.
Рокки: ждет.
Дрессировщик: показывает прилагательное «белый».
Рокки: слегка поворачивается налево, но не двигается с места и не осматривает бассейн.
Дрессировщик: показывает прилагательное «маленький».
Рокки: снова посматривает налево, но продолжает ждать.
Дрессировщик: показывает существительное «бутылка».
Рокки: плывет за маленькой белой бутылкой, которая находится слева от нее.
Дрессировщик: показывает глагол «приносить».
Рокки: остается на месте, ожидая продолжения.
Дрессировщик: опускает ногу в воду, обозначая конец предложения.
Рокки: берет бутылку, плывет к фонтанчику, подставляет бутылку под струю воды, наполняет емкость, приносит ее дрессировщику.
По мнению ученых, поведение Рокки демонстрировало, что она действительно смогла уяснить базовые правила синтаксиса. Тем не менее сам Шустерман не считал это доказательством именно лингвистических способностей морских львов. В статье о данном эксперименте он пишет, что успехи Рокки можно объяснить ее общими способностями к логическому мышлению и обучению (оговаривая, правда, что эти способности требуются и для освоения языка).