banner banner banner
Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google
Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google
Оценить:
 Рейтинг: 0

Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google

«Интеллектуальная революция» – погружение в мир, я знаю, что это секрет нейронной виртуальной сети. С сильным телом, объединяя разум мудрости, открывая новые следы, давайте иметь хорошую жизнь, и нарисуем красивую мелодию.

Небеса непредсказуемы, где ты будешь, когда пройдет ночь. Теплое солнце будет светить. Небесные дети плывут, когда они просыпаются. Я хочу увидеть себя в будущем.

Предисловие 2. Рассвет эры ИИ

Эта книга посвящена искусственному интеллекту. Но для начала нужно остановиться на вопросе, который не вошел в нее, но является фундаментальным – определении ИИ.

Самым известным тестом для определения искусственного интеллекта является тест Тьюринга. Но его можно рассматривать только лишь как обобщенное описание, а не как точное определение. Например, он не дает ответов на многие вопросы: кто участвует в тестировании или какие вопросы задают машине.

В ретроспективе обнаружилось, что развитие искусственного интеллекта тесно связано с автоматизацией. И последняя является даже своего рода истоком развития. Большинство людей ошибочно полагают, что автоматизация – это и есть искусственный интеллект. Но она появилась гораздо раньше, чем мы можем себе представить. Например, первый унитаз, который установили в императорском дворце королевы Елизаветы в далеком XVI веке, был уже автоматизирован. И, конечно, это не самый ранний пример. В эпоху электричества схема автоматизации была заменена транзисторами. Позже появились интегральные схемы, управляемые все усложняющимся программным обеспечением. А сегодня в нашу жизнь вошли автоматизированные системы, такие как электронная коммерция, интернет-банкинг или система онлайн-бронирования.

Несомненно, система автоматизации уже продемонстрировала свои возможности. Такие системы, как онлайн-банкинг, осуществляют сложные операции с более высокой точностью и эффективностью, чем обычные работники. Самые простые системы демонстрируют умное поведение. Например, унитаз оценивает уровень воды в бачке и в соответствии с этим своевременно открывает и закрывает клапан подачи воды. Все это качественно улучшает человеческую жизнь. Но ни интернет-банкинг, ни унитаз мы не рассматриваем как искусственный интеллект. Автор этой книги разработал программное обеспечение, которое позволяет создавать современную поэзию. Причем отличить классические китайские стихи, современные стихи машины и современные стихи человека практически невозможно. За последние годы не одна система прошла тест Тьюринга в лабораторных условиях. Но мы же все-таки не считаем их обладающими искусственным интеллектом, верно?

В 1980-х годах автор книги принимал участие в разработке промышленной системы мониторинга. В качестве ядра для нее был использован процессор Z 80, а программирование осуществлялось на языке ассемблера. Система контролировала сотни параметров блока и осуществляла регулировку параметров в соответствии с изменениями. Но, по нашему мнению, это тоже нельзя назвать искусственным интеллектом. Язык ассемблера характеризуется прозрачностью на аппаратном уровне. Приходится вручную учить машину делать все шаги: отправлять поступающие данные в определенный отсек памяти, прерывать команды, возвращаться на шаг назад и т. д. В таком случае можно проследить, по какой блок-схеме работает мозг машины, и вычислить, какая команда ему поступила для осуществления операции. По большому счету эта система мониторинга не слишком отличается от системы работы унитаза. Разработчики более сложных систем, интернет-банкинга или электронной коммерции, знают все внутренние процессы. Каждый шаг системы также контролируется в программном обеспечении. Это вновь более сложная версия унитаза. А если говорить о системе-поэте, которая прошла тест Тьюринга, то она извлекает слова из логического дерева. Потом обрабатывает, комбинирует по смыслу и рифмует. Программисты понимают, что это также не имеет отношения к искусственному интеллекту.

Здесь можно привести одно мудрое китайское высказывание – когда мы поймем людей, которые ищут карты в комнате, ощущение разумности исчезнет.

Мы считаем, что системы с искусственным интеллектом, такие как эволюционные алгоритмы или глубокое обучение, имеют одну общую черту: все они более или менее по характеристикам напоминают «черный ящик». Теоретически мы все еще сможем отслеживать их шаги. Но из-за огромного количества вычислений сделать это практически невозможно. Мы действительно ощутим уровень их разумности.

Точного определения искусственного интеллекта еще не существует. Но теперь мы можем увидеть его ключевые особенности: это искусственная система с интеллектуальными характеристиками, которая осуществляет и воспроизводит те вычислительные процессы, которые не подвластны человеческому разуму. Другими словами, мы согласимся с тем, что у машины есть собственный интеллект только в том случае, если не будем знать, что и как она думает.

Но столкнувшись с этим явлением, мы должны быть беспристрастны. Потеряем ли мы в конечном итоге контроль над искусственным интеллектом?

Сегодня вопрос о развитии искусственного интеллекта вызывает серьезную обеспокоенность. Цитируя Маска, ИИ становится более опасным, чем ядерные бомбы. Средства массовой информации создают впечатление, что мы стоим на пороге эры машин и момент, когда искусственный разум завоюет мир, уже не за горами. Последняя глава этой книги выражает схожее мнение. В книге «Сингулярность приближения» Кузвиль даже определяет конкретную дату начала эры ИИ – 2045. 2/3 людей, прочитавших книгу, будут к тому моменту еще живы.

Если взглянуть на ситуацию под рациональным углом, то становится понятно, что сверхчеловеческий искусственный интеллект все еще относится к категории научной фантастики. Любое разумное суждение в этом направлении отвергается как консервативное и с недостатком воображения. Публика предпочитает научно-фантастические захватывающие сюжеты банальной реальности. Выступая в роли автора научно-фантастического труда, Робин Ли может сказать, что некоторые из предсказаний могут воплотиться в жизнь. Но большинство еще очень долго не приблизится к реальности. Общество предполагает, что технические барьеры, преграждающие путь развитию ИИ, будут преодолены в обозримом будущем. Но это не так. Создание сверхинтеллекта сталкивается с огромными техническими препятствиями, такими как новая архитектура фон Неймана, глубокое понимание человеческого мышления и т. д. Никто не может быть уверен, что прорыв когда-либо будет достигнут. Многие технологии, такие как квантовые вычисления, еще далеки от практического использования.

Таким образом, разумнее обратить внимание на события, которые имеют отношение к ближайшему будущему. Эта тема и легла в основу данной книги.

В последнее время наметилась тенденция выхода искусственного интеллекта из научных лабораторий. По словам одного из интернет-хакеров, они становятся все доступнее, а мы сталкиваемся с неизбежной проблемой: искусственный интеллект не отнимает нашу свободу и жизнь, но отнимает наши рабочие места. Еще до того, как ИИ выйдет из-под контроля человека, он может подчинить нас воле капиталистов.

Некоторые ученые придерживаются мнения, что беспокоиться об этом не стоит, и вспоминают в качестве примера историю индустриализации. В начале XX века 50 % американского общества было занято в сфере сельского хозяйства, сейчас этот показатель сократился до 4 %. Урбанизация поглотила лишних фермеров. Изменения, связанные с эрой искусственного интеллекта, будут существенно отличаться. Люди с помощью машин смогут выполнять большие объемы работы. Но город не сможет предоставить им необходимое количество рабочих мест. Востребованной останется только лишь творческая работа. Но если мир будет полностью состоять из ученых и художников, то будет скорее напоминать кошмар, обреченный на пустоту жизни большинства его жителей. Будет бесполезен и для себя, и для общества.

Но в подобном образе мышления что-то не так. Конечно, с древних времен люди трудились, чтобы выжить. Работа была прекрасна. Но вовсе не обязательна для тех, кто привык жить красивой жизнью. Теперь мы сможем создать машину, которая освободит человека от тяжелого бремени работы – величайшего достижения цивилизации. Не следует рассматривать это как катастрофу. Нам просто придется измениться в соответствии с новыми реалиями.

Как завершится переход от современного общества к обществу искусственного интеллекта? Существует два варианта развития событий.

Первый – бесконечный конфликт между искусственным интеллектом и его пользователями. Проблемы, порождаемые искусственным интеллектом в социальных, экономических и политических системах, перестанут поддаваться анализу. ИИ будет быстро захватывать все сферы человеческой жизни. А социальная система, которая бы могла ему соответствовать, не появится в одночасье. Мир погрузится в беспросветный хаос, сопровождаемый безработицей, экономическими и политическими проблемами.

Второй вариант предвидит возможность того, что общество успешно завершит трансформацию. Это будет самым крупным изменением человеческого образа жизни в истории. Существующая философия – краеугольный камень общества. Она постепенно развивалась с момента зарождения цивилизации, но никогда не изменялась кардинальным образом. Появление искусственного интеллекта приведет к фундаментальным изменениям во всех сферах человеческой жизни – в видах собственности, в процессе распределения ресурсов, в основных экономических структурах, в политических институтах, даже в культуре. Наступит освобождение человечества от рабства труда. Мы сделаем широкий шаг по направлению к утопическим идеалам. 2016 год – 500-летний юбилей со дня публикации знаменитой «Утопии» Томаса Мора. Думал ли он, что однажды его идеи воплотятся в жизнь с помощью машин? А как бы видоизменились теории о капитализме и коммунизме, если бы Карл Маркс знал, что такое искусственный интеллект?

Трудно представить себе жизнь в эпоху искусственного интеллекта. Даже в научной фантастике мы можем лишь просчитать возможности и вероятности. Только от нас зависит, что из них станет реальностью. В любом случае, это заманчивое время. И мы направляемся к нему.

    Лю Ци Синь
    10 декабря 2016 г.

Раздел 1. Краткая история: Рост искусственного интеллекта в интернет-облаке

Некоторые слова освещают историю. Другие – дорогу в будущее. Давайте начнем с краткого обзора истории интернета и искусственного интеллекта.

Многие уже знакомы с историей возникновения интернета в общих чертах. Он появился в 60-х годах XX века в американской военной лаборатории. И начал использоваться для передачи и обмена информацией между некоторыми университетами и научно-исследовательскими институтами. В конце 1980-х группа ученых разработала концепцию создания Всемирной Паутины и протокол TCP\IP (Internet Transmission Control Protocol). Основным преимуществом протокола было то, что он позволял унифицировать стандарты компьютерных сетевых коммуникаций. Значит, появлялась возможность сделать интернет доступным во всем мире. Перед человечеством открывалась новая информационная магистраль.

Около 20 лет назад 23-летний юноша Марк Андерсон изобрел браузер Netscape. Это стало настоящей бомбой – перед бизнесом широко распахнулись двери в интернет-мир. Это заставило компанию Microsoft поволноваться. Они всерьез задумались о том, что их бизнес понесет серьезные убытки от интернет-нашествия. Открывались широкие возможности для нововведений и уничтожения монополий. Поэтому молодые люди из компании Sun уволились с работы и посвятили себя разработке нового языка общения, который бы смог взаимодействовать с разными операционными системами. Плодом их стараний стал Java – новый язык программирования. Он значительно ускорил создание интернет-продуктов.

В 1997 году я вернулся в Гонконг. Тогда ни в Пекине, ни в Шанхае нельзя было найти ни одного интернет-кафе. Тогда же Ин Хэй Вэй открыл Национальную службу доступа к сети, Чжан Сяо Лун написал программное обеспечение для электронной почты Foxmail, было создано Национальное информационное общество. Мир всеобщей паутины начал приобретать свои первые очертания. Но в мире технологий продолжали появляться все новые идеи, а тайные коммерческие войны входили в эпоху своего расцвета.

В то время я работал в American Search Engine Pioneer Infoseek, которая находилась на первой линии фронта. Я чувствовал атмосферу интернет-бизнеса и страсть американцев к новым технологиям и понимал, что мы столкнулись с очередной технологической революцией. Но готов ли к ней Китай? В книге «Кремниевая долина» 1998 года подробно описаны инновации, создаваемые гениями Кремниевой долины, и их борьба между собой. После того, как я закончил книгу в 1999 году, я вернулся в Пекин в отель, построенный компанией Baidu.

Напомню, что в ту увлекательную эпоху существовало три «сверхдержавы» в Интернете – Netscape, Sun, Microsoft. Все гадали – кто же выйдет победителем из этой битвы. Microsoft казался непобедимым. Он мог усвоить любые технологические новинки. Путь Netscape сопровождали взлеты и падения. В конечном итоге она была выкуплена американским беспроводным гигантом – провайдером Verizon. Позже в руки Verizon попала и компания Yahoo. Sun в 2001 году имела 50 000 сотрудников по всему миру. А ее рыночная стоимость превышала 200 млрд долл. США. Однако, когда лопнул мыльный интернет-пузырь, компания солнца мгновенно спикировала на самое дно. Через год, в 2009 году, ее выкупила корпорация Oracle.

На этом фоне ожидался быстрый подъем новых компаний – Apple и Google с мобильной операционной системой, как ответный удар по Microsoft.

Марк Андерсон – создатель браузера Netscape, которого я описал в начале «Кремниевой долины», был практически позабыт после пика популярности в 90-х. Но он не ушел со сцены. А стал отцом ветряной промышленности Кремниевой Долины.

Интернет-технологии продолжали набирать обороты. Раньше люди боролись за интернет. А сегодня с волнением начали замечать, что он все больше выходит за рамки ПК на мобильные устройства. Это совпало с незаметным подъемом «призрака». «Призрак» – это искусственный интеллект. А интернет – всего лишь одно из его тел.

Рассвет искусственного интеллекта

История развития искусственного интеллекта предшествует интернету и сопровождается историей компьютеров. В 1956 году на конференции в Дартмуте на повестку дня был официально вынесен вопрос об искусственном интеллекте. В то время компьютер был размером с большой дом и обладал низкой вычислительной мощностью. Как вообще ученые осмелились вынести вопрос об ИИ на всеобщее обозрение?

Именно тогда Шеннон сформулировал три основных теоремы коммуникации. И тем самым заложил основу для компьютерных информационных технологий. Минский создал первый нейросетевой компьютер (он и его коллега моделировали сеть из 40 нейронов с 3000 вакуумными трубками и автоматическим индикатором на бомбардировщике B-24). А после этого написал статью на тему «Нейронные сети и модель мозга». Тогда она не произвела особого эффекта. Но позднее легла в основу концепции ИИ. Тьюринг в 1950 году представил уже известные читателю теории тестирования, а также различные концепции машинного и интенсивного обучения, генетического алгоритма.

Спустя два года после смерти Тьюринга на конференции в Дартмуте Маккарти официально представил концепцию искусственного интеллекта. Десять молодых ученых, принимавших участие в конференции, стали мировыми лидерами в области искусственного интеллекта. Но расцвет ИИ был недолгим. Все достижения ученых были похоронены результатами технологического развития.

Цель уже маячила впереди, но инфраструктура находилась в зачаточном состоянии. Искусственный интеллект сталкивался с двумя непреодолимыми барьерами. Первый – это логика алгоритмов или недостаточное развитие математических методов. Второй – недостаток аппаратных вычислительных мощностей. Например, типичная проблема – машинный перевод. Ученые день и ночь суммируют все известные правила грамматики, разрабатывают модели компьютерного языка, но машина все равно не может повысить точность перевода и выйти на удовлетворительный уровень.

Новые технологии и производственные цепочки не стали достоянием общественности. Не были изобретены захватывающие программные продукты. А государственные и бизнес-инвестиции были значительно сокращены. С середины 1970-х и до 1990-х гг. наблюдалось две волны всплеска интереса по отношению к разработкам и исследованиям, связанным с искусственным интеллектом. Но широкая аудитория оставалась в неведении. Внимание было сконцентрировано на развитии компьютера – фантастического интеллектуального инструмента.

Обыватели знакомились с искусственным интеллектом сквозь призму аркадных игр. В 1980-х в Китае на улицах появились первые игровые автоматы. Аркадные NPC (персонажи, которые не контролируются игроком) воспринимались как продукт ИИ, но легко проходились опытными игроками. Так сформировалось ошибочное представление: искусственный интеллект – то, что установлено на компьютере. Эта точка зрения никак не менялась до появления интернета и облачных вычислений.

Как закалялась сталь

В 2012 году я заметил, что в академических и прикладных областях науки произошли заметные прорывы в глубоком обучении. Например, использование метода глубокого обучения сделало возможным усовершенствование методов распознавания изображений. Я сразу понял, что мы стоим на пороге новой эры глобального поиска. Если до этого мы использовали только лишь текстовый поиск, то теперь возможными стали голосовой запрос и запрос по изображению. Например, если необходимо узнать, что за растение я вижу перед собой, то я фотографирую его и загружаю в поисковик. В течение нескольких секунд получаю его название – Flu Tong. С помощью текста сделать это было практически невозможно. Но усовершенствовался не только процесс поиска. Теперь стали возможны многие вещи, казавшиеся раньше нереальными. Распознавание речи, изображений, способность воссоздавать портрет пользователя – одни из базовых способностей человека. Как только компьютеры научатся делать то же самое, начнется новая технологическая революция. Стенографистов и переводчиков заменят машины и будут выполнять их работу лучше. В прошлое уйдут шоферы – автомобиль сможет ездить сам в разы безопаснее. В бизнесе появится умный помощник по работе с клиентами, который сможет удовлетворить все потребности и ответить на все вопросы. Искусственный интеллект даст людям новые возможности. Промышленная революция освободила людей от физической нагрузки. Теперь машины перемещают тяжести вместо нас и делают это в больших масштабах, чем было под силу человеку. Интеллектуальная революция будет решать другие вопросы. Следующие 20-50 лет мы будем свидетелями изменений и неожиданных сюрпризов. И это естественно.

Но интеллектуальная революция была бы невозможна без преданных своему делу первопроходцев. Стоит отдать им дань уважения.

После длительного периода застоя немногие ученые сохранили веру в идею искусственного интеллекта. Сейчас у Baidu есть большая и сильная исследовательская команда. Многие из ученых с 1990-х занимаются исследованиями в области машинного обучения или работают в крупных технологических компаниях. Сегодняшние достижения в области исследований ИИ – результат альтернативных подходов к работе над этой темой.

В 1990-х гг. немногие ученые, такие как Джеффри Хинтон и Майкл Джордан, настаивали на изучении машинного обучения. Ву Энда, бывший главный ученый Baidu, учился у Джордана в 90-е, а после преподавал теорию машинного обучения и даже организовал собственные онлайн-курсы. В настоящее время деканом научно-исследовательского института Baidu является Линь Юаньцин. Сю Вэй, один из выдающихся ученых корпорации, стал первым, кто предложил использовать нейронные сети для языковых моделей. Специалист по искусственному интеллекту, член американской инженерной академии, Владимир Вапник изобрел систему SVM (Support Vector Machine). Ян Лекун – лидер в области глубоких исследований, руководитель лаборатории искусственного интеллекта Facebook, изобрел специальную архитектуру сверточных нейронных сетей. А бывший директор лаборатории глубинного обучения Леон Батту является разработчиком ядра алгоритма глубинного градиента.

Исследования искусственного интеллекта прошли через несколько фаз. Первоначальные исследования ИИ основывались на правилах. Люди суммировали правила, введенные в компьютер, а сам компьютер этого сделать не мог. Следующий, более продвинутый подход основан на технологии машинного обучения. Он позволяет найти наиболее подходящие модели из больших объемов данных.

За два года развития искусственный интеллект смог поразить мир технологий. Он стал сублимированной версией технологии машинного обучения, основанной на многослойном нейросетевом компьютерном чипе. Благодаря многослойным микросхемам, которые имитируют соединение нейронов в человеческом мозге, в сочетании с усовершенствованным алгоритмом поощрения и наказания и возможностью переработки большого объема данных компьютер научился находить закономерности и вычленять модели из огромного количества информации. Это открыло новую эру в развитии интеллекта машин.

Немногие продолжали настаивать на разработке теории искусственного интеллекта, чтобы спасти уже проделанную работу. В Китае Baidu была одной из первых компаний по разработке ИИ. И, кажется, мы сделали то, о чем другие не могли даже мечтать. Шесть или семь лет назад я и Лу Цзи обсуждали прогресс, достигнутый в глубоком обучении. Мы сошлись во мнении, что готовы войти в эту сферу. В конце концов, в 2013 году я официально объявил о создании IDL (институт глубокого обучения). Он должен был стать первым институтом глубокого обучения в бизнес-сообществе. Я стал деканом не потому, что знаю больше, чем кто-либо другой. Для меня это своеобразный способ подчеркнуть степень своего внимания к предмету. А еще возможность отблагодарить тех ученых, которые не отступили в тяжелые годы.

Baidu никогда раньше не создавал научно-исследовательские институты. Наши инженеры были исследователями, а их работа всегда была тесно переплетена с практическим применением. Но я считаю, что глубокое обучение в будущем окажет огромное влияние на многие отрасли науки и жизни и шагнет далеко за пределы компетенции нашей компании. Поэтому необходимо создать специальное пространство для привлечения талантов, где бы они смогли свободно экспериментировать с инновациями, проводить исследования в неизвестных раньше областях и прокладывать путь искусственному интеллекту в жизнь человека.

На смену интеллекту