banner banner banner
Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google
Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google
Оценить:
 Рейтинг: 0

Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google


Множество сверхмощных человеческих мозгов сходятся в одном месте, чтобы создать один эпохальный китайский мозг для машины. Мы уже пережили эру ПК, эру мобильного интернета. Теперь на всех парах движемся к суперразумной эре взаимосвязи всех вещей. Слияние данных об окружающих нас предметах может в конце концов привести к развитию «Знания»[3 - «Знание» – это точка зрения Кевина Келли в книге «Неизбежное», относится к программному обеспечению, которое охватывает все. Он считает, что все будет информационным, даже если данные о продажах и частоте кликов будут автоматически выгружаться в таблицу.]. Baidu двигается в этом направлении. Цель заключается в том, чтобы сделать искусственный разум таким же необходимым для людей, как вода или электричество. Это неизбежно спровоцирует повышенный интерес к развитию технологий. Например, Baidu имеет свои глаза, уши, рот и когнитивные навыки принятия решений. В целом, это искусственный эквивалент ребенка. Но некоторые способности, такие как перевод, распознавание речи, распознавание изображений, значительно превосходят способности ребенка. Мы открываем Baidu для людей, чтобы исследовать его возможности в различных приложениях с функциями ИИ. Baidu Brain уже сегодня стал инструментом для многих разработчиков операционных систем и способствует стандартизации формы искусственного разума. В новой эпохе нас ожидает полный спектр услуг для предприятий, предпринимателей и большинства индивидуальных пользователей.

Мы с энтузиазмом называем китайский мозг средством глубокого обучения серверов, алгоритмов, инфраструктуры приложений на уровне страны. Именно формирование китайского мозга станет олицетворением всестороннего повышения конкурентоспособности Китая и мощного ускорителя китайского возрождения.

Технологии, необходимые для улучшения жизни

Прежде чем начать разговор о данных, которые питают искусственный интеллект, я бы хотел остановиться на пользователях, бесчисленных потребителях, поддерживающих развитие Baidu и всего высокотехнологичного интернета.

Сегодня тенденция развития интернета и технологий сбора огромного количества информации подталкивает не только гигантов отрасли, таких как Google, Microsoft и BAT, но и малый и средний бизнес к наращиванию потенциала для того, чтобы решать проблемы в сложившейся ситуации.

Секрет успеха на самом деле прост: выясните, чего люди больше всего хотят, а затем дайте им это. Его успеху также способствовали сильные маркетинговые кампании и корпоративный имидж. Кейн сыграл здесь ключевую роль. Он ничего не знает о компьютерных технологиях. Но он от мозга костей – деловой человек, а его ноги глубоко укоренились в обществе. Центр мира – это потребитель. «Мы будем устами интернет-мира».

Цитата из книги «Кремниевая долина»

В книге «Кремниевая долина» я подчеркиваю важность каждого пользователя. В глазах инженеров потребитель – это один из элементов в технической документации, существование которого можно свести к одной формуле: потребности потребителя – развитие – обратная связь. Но интернет не только упрощает получение товаров и услуг, но и обеспечивает поле для обмена мыслями и эмоциями. Можно сказать, что интернет создает своего рода единое мнение пользователей.

Многие из наших инженеров и программистов наслаждаются свободой Baidu и полагаются на его простоту. Техник ясно мыслит, увлечен разработкой новых продуктов и общителен. Но люди с живыми эмоциями и мыслями не совсем соответствуют тому, как их видят инженеры. Вероятно, маленькие кусочки жизни каждого отдельного человека или сложные сделки в торговых центрах не будут ощущаться в наших лабораториях. Для того, чтобы лучше понять психологию пользователя, существует PR-отдел. Однако и они не всегда справляются с задачей и сталкиваются с проблемами, которые делают код уязвимым. Чтобы разобраться, как сломать барьер между техниками, бизнесменами и обычными пользователями, нам нужно сконцентрироваться на высоком уровне мышления продукта и скромном изучении трансграничного опыта.

Мысли о потребностях человека в повседневной жизни – непрерывная работа, которая требует настойчивости. Но если вернуться к теме книги, то мы, в конце концов, инженеры, и не забываем думать о том, как удовлетворять потребности пользователей с помощью технологий и цифр. Мы используем технологию разграничения данных для того, чтобы обслуживать разных пользователей.

Оцифровка – это тенденция, которая обсуждается в «Цифровом выживании», «Бесконтрольном» и «Чего хотят технологии» Кевина Келли. А также это то, что думают атланты современных технологий. Теперь помимо коммерческих, финансовых, сельскохозяйственных, военных и технологических данных, в нашем арсенале появились данные о жизни. Иногда дело доходит даже до того, что данные вызывают тревогу. Например, а что если личные данные будут проданы? Вкратце должны сказать, что данные в глазах искусственного интеллекта не носят личностной окраски. У него нет потребности запоминать ваши пароли и другие сведения в отличие от торговцев данными с низким уровнем образования. Искусственный интеллект сосредоточен на обнаружении общей «модели» из хаотичных действий, оптимизации производства и его обслуживания. Перевод, распознавание речи и распознавание изображений являются лучшими примерами прогресса. Эти данные, через алгоритм распознавания ИИ, будут иметь огромное значение для человечества. Например, от повседневного распознавания речи в борьбе с мошенничеством в сфере финансов до борьбы с терроризмом на национальном уровне.

Технология должна адаптироваться под пользователя, потому как продукт должен отвечать потребностям потребителя. Кажется, что хороший искусственный интеллект должен работать безмолвно и не может допускать скачки напряжения и мутность сведений. Но для того, чтобы улучшить технологии ИИ, нужно оптимизировать детали. Некоторые из них, например технология распознавания речи, работают неплохо, но метод ввода очень далек от того, чтобы называться удобным. Что не может не влиять на восприятие пользователя. Baidu в багаже опыта уже имеет примеры неудачно реализованных продуктов, которые должны быть изменены в соответствии с предпочтениями потребителей.

Данные и технологии не стоят на месте. Они постепенно очеловечиваются и начинают видоизменяться.

Многие интернет-пользователи были впечатлены изображением 1-2. Это Baidu карта с использованием технологии визуализации данных, которая наглядно демонстрирует линии миграции в Китае в начале 2014 года, когда в Дунгуане вышел запрет на порнографию и желтую прессу.

Старший редактор новостей сказал нам, что, рассматривая эту карту, он ощутил себя за пределами обычных новостей. И на мгновение приблизился к пониманию мира. Индекс миграции Baidu отражает перемещения людей с помощью технологии визуализации данных. Миграция людей в цифровую эпоху – это лишь небольшая страница в эпопее миграции людей за миллионы лет. Но эпоха огромных массивов информации тоже имеет свою первую историческую страницу.

Я бы сказал, что это тоже исторический момент в эпоху искусственного интеллекта. Это интеллектуальная картографическая технология для восприятия человеческой деятельности, человеческой судьбы. Искусственный интеллект сам по себе не является гуманным, но в сочетании с творческими идеями разработчиков, философией может обеспечить новую перспективу, даже другое человеческое отношение.

Компьютер и интернет – это тело искусственного интеллекта. А массивы данных или записи человеческой деятельности и человеческой природы могут наконец-то стать его «душой».

Бульвар данных

Один философ сказал, что человек – это существо «в постоянном пути». Baidu накапливает огромное количество картографических данных, дополненных мудростью создателя и различными сложными алгоритмами, которые изображают действия человека и демонстрируют его путь выживания.

Именно наше поколение слушает песню Дуна Ангера: «Ради жизни люди бегают, а их судьбы сплетаются. Я надеюсь, что благодаря искусственному интеллекту траектория движения человечества будет не просто пульсировать, но постоянно пересекаться. Она будет сливаться в одну полноводную реку и длиться бесконечно».

Молодой ученый из лаборатории больших данных Baidu в Принстоне по студенчеству изучал закономерности движения рыб. По возвращении домой он увидел карту миграции Baidu и заметил, что человеческие перемещения очень напоминают перемещения рыб. Изучение человеческих миграций даже более удобно за счет наличия масштабных данных и сведений. Так началась его работа в нашей компании. В 2016 году он и его коллеги использовали данные Baidu о миграции, чтобы предсказать падение продаж iPhone (Apple Phone). Подобный умный подход к анализу стал возможен за счет многочисленных данных, собираемых лабораторией, о разнообразии городской жизни и деятельности производственных предприятий.

В 2014 году Министерство транспорта предложило провести реформу. Было принято решение ускорить развитие программы «четырех перевозок» и строительства, ориентированного на рынок промышленности и научно-исследовательской отрасли. Это стало возможным благодаря технологическим инновациям, которые способны преобразовать научные достижения в производительность транспорта. Сейчас мы сосредоточены на создании многоканальной многорежимной системы и интегрированной платформы информационных услуг в сфере транспорта и путешествий. Она позволит мгновенно публиковать актуальную информацию и решит ряд вопросов человека, который отправляется в очередное путешествие.

В поддержку реформы Baidu выдвинул «интеллектуальный план платформы облачных услуг транспорта Китая». Планировалось совместно с Научно-исследовательским институтом автомобильных дорог Министерства транспорта и Национальным центром интеллектуальных транспортных систем инженерных технологий создать платформу для сотрудничества – эффективную систему обмена информационными ресурсами между провинциями, государственными предприятиями и другими членами общества.

Умная карта может измерить степень затора на дороге, анализируя скорость движения пользователя. И во избежание потери времени сконструировать маршрут объезда пробки. Это стало возможным благодаря использованию технологии виртуальной реальности. На основе данных и с помощью эффективного алгоритма принятия решений карта способна облегчить нагрузку на транспортную систему города и сократить работу для сектора управления дорожным движением.

Современные карты собирают всевозможные географические данные, что позволяет расширить число интеллектуальных проектов. Технология навигации высокой четкости достигает точности до сантиметра. И поэтому была задействована в разработке беспилотных автомобилей. В 2016 году на Всемирном интернет-конгрессе беспилотный автомобиль Baidu был публично протестирован и введен в эксплуатацию в городе Ву. Опыт проходил в условиях движения города. Машина проехала 3,16 километра, 3 светофора и несколько поворотов. Она не только не сталкивалась с людьми, которые перемещались в различных направлениях, но и учитывала погодные условия – дождь, туман, дымку. Полученный результат не уступает успехам коллег из Кремниевой долины, которые проводили подобные испытания в Северной Америке. В рамках разработки беспилотного автомобиля эти успехи незначительны. Но для развития искусственного интеллекта – это внушительный шаг вперед.

ИИ не упал с неба. Ему предшествовали десятилетия работы над компьютерными сетевыми технологиями и технологиями обработки данных, а также сбор необходимой информации о человеческой жизни и деятельности. Baidu Search и Baidu Maps являются материальным результатом процесса развития.

ИИ не миф и не шутка

Сегодня в средствах массовой информации появляется множество новостей о роботах и масса шуток. Например, в недавнем выпуске новостей был сюжет о роботе, который ранит людей. На самом деле это был робот, который упал с платформы. Существует также мнение, что роботы – это игрушки. Но если взглянуть на ситуацию с точки зрения науки, обнаружится, что ИИ – не миф и не шутка. Он – результат человеческого труда. И он не нуждается ни в поклонении, ни в страхе.

Ученые в области искусственного интеллекта часто скромно описывают свои достижения. Ву Цзюнь, бывший инженер Google, рассказывал, что в 2003 году, когда он и его компаньоны работали над повышением точности вводимых ключевых слов в поисковике, основной проблемой стал подбор синонимов для удовлетворения запроса пользователя. Если компьютер не выдает необходимого результата при поиске информации, то человек будет продолжать подбирать ключевые слова. Но в этой ситуации пользователь фактически делает всю работу самостоятельно. Нужно было усовершенствовать технологию, чтобы ускорить процесс поиска и улучшить механизм обратной связи. Инженер сказал: «Может показаться, что у нас нет соответствующих технологий для решения проблемы. На протяжении многих лет пользователи сами подбирали ключевые слова для поиска. Но в 2003 году во время долгих выходных в честь Дня Независимости Соединенных Штатов мы приостановили работу одного из пяти крупнейших центров обработки данных. И за 4 дня сделали обработку каждого ключевого слова. По сути, это был метод исчерпывания. Мы выявили сочетания слов, которые часто использовались для того, чтобы сузить результат поиска. Теперь, когда поступает аналогичный запрос, система дает более точные результаты гораздо быстрее».

Чтобы идти в ногу со стратегией поиска, использующей метод исчерпывания, машинный перевод и другие области технической логики должны иметь сходства. В июне 2016 года на заседании бюро переводов Google активно обсуждалась статья в «Нью-Йорк Таймс», в которой сообщалось о результатах исследований в области машинного перевода, опубликованных Baidu. Высказывание Майка Шустера привело конференц-зал в чувство: «Да, Baidu выпустила новую статью. И такое чувство, что кто-то видит то, что происходит в наших стенах. Потому что все тезисы имеют аналогичную нашим структуру и результат». Баллы BLEU Baidu (оценка качества искуственного перевода в сравнении с человевеческим) в основном совпадали с результатами, достигнутыми Google во внутренних тестах в феврале и марте. Квок Вей Ле, ведущий исследователь Google, не был расстроен. Он пришел к выводу, что исследования двигаются в правильном направлении. «Их система очень похожа на нашу», – прошептал он.

Квок Вей Ле – докторант Ву Энда. И он, вероятно, не знает, что результаты исследований не имеют к профессору никакого отношения и совершенствование перевода осуществлялось независимо. Статья в «Нью-Йорк Таймс», конечно, не получила широкой огласки. Ву Энда считает, что и отечественные СМИ должны изменить свои привычки и перестать подсознательно считать, что новые технологии всегда являются продуктом более сильной зарубежной страны. На самом деле, многие ведущие открытия в области искусственного интеллекта китайцы делают первыми.

Baidu leading выпустила систему перевода на основе NMT. А спустя год, в 2016 году, Google последовал нашему примеру и выпустил аналогичную программу. Таким образом, основные технологии исследователей, которые находятся на передовых позициях в этой сфере, почти всегда одинаковы. Но отметьте, кто накопил и кто оптимизировал данные, чтобы выпустить стоящий продукт.

Сегодняшние идеи ИИ отличаются от прошлых в правилах мышления компьютера при работе с данными и стратегиями решений. В прошлом мы хотели создать идеальную логику для компьютеров, постоянно абстрагируя правила человеческой логики и внедряя их в машины. Сегодня искусственный интеллект основывается на базе данных и алгоритмах. То есть современные достижения ИИ опираются на интернет-достижения конца 1990-х. С интернетом у нас появились необходимые объемы информации. И обратите внимание, эти данные (имя, возраст, адрес, хобби и т. п.) пользователь вводит неосознанно. Они генерируются при использовании интернета. Каждый клик, каждый запрос, каждое перемещение порождают данные.

Китай уже является крупнейшей в мире производственной державой. Теперь нам необходимо расширить влияние «мягкой силы». Дух и культура – это «мягкая сила». Вычисления и данные – это также «мягкая сила». Когда «мягкая сила» накладывается на производственные мощности, рождается сила, называемая «умной». Это скажется на всех сферах нашей жизни.

Должно быть так

У каждого предприятия своя стратегия и тактика. В 2013 году начало подъем отечественное интернет-предпринимательство. Множество бизнесменов вливают огромные средства в эту «бездонную яму», тем самым демонстрируя свою стратегическую храбрость. Baidu сфокусировался на долгосрочной научной стратегии. В то время не многие заметили, что наша компания занялась развитием искусственного интеллекта. А сегодня в мире ИИ часто отмечают твердость и целенаправленность стратегического планирования Baidu. Компания заранее оценивает природу информационной интернет-индустрии и неуклонно двигается вперед, не заботясь о мнении посторонних. Возникновение макета Baidu multipart – это прорыв в сфере искусственного интеллекта. Сейчас направлению ИИ в Китае уделяется большое внимание. Baidu находится на передовых позициях.

Вместо того, чтобы участвовать в развитии таких инструментов, как Go и Predictive Singer, мы сосредоточились на преобразовании искусственного интеллекта в практические средства, которые должны улучшить человеческую жизнь. Мы не только применяем глубокое обучение в таких областях, как распознавание речи, машинный перевод и распознавание номеров домов и улиц, но и успешно используем технологию для того, чтобы усовершенствовать пользовательский опыт.

В 2013 году мы выпустили в мир Baidu Navigator – первый китайский навигатор, доступный для обычных пользователей. Они могут использовать технологии позиционирования и решения от Baidu Maps, чтобы сэкономить значительное количество ресурсов в сравнении с традиционным GPS-трекером. Курьерская компания может использовать программу для планирования оптимального маршрута доставки. У разработчиков игр появилась возможность создавать такие игры, как PokemonGo. Мы открываем Baidu для того, чтобы люди могли использовать его глаза и уши в своих интересах. Мы открываем платформу глубокого обучения PaddlePaddle, чтобы больше людей могли создавать собственные сервисы с функциями ИИ. Мы хотим, чтобы самый неосведомленный в технических новинках и средствах человек научился использовать данные и оптимизировал свою работу, подчеркнул свою индивидуальность и продолжил двигаться к своим мечтам и идеалам.

Многие абитуриенты, кажется, используют приложения-ассистенты для того, чтобы помочь себе выбрать экзамены для поступления в колледж в соответствии с интересами. В Китае многие прибегают к этой технологии. В мои годы учебы люди называли вступительные экзамены «изнурительным мостом». Приложения-ассистенты с технологией глубокого обучения, подобно картографическим данным, реагируют на желания и тревоги кандидатов и стараются дать свой точный ответ. Здесь искусственный интеллект записывает не траекторию движения в физическом пространстве, а психическую траекторию роста студентов.

В начале 1990-х я отправился в Америку изучать компьютерные технологии. В то время многие молодые люди с желанием менять мир с помощью кода путешествовали между Китаем и США, как птицы. Сейчас было бы интересно взглянуть на карту этих трансокеанских перемещений. Теперь, когда ученые, занимающиеся развитием ИИ, вернулись на родину, я думаю, что пламя технологий будущего разгорится с новой силой. Потому что в Китае достаточно необходимого топлива. Огромное количество образованного населения, быстрое распространение компьютеров и мобильных устройств, большое количество данных дают Китаю уникальные преимущества в развитии и применении технологий глубокого обучения. С этими преимуществами мы можем создать легендарное войско исследователей по аналогу Кремниевой долины 90-х.

Baidu должен не просто создать передовую разработку в сфере ИИ. Но и обеспечить функциональную инфраструктуру для перемещения и обработки данных пользователей и платформу для развития технологии глубокого обучения. Мы должны стать сетью для сбора человеческой мудрости.

До того, как Трамп был избран президентом США, более ста человек из числа элиты Кремниевой долины опубликовали открытое письмо. В нем заявлялось, что избрание Трампа будет катастрофой для инноваций. Это затронуло бы и меня, если бы американские инновации действительно пострадали. Кто возьмет флаг, чтобы возглавить инновационное направление? Можем ли мы открыть инновационный центр мира Кремниевой долины для Китая?

Да, к нам стекаются таланты. Baidu основал лабораторию в Кремниевой долине, которая открыла нам доступ к американским талантам. План китайского мозга, предложенный Baidu, сопоставим с любым суперпроектом.

Вспомните, 70 лет тому назад ведущие ученые были полны решимости возвратиться из-за рубежа, чтобы реализовать в Китае грандиозный проект.

Конечно, следует отметить, что великий проект той эпохи опирался на Национальную инвестиционную и промышленную политику. После окончания «холодной войны» конкурентное давление в стране уменьшилось, а инвестиции в передовые технологии значительно сократились. Маск отправился на разработку ракеты, но на самом деле страна передала ему ракетные технологии и команду НАСА. В Китае решимость и правительственные инвестиции по-прежнему сильны. А развитие промышленности концентрируется на сфере искусственного интеллекта. Это лучшая и в то же время самая неопределенная эпоха. Искусственный интеллект – это способ приспособиться к неопределенности. Крупные и малые компании инвестируют в исследования и разработки в области ИИ, чтобы обеспечить конкуренцию и диверсификацию. Они, в свою очередь, должны спровоцировать рост и усиление сотрудничества.

Развитие искусственного интеллекта приведет к неопределенности. Доклад Белого дома уже обращает внимание на влияние искусственного интеллекта на занятость. Стремительное развитие Кремниевой долины в США и упадок Центрального обрабатывающего сектора усилили раскол в стране. Некоторые пользуются достижениями прогресса, другие – выброшены с передовых судов и потеряли направление. Для того, чтобы превратить Baidu в ковчег талантов, нужно мотивировать китайские предприятия к созданию этого ковчега. Важно осознавать, что мы вступаем в новую интеллектуальную эпоху.

Вице-президент Baidu, доктор Ван Хайфэн в ноябре 2016 года был избран членом ACL (Association for Computational Linguistics, International Computing linguistics Society). В настоящее время он является самым молодым членом Ассоциации. Комитет по отбору написал: «Господин Ван достиг выдающихся достижений в области машинного перевода, обработки естественного языка и поисковых технологий в академических и промышленных кругах. А также внес значительный вклад в развитие ACL в Азии». В начале 2017 года известные ученые и руководители в области искусственного интеллекта присоединились к Baidu. Это свидетельствует о тенденции к международной мобильности талантов. Сотни выдающихся ученых, работающих в области искусственного интеллекта в Китае, собираются вместе, чтобы строить будущее человечества.

Будущее пришло: тревоги и мечты

Не так давно появление «бескассового супермаркета» Amazon спровоцировало взрыв в сфере шопинга, или процесса совершения покупок. За опытом Amazon виднеется всего лишь тень «ИИ-кассира». Сегодня обслуживание клиента человеком заменено онлайн-сервисом. Стенографический перевод – распознаванием голоса. Даже кассиры, водители, работники фабрик и юристы заменены искусственным интеллектом. Как люди выживают в этом мире? Как правительства и предприятия должны поддерживать работников? Как мы должны адаптировать экономические, социальные, экологические институты к эпохе ИИ? Мы должны прислушиваться к потребностям обычных людей. И это то, чему наша команда решила посвятить данную книгу.

В Кремниевой долине есть гирлянда с Питером Тилем, сделанная Марком Андерсоном. Он является основателем PayPal, хорошо разбирается в технологии глубокого обучения и часто заслуживает в свой адрес определение – «темная лошадка». В 2016 году он снова оказался в центре внимания за свое точное предсказание, что Трамп будет избран президентом США. В 2011 году он сказал: «Нам нужны летающие автомобили, а вместо этого у нас всего 140 символов». 140-символьный Twitter когда-то был очень веселым, но Питер Тиль ясно видел, чего не хватает. Он критиковал людей за замедление прогресса, за культуру хиппи, за инвестиции в компании со светлыми активами, но без четкого планирования и уверенности в завтрашнем дне. Большинство подобных компаний – мобильные интернет-компании, такие как Airbnb, Uber и т. д. Он считал, что бит-уровень интернет-эры человечества сделал значительный шаг вперед, а атомный уровень практически остановился в развитии. Поэтому он инвестировал в ракеты, препараты для борьбы с онкологией и в искусственный интеллект.