banner banner banner
Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google
Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google
Оценить:
 Рейтинг: 0

Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google


Второй – это машины с когнитивными способностями, которые подобны человеческим. Машины могут «видеть», «слушать», «чувствовать», могут все больше рассуждать и планировать, могут двигаться благодаря сенсорному управлению движения. Мы называем этот тип системы искусственного интеллекта «когнитивной интеллектуальной системой» (когнитивный AI). Это машина со способностями восприятия, рассуждения, планирования и сенсорным управлением движения.

К другой классификации системы искусственного интеллекта относятся «узкий ИИ» и «Общий AI». «Общий AI» – это система, которая использует один и тот же алгоритм для решения большого класса задач. Система «обобщенного ИИ» может быть изучена и адаптирована для решения новых задач без вмешательства человека. Система «узкий AI» использует определенный алгоритм для решения конкретных задач, таких как игра в шахматы, создание карт и т. д.

Таблица 2-1 представляет собой обзор состояния системы искусственного интеллекта. И может служить жизнеспособным определением.

Таблица 2-1

Интеллектуальные вычислительные системы напрямую связаны с большими данными. Любые данные имеют критерии, по которым они генерируются. В основе данных лежит знание.

Основная компетенция универсальной системы искусственного интеллекта заключается в извлечении знаний из данных с помощью алгоритмов и вычислительных систем. После того, как мы получим знания, мы можем сделать множество вещей. Мы можем предсказывать явления и события, можем решить проблему автоматизации, можем решить любую проблему, которая нуждается в решении. Знание говорит нам, чего хотят люди, чего требует общество. Со знанием мы можем найти ответ. Таким образом, первый уровень развития искусственного интеллекта – общий искусственный интеллект.

Прорыв в глубоком обучении, достигнутый в последние годы, касается уровня восприятия. В частности, распознавания изображений и речи, а также понимания естественного языка. Но это только начало. Следующее, что нужно сделать, это добавить познавательную функцию. Система должна научиться познавать окружающий мир через свет, вибрацию звука или язык общения и символы.[5 - За последние несколько лет нейросети научились понимать, что за объекты находятся на фотографии и как они взаимойдействуют друг с другом. Например, чашка стоит на столе, а ложка находится внутри чашки. В экспериментальных сетях достигнут и обратный эффект: по текстовому описанию нейросеть способна воссоздать изображение, например женщину, едущую на лошади по лугу. – Прим. науч. ред.] Самое главное – понять, что это значит. Система видит перед собой картину и может определить, какие объекты или люди в ней находятся и что делают.

В настоящее время почти все компании, которые занимаются разработкой ИИ, могут быть размещены в четырех квадрантах. Большинство компаний создают «узкий AI», который решает только одну проблему или несколько относительно узких: играть в карты или открыть автомобиль. «Общий ИИ» использует одну и ту же систему, для решения всех проблем. И это уже похоже на человеческий интеллект. «Общий ИИ» – это долгосрочная цель развития искусственного интеллекта, достижение которой займет не менее двадцати-тридцати лет. Baidu, Google, Microsoft, Facebook и другие компании работают в направлении «общего AI». И они способны судить, может ли человек с помощью искусственного интеллекта знать больше, делать больше, испытывать больше. Например, компания Baidu, опираясь на данные поисковых систем, провела большое количество технических исследований, прежде чем создать практически невозможное – продукт, который опирается на мнения людей. Мы нашли множество беспрецедентных знаний и сделали множество выводов. Благодаря этому сейчас люди знают больше. Но мы не остановились и продолжаем двигаться вперед, чтобы добиться более невозможного. Беспилотные технологии управления, технологии взаимодействия на естественном языке, сенсорные методы движения постоянно совершенствуются. Сейчас люди используют глаза, чтобы видеть, и уши, чтобы слышать. Но, возможно, в будущем нам не понадобятся ни глаза, ни уши, потому что у нас появится более совершенный способ восприятия реальности.

Таким образом, все компании в сфере ИИ можно оценить по нескольким вопросам: Какой из четырех квадрантов занимает компания? Есть ли у нее силы и средства, чтобы люди с машинами знали больше, делали больше, испытывали больше?

В США и Китае существует множество компаний, которые утверждают, что они занимаются развитием искусственного интеллекта. Некоторые из них говорят, что ИИ – это облачные вычисления. Другие, что ИИ – это большие данные. Но это лишь часть системы искусственного интеллекта. Сила искусственного интеллекта – это массивы данных, облачные вычисления, алгоритмы, время обучения и общая мощность, а также программное и аппаратное обеспечение.

Такую силу невозможно собрать в одночасье. И не имеет смысла обобщать. На Земле нет одной дороги. Есть разные пути. Есть разные сайты, люди, бизнесы. Кто-то из них только начал движение, а кто-то оставил за спиной уже внушительную часть пути.

Baidu Brain можно рассматривать как типичную силу искусственного интеллекта. Его способность к разделению может подчеркнуть нашу состоятельность в индустрии искусственного интеллекта. Если у компании, специализирующейся на продуктах с ИИ, нет возможностей в будущем, можно сказать, что она не готова войти в эту сферу.

Baidu Brain – это сочетание аппаратной базы, базы данных и алгоритмических возможностей, облачных вычислений, больших данных и искусственного интеллекта. Это сочетание является основой стратегии Baidu. Облачные вычисления – это инфраструктура. Массивы данных – это топливо. Искусственный интеллект – это двигатель, объединяющий «физику интернета», интернет-технологии и бизнес-модели цифрового мира. Он входит в общество, чтобы полностью его изменить.

Облачные вычисления, имя в облаке – это нижняя составляющая мозга Baidu, физическая его часть IaaS (Infrastructure as a Service, инфраструктурные услуги).

Супервычислительная мощность Baidu Brain достигается за счет высокопроизводительного вычислительного оборудования. Оно составляет сотни тысяч серверов и использует передовые кластерные операционные системы для унифицированного управления суперкомпьютерами ИИ.

Для того, чтобы расширить возможности обучения, Baidu самостоятельно разработал GPU и FPGA (Программируемая пользователем вентильная матрица) гетерогенный вычислительный сервер. Он был увеличен до 64 GPU / FPGA и превосходит традиционную плотность сервера в 16 раз. Один сервер теперь может завершить обучение 100 миллиардов моделей данных. В основе Baidu FPGA находится процессор, обеспечивающий 10 Tops[6 - Триллион операций в секунду – Прим. науч. ред.] вычислительной производительности. Он превосходит основной 20-ядерный сервер по вычислительной эффективности в 60 раз.

Но преимущество Baidu не только в одной машине, но и в отличной системе, отличной индивидуальной интеграции. Это формирует широкий спектр возможностей. Интеллектуальное планирование и система управления ресурсами для кластеров GPU позволяют осуществлять управление и динамическое планирование вычислительных, сетевых пулов, а также ресурсов хранения, вычислять общую эффективность и среднее использование кластера на 80 %. Гетерогенное оборудование для онлайн-продуктов, уменьшающее задержки запросов пользователей в 5 раз, повышает эффективность вычислений в десятки раз.

Система представляет собой самый большой кластер GPU/FPGA в Китае, самый большой кластер HADOOP/SPARK – новая одновременная и самая эффективная технология обработки данных (новые вычислительные технологии, серверные технологии, технология доступа 100G RDMA (дистанционная мгновенная технология доступа к данным) и технология O&M). Она обеспечивает вычислительную мощность, необходимую для развития искусственного интеллекта.

Топлива тоже достаточно. За годы работы в сфере ИИ компания Baidu собрала большое количество данных: триллион данных по страницам, миллиарды данных поисковой системы, 10 миллиардов видео, 10 миллиардов изображений и аудиоданных. Данные – это топливо для алгоритмов искусственного интеллекта. Это одно из основных условий развития искусственного интеллекта.

Оборудование в сочетании с топливом является отличным алгоритмом и моделью развития. Baidu собрал команду ведущих мировых ученых и инженеров, специализирующихся на теории и практике непрерывных инноваций, построил крупнейшую в мире глубокую нейронную сеть, поддерживающую триллионы параметров, сотни миллиардов образцов, сотни миллиардов характеристик обучения. Глубина нейронной сети значительно превысила 100 слоев.

Аппаратные мощности, топливо из данных и душа, алгоритм, позволили создать Baidu PaaS (Platform as a Service). Отличительной особенностью Baidu PaaS является то, что ИИ – горизонтальный сервис для всей платформы. Глубокое обучение, технологии машинного обучения в сочетании с мощными вычислениями, массивные данные и отличные алгоритмы, голос, изображения, обработка естественного языка и другие аспекты создают уникальные возможности для разработки карт знаний, портретов пользователей и бизнес-логики. Кроме того, они полностью открыты для пользователей. Пользователи могут легко использовать различные модули алгоритма, инструменты разработки, данные для своих собственных бизнес-целей. Мы используем различные платформы для разных целей: Tianji – для интеллектуальных массивов данных, Tianxiang – интеллектуальных мультимедиа, Tiangong – интеллектуальных вещей. Так, у нас есть возможность оказывать услуги во всех трех областях.

На верхнем уровне SaaS (Software as a Service) искусственный интеллект Baidu используется для принятия вертикальных решений, проникающих во все отрасли. Мы стремимся работать с нашими партнерами над созданием интеллектуальной индустриальной экосистемы, куда войдут образовательное облако, финансовое облако, транспортное облако, логистическое облако и т. д. Мы считаем, что способность строить экологию интеллектуальной промышленности – важный критерий для определения ценности искусственного интеллекта.

В аппаратных мощностях, данных и алгоритмах есть один важный пункт – культура искусственного интеллекта, или «мягкая сила». Технология поиска стала пионером в сфере искусственного интеллекта и первым интернет-порталом цифрового мира. Процесс разработки и технологическое ядро поисковой системы заложили основу для будущего ИИ. Поисковые системы, во-первых, должны были иметь дело с очень большими объемами данных. Во-вторых, должны были обладать функциями глубокого обучения. Операции невозможно совершать вручную, так как объем данных был и остается слишком велик. И, наконец, ключевой момент. Процесс разработки поисковых систем согласуется с развитием систем искусственного интеллекта, в основном с данными, которые представляют ценность для пользователя. Отношения сотрудничества, деловые возможности и рабочие привычки, массивы данных и накопление корпоративной культуры людей из бизнеса поисковых систем очень схожи с бизнесом ИИ. Так Лу Цзи всегда начинал обучать новичков с Bing. Справился там, справишься и в любом другом секторе. В поиске используются очень простые методы. Конечно, культура еще не идеальна. Но она, как и нейронные сети, может развиваться и совершенствоваться при правильном подходе.

Искусственный интеллект + мир

Раньше люди активно обсуждали плюсы интернета. А теперь переключились на плюсы искусственного интеллекта в бизнесе, промышленности, здравоохранении, образовании и так далее. С точки зрения «знай больше, делай больше, испытывай больше», ИИ для мира будущего является фундаментальным явлением. Так появился вопрос – «искусственный интеллект + мир».

Во-первых, интеллектуальная революция может иметь далеко идущие последствия для повседневной жизни каждого человека. Самый простой пример – благодаря новаторским разработкам в области искусственного интеллекта, калькулятор и человек смогут разговаривать на одном языке.

Предыдущие взаимодействия человека и машины происходили через мышь и клавиатуру. Развитие Майкрософт позволило усовершенствовать способ коммуникации. Сегодня мы общаемся через мышь, клавиатуру и GUI (графический интерфейс пользователя), что называется рациональным взаимодействием человека и компьютера. Самый большой вклад компании Apple и Стива Джобса в развитие IT-технологий – это новый способ общения с машинами с помощью пальцев, который изменил мир. В эру искусственного интеллекта мир постоянно меняется. Теперь люди могут общаться с любым устройством на естественном языке.

Естественный язык является наиболее эффективной и универсальной формой общения. Общение между людьми – это язык, самый естественный и широко используемый. Реализация взаимодействия между человеком и компьютером на естественном языке означает, что людям не нужно будет разбираться в принципах работы каждого приложения и устройства, чтобы узнать, как им пользоваться. В будущем мы сможем общаться с автомобилями и домами напрямую.

Мы уже видели зачатки этого интеллектуального взаимодействия. Например, постепенно появляются некоторые интеллектуальные вспомогательные системы. В Соединенных Штатах люди с помощью Amazon превращают дом в умную систему. В Китае команда Baidu тоже провела много исследований в этой области. У нас есть возможность полностью изменить повседневный процесс взаимодействия людей друг с другом.

Наконец, искусственный интеллект станет двигателем новой промышленной революции. Многие люди задумываются о новой версии промышленного производства 4.0. Вступит ли мир в следующий этап цифрового общества? Интеллектуальные системы будут иметь возможность черпать данные из реальной жизни, перемещаться по знаниям. Этим они помогут людям воспринимать и познавать реальный мир. И внедрять изменения в экономические, социальные, культурные и другие аспекты жизни. Нам повезло жить в увлекательной эре, очень похожей на раннюю промышленную революцию. Но искусственный интеллект имеет гораздо большее влияние на общество.

Традиционная обрабатывающая промышленность (оборудование, электроприборы и электроэнергетика, производственные линии) использует очень крупные инвестиции для создания продукта, изменение которого вызывает известные сложности. Например, чтобы создать производственную линию автомобилей, потребуется внушительное количество времени и средств. Умные данные смогут точно предсказать конец завершения преобразования обрабатывающей промышленности и создать новую модель производства. Производство будущего – модульный процесс с цифровым управлением. Если автопроизводитель захочет создать новый тип автомобиля, ему не потребуется перестраивать производственные линии. Нужно будет всего лишь изменить интерфейс (API) для нового продукта и перейти на него. Это в корне изменит производственную базу и значительно улучшит эффективность производства.

В основе этого изменения лежат данные и знания, а именно знание процесса производства. Теперь каждый шаг можно будет контролировать с помощью цифровых технологий.

Приведем пример из фармацевтической промышленности. Создание нового лекарственного препарата – это длительный процесс исследований и разработок, чтобы выявить наиболее эффективный способ для борьбы с конкретным заболеванием. В будущем с помощью вычислительных технологий искусственного интеллекта, больших генетических данных и массивного анализа информации о здоровье человека индивидуальный подбор лекарств будет осуществляться в считанные минуты.

Рис. 2-1 Стремительный рост геномных данных[7 - Великобритания запустила «геномную программу 100 000 человек» в 2014 году, а США и Китай объявили о завершении сбора геномных данных до 1 миллиона человек. Данные, полученные всемирно известной компанией по секвенированию генов Illumina Instruments sequencing, удваиваются каждые 12 месяцев. Это огромная «черная дыра данных», а также золотодобывающая шахта данных.]

Искусственный интеллект не только повышает общую конкурентоспособность Китая на мировой арене, но и дает ему существенные преимущества. КНР – крупный игрок в обрабатывающей промышленности, где объем данных имеет большое значение. Это означает, что у нас есть возможность извлечь больше «знаний» и получить лучший результат, чем у других. Вы знаете больше, чем кто-либо другой. Видите больше, чем кто-либо другой. Можете сделать больше, чем кто-либо другой. Вы сильнее, чем кто-либо другой. Интеллектуальная эпоха, национальная конкуренция, промышленная конкуренция, овладение большими объемами информации может сделать тебя непобедимым. Если бы Китай воспользовался этой возможностью и завершил интеллектуальную модернизацию, другие страны не смогли бы с ним конкурировать. Но то, как достичь умного производства, требует общего стратегического анализа.

Преимущества Китая

В настоящее время США и Китай являются двумя крупнейшими странами с точки зрения искусственного интеллекта.

Люди привыкли сравнивать Baidu и Google, что также можно рассматривать как уменьшенную копию сравнения США с Китаем. Я думаю, что у обеих компаний есть много общего – происхождение, корпоративная культура. Baidu имеет преимущество в Китае, а Google – в США.

Но есть и отличия. У Baidu больше пространства для инноваций и выше их скорость, чем у Google. Это связано с национальными условиями Китая и США.

Уровень инноваций мобильного интернета в Китае на многих уровнях превзошел уровень инноваций в США.

Например, создание инновационного мобильного телефона с функциями искусственного интеллекта для поиска информации. Baidu имеет больше возможностей для инноваций, чем Google. IT-отрасли в США и Китае имеют разные модели. Baidu Financial может опираться на преимущества китайского рынка и объемы данных и, используя технологию ИИ, создать нечто революционное. В Соединенных Штатов финансовая индустрия имеет «сильные барьеры», поэтому Google попасть в финансовый сектор проблематично.

Другой пример – беспилотные автомобили. Google и Baidu пионеры в этом направлении. Сейчас Google немного обогнал Baidu. Но не факт, что это будет долго длиться. Сегодня множество китайских автопроизводителей открыты для сотрудничества с предприятиями ИИ, в частности с Baidu. Вместе у нас очень много возможностей для нововведений. И скорость таких нововведений будет значительно быстрее, чем у США. В Америке большинство автопроизводителей располагаются в Детройте, поэтому им сложно наладить коммуникацию с компаниями в сфере ИИ.

Беспилотный ли это автомобиль, финансы, здравоохранение или производство вообще, Китай и Соединенные Штаты смотрят на будущее под одним углом. Тем не менее макросреда в Китае дает умным компаниям, как Baidu, больше возможностей и пространства для действий, чем США для Google.

Итак, какую же ответственность должна взять на себя компания Baidu в условиях новой эры искусственного интеллекта?

В Соединенных Штатах система IT-индустрии, как правило, зависит от пяти компаний: Apple, Google, Facebook, Amazon, Microsoft. Компания, поддерживающая ИИ, – это не просто производственная компания. Это компания, которая управляет развитием технологий и играет роль лидера экосистемы.

В эпоху искусственного интеллекта Baidu является компанией поддержки. У нас есть такая возможность. Поэтому мы должны продолжать бороться за интеллектуальную революцию в Китае и в мире и внести свой вклад в это непростое дело.

Чтобы стать первопроходцами и основателями, мы должны позиционировать себя как «наделенные полномочиями». Baidu – это, прежде всего, китайский мозг Baidu. Интеллектуальное облако Baidu доступно для всех отраслей промышленности и для любой открывает широкие возможности для движения вперед.

Как основоположник отечественного искусственного интеллекта, Baidu имеет влияние на развитие и совершенствование во многих отраслях сферы искусственного интеллекта.

Например, здравоохранение и образование – очень большая область применения ИИ. Здесь особенно ярко наблюдается проблема недостатка данных. Знания и опыт могут быть только приобретены и накоплены. Поэтому высокую квалификацию имеют старые учителя и врачи. В будущем с помощью машин мы сможем автоматически анализировать данные, помогая тем самым врачам упростить подбор медикаментов, а учителям найти индивидуальный подход к каждому ученику. Здравоохранение станет давать людям больше здоровья, а образование – знаний. В обеих областях применение ИИ будет играть существенную роль.

Или беспилотные автомобили, например. Создание дронов также опирается на восприятие, познание и знание. Сегодня введение беспилотных автомобилей в эксплуатацию еще не представляется возможным и требует времени[8 - Несмотря на возросшую активность за последние годы, даже передовые проекты с беспилотными такси не допускают перемещение авто по городу без оператора внутри, пусть и не на водительском кресле. – Прим. науч. ред.]. Но как только мы этого достигнем, у общества откроются огромные перспективы для трансформации. Это не просто решение транспортной проблемы. Беспилотная машина может двигаться сама по себе. И это скажется во всех отраслях промышленности.