Глоссариум по искусственному интеллекту: 2500 терминов. Том 1

Метрики API (Application Programming Interface или интерфейс программирования приложений) (tf. metrics) TensorFlow – это функция для оценки моделей. Например, tf.metrics.accuracy определяет, как часто прогнозы модели соответствуют меткам.

Механизм внимания (Attention mechanism) – это одно из ключевых нововведений в области нейронного машинного перевода. Внимание позволило моделям нейронного машинного перевода превзойти классические системы машинного перевода, основанные на переводе фраз. Основным узким местом в sequence-to-sequence обучении является то, что все содержимое исходной последовательности требуется сжать в вектор фиксированного размера. Механизм внимания облегчает эту задачу, так как позволяет декодеру оглядываться на скрытые состояния исходной последовательности, которые затем в виде средневзвешенного значения предоставляются в качестве дополнительных входных данных в декодер.

Механизм логического вывода (Inference engine) – это составная часть системы, которая применяет логические правила к базе знаний, чтобы вывести новую информацию. Первые механизмы вывода были компонентами экспертных систем. Типичная экспертная система состоит из базы знаний и механизма вывода. В базе знаний хранятся факты об окружающем мире. Механизм вывода применяет логические правила к базе знаний и выводит новые знания. [[55 - Механизм логического вывода [Электронный ресурс] //ru.wikipedia.org URL: https://ru.wikipedia.org/wiki (https://ru.wikipedia.org/wiki) (дата обращения: 07.07.2022)]]

Мехатроника (Mechatronics) – это наука, которая существует на стыке механики, электроники, машиностроения, вычислительной техники и электронного управления. Это одна из наиболее динамично развивающихся областей техники и науки. Слово «мехатроника» был введен в техническую терминологию японской компанией Yaskawa Elektric Corporation в 1969 году (компания, основанная в 1915 г.) и с 1971 г. охраняется как торговое наименование.

Микроданные(Microdata) – это файлы, которые содержат информацию об отдельных лицах, а не агрегированные данные. «Сводные файлы» Бюро переписи населения США содержат совокупные данные и состоят из общего числа лиц с различными указанными характеристиками в определенной географической области. Это, в некотором смысле, таблицы итогов. Однако файлы Бюро PUMS (выборка микроданных для общественного пользования) содержат данные из исходного инструмента обследования переписи, при этом определенная информация удалена для защиты анонимности респондента.

Минимаксные потери (Minimax loss) – это функция потерь в машинном обучении для порождающих состязательных сетей, основанная на перекрестной энтропии между распределением сгенерированных данных и реальными данными. Минимакс является алгоритмом принятия решений в области искусственного интеллекта, теории принятия решений, теориях игр, статистике и философии для минимизации возможных потерь. [[56 - Минимаксные потери [Электронный ресурс] //mcs.mail.ru URL: https://dev.abcdef.wiki/wiki/Minimax (https://dev.abcdef.wiki/wiki/Minimax) (дата обращения: 07.07.2022)]]

Минимизация структурных рисков (Structural risk minimization, SRM) – это индуктивный принцип использования в машинном обучении. Обычно в машинном обучении обобщенная модель должна быть выбрана из конечного набора данных, что приводит к проблеме переобучения – модель становится слишком строго адаптированной к особенностям обучающего набора и плохо обобщается для новых данных. Принцип SRM решает эту проблему, уравновешивая сложность модели с ее успехом в подборе обучающих данных. Этот принцип был впервые изложен в статье 1974 года Владимира Вапника и Алексея Червоненкиса.

Минимизация эмпирического риска(МЭР) (Empirical risk minimization) – это принцип статистической теории обучения, который определяет семейство обучающихся алгоритмов и который задаёт теоретические границы результативности.

Мини-пакет (Mini-batch) – это разбиение большого объема данных для обучения на пакеты, каждый из которых называется мини-пакетом, для дальнейшей пакетной обработки. Размер мини-пакета обычно составляет от 10 до 1000 единиц. Гораздо эффективнее вычислять потери по мини-пакету, чем по полным данным обучения.

Мини-пакетный градиентный спуск (Mini-batch stochastic gradient descent) – это метод оптимизации, используемый для вычисления параметров модели (коэффициентов и смещения) для таких алгоритмов, как линейная регрессия, логистическая регрессия, нейронные сети и т. д. Мини-пакетный градиентный спуск – оптимальное, сбалансированное решение между надежностью стохастического градиентного спуска и эффективностью пакетного градиентного спуска. Это наиболее распространенная реализация градиентного спуска, используемая в области глубокого обучения.

Многозадачное обучение (Multitask learning) – это общий подход, при котором модели обучаются выполнению различных задач на одних и тех же параметрах. В нейронных сетях этого можно легко добиться, связав веса разных слоев. Идея многозадачного обучения была впервые предложена Ричем Каруаной в 1993 году и применялась для прогнозирования пневмонии, а также для создания системы следования дороге на беспилотных устройствах (Каруана, 1998). Фактически при многозадачном обучении модель стимулируют к созданию внутри себя такого представления данных, которые позволяет выполнить сразу много задач. Это особенно полезно для обучения общим низкоуровневым представлениям, на базе которых потом происходит «концентрация внимания» модели или в условиях ограниченного количества обучающих данных. Многозадачное обучение нейросетей для обработки естественного языка было впервые применено в 2008 году Коллобером и Уэстоном (Collobert & Weston, 2008) [[57 - Многозадачное обучение [Электронный ресурс] // https://ai-news.ru. URL: https://ai-news.ru/2019/07/8_glavnyh_proryvov_v_nejrosetevom_nlp.html (https://ai-news.ru/2019/07/8_glavnyh_proryvov_v_nejrosetevom_nlp.html) (дата обращения: 04.08.2022)]].

Многоклассовая логистическая регрессия (также называемая полиномиальной логистической регрессией) (Multi-class logistic regression) – это алгоритм бинарной логистической регрессии (два класса) расширенной на многоклассовые случаи. В мультиклассовой логистической регрессии классификатор можно использовать для прогнозирования нескольких результатов.

Многомерная система(Multidimensional system) или м-Д система – это система, в которой существует не только одна независимая переменная (как время), а несколько независимых переменных.

Многослойная нейронная сеть (многослойный персептрон) (Multilayer neural network) – это сети, в которых нейроны сгруппированы в слои. При этом каждый нейрон предыдущего слоя связан со всеми нейронами следующего слоя, а внутри слоёв связи между нейронами отсутствуют. Слои нумеруются слева направо. Первый слой называют входным или распределительным. Его нейроны (которые также называют входными) принимают элементы вектора признаков и распределяют их по нейронам следующего слоя. При этом обработка данных во входном слое не производится. Последний слой называется выходным. На выходах его нейронов (они называются выходными) формируется результат работы сети – элементы выходного вектора. Между входным и выходным слоем располагаются один или несколько промежуточных или скрытых слоёв. Скрытыми они называются по тому, что их входы и выходы неизвестны для внешних по отношению к нейронной сети программам и пользователю. [[58 - Многослойная нейронная сеть [Электронный ресурс] //wiki.loginom.ru URL: https://wiki.loginom.ru/articles/multilayer-neural-net.html (https://wiki.loginom.ru/articles/multilayer-neural-net.html) (дата обращения: 07.07.2022)]]

Многослойный персептрон (МЛП, Multilayer Perceptrons, MLP)) – это одна из наиболее распространенных моделей нейронных сетей, разновидность искусственной нейронной сети используемых в области глубокого обучения и состоящей как минимум из трех слоев узлов: входного слоя, скрытого слоя и выходного слоя. МЛП, которую часто называют «ванильной» нейронной сетью, проще, чем сложные современные модели.

Мобильное здравоохранение (Mobile healthcare, mHealth) – это ряд мобильных технологий, систем, сервисов и приложений, установленных на мобильных устройствах и использующихся в медицинских целях и для обеспечения здорового образа жизни человека и мотивации людей к здоровому образу жизни и формированию новой «цифровой» культуры здоровья.

Модальность (Modality) – это функционально-семантическая категория, выражающая отношение высказывания к действительности, способ существования объекта или протекания явления либо способ понимания, суждения об объекте или явлении способ организации многооконного интерфейса программы, при котором одно из окон монопольно владеет фокусом пользовательского внимания способ образования ладов (модусов) на основе общего звукоряда путём перемещения. Категория данных высокого уровня. [[59 - Модальность [Электронный ресурс] //vslovarike.ru URL: https://vslovarike.ru/ (https://vslovarike.ru/) (дата обращения: 07.07.2022)]]

Модель (Model) применительно к машинному обучению – это файл, обученный распознавать определенные типы шаблонов. Вы обучаете модель на наборе данных, предоставляя ей алгоритм, который она может использовать для рассуждений и извлечения уроков из этих данных. После того, как вы обучили модель, вы можете использовать ее для анализа данных, которые она раньше не видела, и делать прогнозы относительно этих данных.

МодельLaMDA (LaMDA) – это языковая модель для диалоговых приложений, новая технология Google для обработки диалоговой речи. модель LaMDA разработана Google как открытое приложение для разговорного ИИ. Она берет на себя роль человека или аватара во время разговоров с пользователями.

Модель вероятностной регрессии (Probabilistic regression model) – это модель регрессии, в которой используются не только веса для каждого признака, но и неопределенность этих весов. Модель вероятностной регрессии генерирует прогноз и неопределенность этого прогноза.

Модель классификации (Classification model) – это тип модели машинного обучения для различения двух или более дискретных классов. Например, модель классификации обработки естественного языка может определить, было ли входное предложение французским, испанским или итальянским.

Модель мешка слов (Bag-of-words model) – это упрощающее представление, используемое при обработке естественного языка и поиске информации (IR). В этой модели текст (например, предложение или документ) представляется в виде набора (мультимножества) его слов без учета грамматики и даже порядка слов, но с сохранением множественности. Модель мешка слов также использовалась для компьютерного зрения. Модель мешка слов обычно используется в методах классификации документов, где (частота) появления каждого слова используется в качестве признака для обучения классификатора.

Модель мешка слов в компьютерном зрении (Bag-of-words model in computer vision) – в компьютерном зрении эту модель (модель BoW) можно применять для классификации изображений, рассматривая признаки изображения как слова. В классификации документов набор слов представляет собой разреженный вектор количества встречаемости слов; то есть разреженная гистограмма по словарному запасу. В компьютерном зрении набор визуальных слов представляет собой вектор количества встречаемости словаря локальных признаков изображения.

Модель от последовательности к последовательности (Sequence-to-sequence model, seq2seq). Самая популярная задача на последовательность – это перевод: обычно с одного естественного языка на другой. За последние пару лет коммерческие системы стали на удивление хороши в машинном переводе – взгляните, например, на Google Translate, Yandex Translate, DeepL Translator, Bing Microsoft Translator. Сегодня мы узнаем об основной части этих систем.

Модель последовательности (Sequence model) – это модель, входы которой имеют последовательную зависимость. Например, предсказание следующего видео, просмотренного на основе последовательности ранее просмотренных видео.

Модель регрессии (Regression model) – это тип модели, которая выводит непрерывные значения (обычно с плавающей запятой).

Модель убеждений, желаний и намерений (Belief-desire-intention software model) – это модель программирования интеллектуальных агентов. Образно модель описывает убеждения, желания и намерения каждого агента, однако непосредственно применительно к конкретной задаче агентного программирования. По сути, модель предоставляет механизм позволяющий разделить процесс выбора агентом плана (из набора планов или внешнего источника генерации планов) от процесса исполнения текущего плана, выбранного ранее. Как следствие, агенты, повинующиеся данной модели способны уравновешивать время, затрачиваемое ими на выбор и отсеивание будущих планов со временем исполнения выбранных планов. Процесс непосредственного синтеза планов (планирование) в модели не описывается и остаётся на откуп программного дизайнера или программиста.

Модель Generative Pre-trained Transformer (Generative Pre-trained Transformer) – это семейство больших языковых моделей на основе Transformer, разработанных OpenAI. Варианты GPT могут применяться к нескольким модальностям, в том числе: • генерация изображений (ImageGPT) • преобразование текста в изображение (DALL-E).

Модули векторной обработки (Intelligent Engines) – это поле выполнения операций умножения с плавающей запятой с минимальными задержками (DSP Engines) и специализированное поле/модуль AI Engines c высокой пропускной способностью, а также минимальными задержкам на выполнение операций и оптимальным уровнем энергопотребления, предназначенное для решения задач в области реализации искусственного интеллекта (AI inference) и цифровой обработки сигналов.

Модус поненс(Modus ponens) – это правило логики, которое позволяет вам применять операторы «если-то» для получения части «тогда» всякий раз, когда часть «если» удовлетворяется.

Модус толленс (Modus Tollens) – это форма дедуктивного аргумента и правило логики, используемое для выводов из аргументов и наборов аргументов. Modus tollens утверждает, что если P истинно, то Q также истинно. Если P ложно, следовательно, Q также ложно.

Мозговая технология (также самообучающаяся система ноу-хау) (Brain technology) – это технология, в которой используются последние открытия в области неврологии. Термин был впервые введен Лабораторией искусственного интеллекта в Цюрихе, Швейцария, в контексте проекта ROBOY. Brain Technology может использоваться в роботах, системах управления ноу-хау и любых других приложениях с возможностями самообучения. В частности, приложения Brain Technology позволяют визуализировать базовую архитектуру обучения, которую часто называют «картами ноу-хау».

Мозгоподобные вычисления (Brain-inspired computing) – это вычисления на мозгоподобных структурах, вычисления, использующие принципы работы мозга.

Мультиагентные системы (Multi-agent system MAS) – это основная область исследований современного искусственного интеллекта. Многоагентная система состоит из нескольких агентов, принимающих решения, которые взаимодействуют в общей среде для достижения общих или противоречивых целей. С помощью методологий MAS можно решать широкий спектр приложений, включая автономное вождение, фабрики с несколькими роботами, автоматическую торговлю, коммерческие игры, автоматизированное обучение и т. д.

Мультиголовное самовнимание (Multi-head self-attention) – является ключевым компонентом Transformer- современной архитектуры для нейронного машинного перевода. Механизм самовнимания в настоящее время встречается в самых различных архитектурах и задачах (перевод, генерация текста, аннотация изображений и т.д.).

Мульти-классовая классификация (Multi-class classification) – это классификация, включающая более двух классов, например, классификация серии фотографий породы собак, которые могут быть мопсом, бульдогом или мастифом. Мультиклассовая классификация предполагает, что каждый образец относится к одному классу, например, собака может быть либо мопсом, либо бульдогом, но не тем и другим одновременно.

Мультимодальная модель (Multimodal model) – это текст и другие типы ввода (такие как графика, изображения и т. д.) и более специфичные для конкретной задачи. В мультимодальных средах модель преобразователей используется для создания прогнозов путем слияния текста и изображения. Различные входные данные объединяются, и поверх позиционных вложений добавляется встраивание сегмента, чтобы сообщить модели, какая часть входного вектора относится к тексту, а какая к изображению. Такая классификация возможна с предварительно обученной моделью [[60 - Мультимодальная модель [Электронный ресурс] www.projectpro.io URL: https://www.projectpro.io/recipes/what-are-multimodal-models-transformers (https://www.projectpro.io/recipes/what-are-multimodal-models-transformers) (дата обращения: 07.07.2022)]].

Мультимодальное обучение (Multi-Modal Learning) – это подраздел машинного обучения, когда данные поступают из разных источников. Модусы – это, по сути, каналы информации. Эти данные из нескольких источников семантически коррелированы и иногда предоставляют дополнительную информацию друг другу, таким образом отражая шаблоны, которые не видны при работе с отдельными модальностями сами по себе.

Мультимодальные приложения (Multimodal application) – это объединение различных модальностей или типов информации для повышения производительности в области глубокого обучения. Чтобы искусственный интеллект смог добиться прогресса в понимании окружающего мира, он должен уметь вместе интерпретировать такие мультимодальные сигналы. Мультимодальное глубокое обучение опирается на множество модусов, каждый из которых вносит свой вклад в значение.

Мульти-опыт (Multi-experience) – это часть долгосрочного перехода от индивидуальных компьютеров, которые мы используем сегодня, к многопользовательским, мультисенсорным и многолокационным системам, процесс замены людей, понимающих технологии, на технологии, понимающие людей.

Мусор на входе – мусор на выходе (Garbage In, Garbage Out) – это принцип в информатике, означающий, что при неверных входящих данных будут получены неверные результаты, даже если сам по себе алгоритм правилен.

Мутация (Mutation) – это тип тестирования программного обеспечения, при котором определенные операторы исходного кода изменяются/мутируют, чтобы проверить, могут ли тестовые примеры найти ошибки в исходном коде. Целью мутационного тестирования является обеспечение качества тестовых примеров с точки зрения надежности, чтобы они не давали сбой мутировавшему исходному коду. Изменения, внесенные в мутантную программу, должны быть очень небольшими, чтобы они не влияли на общую цель программы. Мутационное тестирование также называется стратегией тестирования на основе ошибок, поскольку оно включает создание ошибки в программе и представляет собой тип тестирования белого ящика, который в основном используется для модульного тестирования.

Набор данных(Data set) – это совокупность данных, прошедших предварительную подготовку (обработку) в соответствии с требованиями законодательства Российской Федерации об информации, информационных технологиях и о защите информации и необходимых для разработки программного обеспечения на основе искусственного интеллекта (Национальная стратегия развития искусственного интеллекта на период до 2030 года).

«Н»

Набор данных DataFrame (DataFrame) – это проиндексированный многомерный массив значений для представления наборов данных в pandas. DataFrame аналогичен таблице. Каждый столбец DataFrame имеет имя (заголовок), а каждая строка идентифицируется номером.

Набор признаков (Feature set) – это группа признаков, на которых обучается модель машинного обучения. Например, почтовый индекс, размер собственности и состояние могут представлять собой простой набор признаков для модели, предсказывающей цены на жилье.

Наивная семантика (Naive semantics) – это подход, используемый в компьютерных науках для представления базовых знаний о конкретной области, и он использовался в таких приложениях, как представление значения предложений на естественном языке в приложениях искусственного интеллекта. В общем случае этот термин использовался для обозначения использования ограниченного хранилища общепонятных знаний о конкретной области в мире и применялся к таким областям, как проектирование схем данных, основанное на данных.

Наивный Байес (Naive Bayes) – это очень популярный и простой в машинном обучении алгоритм. Как следует из названия, этот алгоритм делает предположение, что все переменные в наборе данных «наивные», т.е. не коррелируют друг с другом. [[61 - Наивный Байес [Электронный ресурс] //proglib.io URL: https://proglib.io/p/izuchaem-naivnyy-bayesovskiy-algoritm-klassifikacii-dlya-mashinnogo-obucheniya-2021-11-12 (https://proglib.io/p/izuchaem-naivnyy-bayesovskiy-algoritm-klassifikacii-dlya-mashinnogo-obucheniya-2021-11-12) (дата обращения: 07.07.2022)]]

Наивный байесовский классификатор (Naive Bayes classifier) – это простой вероятностный классификатор, основанный на применении теоремы Байеса со строгими (наивными) предположениями о независимости.

Намерение (Intent) – это механизм для описания операции (выбрать фотографию, отправить письмо, сделать звонок, запустить браузер и перейти по указанному адресу), которую необходимо выполнить. Используется в обучающих данных для чат-ботов и других задач обработки естественного языка, в качестве типа метки, которая определяет цель сказанного.