banner banner banner
Глоссариум по искусственному интеллекту: 2500 терминов. Том 1
Глоссариум по искусственному интеллекту: 2500 терминов. Том 1
Оценить:
 Рейтинг: 0

Глоссариум по искусственному интеллекту: 2500 терминов. Том 1


Дискриминатор (Discriminator) – это функциональная группа, выполняющая сравнение двух одноименных входных величин (мгновенных значений или амплитуд, частот, фаз, задержек электрических сигналов; дальностей, направлений, скоростей объектов и т.п.), выходной сигнал которой пропорционален разности значений этих величин. В контуре управления служит датчиком рассогласования своих входных величин, формирующим сигнал ошибки. Это система, которая определяет, являются ли примеры реальными или поддельными.

Дискриминационная модель (Discriminative model) – это модель, предсказывающая метки на основе набора из одного или нескольких признаков. Более формально, дискриминационные модели определяют условную вероятность выхода с учетом характеристик и весов.

Дистанционное медицинское обслуживание(Remote Medical Care) – это телемедицинский сервис, позволяющий осуществлять постоянный мониторинг состояния пациента и проведение профилактических и контрольных осмотров вне медицинских учреждений. Эта форма ухода стала возможной благодаря использованию мобильных устройств, которые измеряют основные показатели жизнедеятельности. Результаты передаются в Центр дистанционного медицинского обслуживания, где они автоматически анализируются. При обнаружении каких-либо отклонений медицинский персонал связывается с пациентом и вызывает скорую помощь в случае возникновения экстренной ситуации.

Длинный Хвост(Long Tail) означает разнообразную, но малообъемную часть ассортимента продукции. Интернет сделал возможным получение прибыли от продажи продуктов с длинным хвостом. Концепция была представлена Крисом Андерсоном в 2004 году.

Документация(Documentation) как правило, – это любая информация о структуре, содержимом и макете файла данных. Иногда называется «технической документацией» или «кодовой книгой». Документацию можно рассматривать как специализированную форму метаданных.

Документированная информация (Documented information) – это зафиксированная на материальном носителе путем документирования информация с реквизитами, позволяющими определить такую информацию, или в установленных законодательством Российской Федерации случаях ее материальный носитель.

Долгая краткосрочная память (Long short-term memory (LSTM)) – это разновидность архитектуры рекуррентных нейронных сетей, предложенная в 1997 году Зеппом Хохрайтером и Юргеном Шмидхубером. Как и большинство рекуррентных нейронных сетей, LSTM-сеть является универсальной в том смысле, что при достаточном числе элементов сети она может выполнить любое вычисление, на которое способен обычный компьютер, для чего необходима соответствующая матрица весов, которая может рассматриваться как программа. В отличие от традиционных рекуррентных нейронных сетей, LSTM-сеть хорошо приспособлена к обучению на задачах классификации, обработки и прогнозирования временных рядов в случаях, когда важные события разделены временными лагами с неопределённой продолжительностью и границами. Относительная невосприимчивость к длительности временных разрывов даёт LSTM преимущество по отношению к альтернативным рекуррентным нейронным сетям, скрытым марковским моделям и другим методам обучения для последовательностей в различных сферах применения [[24 - Долгая краткосрочная память [Электронный ресурс] //ru.wikipedia.org URL: https://ru.wikipedia.org/wiki/ (https://ru.wikipedia.org/wiki/) (дата обращения: 07.07.2022)]]. Также, – это тип ячейки рекуррентной нейронной сети, используемой для обработки последовательностей данных в таких приложениях, как распознавание рукописного ввода, машинный перевод и субтитры к изображениям. LSTM решают проблему исчезающего градиента, которая возникает при обучении RNN из-за длинных последовательностей данных, сохраняя историю во внутренней памяти на основе новых входных данных и контекста из предыдущих ячеек в RNN.

Дополненная реальность (Augmented reality) – это среда, в реальном времени дополняющая физический мир, каким мы его видим, цифровыми данными с помощью различных устройств (планшетов, смартфонов и др.) и определенного программного обеспечения.

Отличие дополненной реальности от виртуальной реальности (virtual reality) в том, что дополненная реальность лишь добавляет отдельные элементы в уже существующий мир.

Дополненный (расширенный) интеллект (Augmented Intelligence) – это шаблон проектирования ориентированной на человека модели партнерства, в которой люди и искусственный интеллект работают вместе для улучшения когнитивных функций, включая обучение, принятие решений и новый опыт. Дополненный интеллект представляет собой совокупность средств и методов, обеспечивающих максимально возможную производительность интеллекта человека.

Дополнительный интеллект (Auxiliary intelligence) – это системы на основе искусственного интеллекта, дополняющие принимаемые человеком решения, и способные обучаться в процессе взаимодействия с людьми и окружающей средой.

Допустимая эвристика (Admissible heuristic) – это эвристическая функция считается допустимой, если она никогда не завышает стоимость достижения цели, т. е. стоимость, которую она оценивает для достижения цели, не превышает наименьшую возможную стоимость. от текущей точки пути.

Достоверность данных(Data veracity) – это степень точности или правдивости набора данных. В контексте больших данных важно не только качество данных, но и то, насколько надежными являются источник, тип и обработка данных.

Достоверность распознавания (Recognition accuracy) – это точность (правильность, достоверность) распознавания. Язык разметки для синтеза речи.

Доступ к информации (Access to information) – это возможность получения информации и ее использования.

Доступ к информации, составляющей коммерческую тайну (Access to information constituting a commercial secret) – это ознакомление определенных лиц с информацией, составляющей коммерческую тайну, с согласия ее обладателя или на ином законном основании при условии сохранения конфиденциальности этой информации.

Драйвер (Driver) – это компьютерное программное обеспечение, с помощью которого другое программное обеспечение (операционная система) получает доступ к аппаратному обеспечению отдельного устройства.

Древо решений (Decision tree) – это модель на основе дерева и ветвей, используемая для отображения решений и их возможных последствий, аналогична блок-схеме.

Дрейф концепций (Concept drift) в предиктивной аналитике и машинном обучении – это статистические свойства целевой переменной, которую модель пытается предсказать, со временем меняются непредвиденным образом. Это вызывает проблемы, потому что прогнозы становятся менее точными с течением времени.

Дрон (Drone) – это беспилотный летательный аппарат.

Дружественный искусственный интеллект (ДИИ) (Friendly artificial intelligence) – это искусственный интеллект (ИИ), который обладает скорее позитивным, чем негативным влиянием на человечество. ДИИ также относится к области исследований, целью которых является создание такого ИИ. Этот термин в первую очередь относится к тем ИИ-программам, которые обладают способностью значительно воздействовать на человечество, таким, например, чей интеллект сравним или превосходит человеческий.

«Е»

Единица анализа(Unit of analysis) – это базовая наблюдаемая сущность, анализируемая в ходе исследования и для которой собираются данные в виде переменных. Хотя единицу анализа иногда называют случаем или «наблюдением», они не всегда являются синонимами. Например, в опросах общественного мнения единицей анализа обычно является один человек, и ответы одного человека на вопросы опроса составляют «кейс». Однако в переписи «случаем» может считаться домохозяйство, поскольку все данные по одному домохозяйству собираются с помощью одного инструмента обследования; «кейс» домохозяйства может содержать различные переменные для разных единиц анализа: физическая жилищная структура, семья в структуре, человек в семье.

Емкость модели(машинного обучения) (Model capacity) – это неофициальный термин, очень близкий к сложности модели. Это способ рассказать о том, насколько сложную модель или взаимосвязь может выразить модель. Можно было бы ожидать, что модель с большей емкостью сможет смоделировать больше взаимосвязей между большим количеством переменных, чем модель с меньшей емкостью. Существуют различные способы формализовать емкость и вычислить ее числовое значение. Одно из них измерение VC, размерность Вапника-Червоненкиса, – это математически строгая формулировка емкости. Самый распространенный способ оценить емкость модели – подсчитать количество параметров. Чем больше параметров, тем выше емкость в целом.

Естественный язык (Natural language) – это человеческий язык, такой как английский, русский или стандартный мандарин, используемый в повседневном общении людей, в отличие от сконструированного языка, искусственного языка, машинного языка или языка формальной логики. Также называется обычным языком.

«Ж»

Жадная политика (Greedy policy) – в обучении с подкреплением – это политика, которая всегда выбирает действие с наивысшей ожидаемой отдачей.

«З»

Загрузка сознания (Mind Uploading, Whole brain emulation) – это трансгуманистическая концепция, согласно которой «содержание» человеческого мозга можно представить в виде двоичного кода и загрузить на компьютер. Загрузка разума, также известная как эмуляция всего мозга (whole brain emulation, WBE), представляет собой теоретический футуристический процесс сканирования физической структуры мозга, достаточно точного для создания имитации психического состояния (включая долговременную память и «я») и передачи или копирование на компьютер в цифровом виде. Затем компьютер будет запускать симуляцию обработки информации мозгом, чтобы он реагировал, по существу, так же как исходный мозг, и испытывал разумный сознательный разум.

Задача «последовательность к последовательности» (Sequence-to-sequence task) – это задача, которая преобразует входную последовательность маркеров в выходную последовательность маркеров.

Закон Мура (Moore’s Law) – это эмпирическое наблюдение, изначально сделанное Гордоном Муром, согласно которому количество транзисторов, размещаемых в кристалле интегральной схемы, удваивается каждые 24 месяца, а стоимость компьютеров уменьшается вдвое. Другой принцип закона Мура гласит, что рост количества микропроцессоров экспоненциальный

Закрытый словарь (Closed dictionary) в системах распознавания речи – это словарь с ограниченным количеством слов, на который настроена система распознавания и который не может пополняться пользователем. [[25 - Закрытый словарь [Электронный ресурс] www.machinelearningmastery.ru URL: https://www.machinelearningmastery.ru/machine-learning-algorithms-in-laymans-terms-part-1-d0368d769a7b/ (https://www.machinelearningmastery.ru/machine-learning-algorithms-in-laymans-terms-part-1-d0368d769a7b/) (дата обращения: 07.07.2022)]]

Запись(Record) в зависимости от контекста «запись» этот термин может относиться к физической или логической записи.

Запись Big O notation (Big O notation) – это математическая запись, описывающая предельное поведение функции, когда аргумент стремится к определенному значению или к бесконечности. Это член семейства обозначений, изобретенных Полом Бахманом, Эдмундом Ландау и другими, которые вместе называются обозначениями Бахмана-Ландау или асимптотическими обозначениями.

Защита данных(Data protection) – это процесс защиты данных, который включает в себя взаимосвязь между сбором и распространением данных и технологий, общественным восприятием и ожиданием конфиденциальности, а также политическими и правовыми основами, связанными с этими данными. Он направлен на достижение баланса между индивидуальными правами на неприкосновенность частной жизни, но при этом позволяет использовать данные в деловых целях.

Здравый смысл (Commonsense knowledge) – это одна из ветвей искусственный интеллект (AI), которая занимается моделированием способности человека делать предположения о типе и сущности обычных ситуаций, с которыми он сталкивается каждый день. Эти предположения включают суждения о физических свойствах, целях, намерениях и поведении людей, а также о возможных результатах их действий и взаимодействий.

Зима искусственного интеллекта (Winter of artificial intelligence, AI winter) – это период сокращения интереса к предметной области, сокращения финансирования исследований. Термин был придуман по аналогии с идеей ядерной зимы. Область искусственного интеллекта пережила несколько циклов ажиотажа, за которыми последовали разочарование и критика, за которыми последовало сильное охлаждение интереса, а потом последовало возобновление интереса спустя годы или десятилетия.

Знания (Knowledge) – это проверенный практикой и удостоверенный логикой результат познания действительности, отраженный в сознании человека в виде представлений, понятий, рассуждений и теорий. Знания формируются в результате целенаправленного педагогического процесса, самообразования и жизненного опыта.

Значение алгоритма (Rete algorithm) – это алгоритм сопоставления с образцом для реализации систем, основанных на правилах. Алгоритм был разработан для эффективного применения многих правил или шаблонов ко многим объектам или фактам в базе знаний. Он используется для определения того, какое из правил системы должно срабатывать на основе ее хранилища данных, ее фактов.

«И»

Игровая площадка TensorFlow (TensorFlow Playground) – это инструмент, который поможет вам понять идею нейронных сетей без сложных математических вычислений. TensorFlow Playground, веб-приложение, написанное на JavaScript, которое позволяет вам играть с настоящей нейронной сетью, работающей в вашем браузере, и нажимать кнопки и настраивать параметры, чтобы увидеть, как это работает.

Игровой ИИ (Game AI) – это форма ИИ, характерная для игр, которая использует алгоритм для замены случайности. Это вычислительное поведение, используемое в персонажах, не являющихся игроками, для генерации интеллекта, подобного человеческому, и основанных на реакции действий, предпринимаемых игроком.

Иерархическая кластеризация (Hierarchical clustering) – это алгоритм машинного обучения без контроля, который используется для группировки непомеченных точек данных, имеющих сходные характеристики. Алгоритмы иерархической кластеризации делятся на две категории. Агломерационные иерархические алгоритмы. В агломерационных иерархических алгоритмах каждая точка данных обрабатывается как один кластер, а затем последовательно объединяется или агломерирует (подход снизу вверх) пары кластеров. Иерархия кластеров представлена в виде дендрограммы или древовидной структуры. Разделительные иерархические алгоритмы. С другой стороны, в разделительных иерархических алгоритмах все точки данных обрабатываются как один большой кластер, а процесс кластеризации включает в себя разделение (нисходящий подход) одного большого кластера на различные маленькие кластеры.

Иерархический файл(Hierarchical file) – этот файл содержит информацию, собранную по нескольким единицам анализа в разных типах записей. Например, физическая жилая структура может быть одной единицей, а отдельные люди в структуре – другой. Примером может служить Текущее обследование населения: годовой демографический файл, в котором есть единицы анализа домохозяйства, семьи и человека. Исследования, включающие данные для разных единиц анализа, часто связывают эти единицы друг с другом, так что, например, можно анализировать людей по мере того, как они группируются в структуру.

Избирательное линейное разрешение определенного предложения(также просто разрешение SLD) (Selective Linear Definite clause resolution) – это основное правило вывода, используемое в логическом программировании. Это уточнение решения, которое является и правильным, и полным опровержением оговорок Хорна.

Извлечение знаний (Knowledge extraction) – это извлечение существующего содержимого из структурированных или неструктурированных баз данных. Создание знаний из структурированных (реляционные базы данных, XML) и неструктурированных (текст, документы, изображения) источников. Полученные знания должны быть в машиночитаемом и машино-интерпретируемом формате и должны представлять знания таким образом, чтобы облегчить вывод. Хотя он методически похож на извлечение информации (NLP) и ETL (хранилище данных), основным критерием является то, что результат извлечения выходит за рамки создания структурированной информации или преобразования в реляционную схему. Это требует либо повторного использования существующих формальных знаний (повторное использование идентификаторов или онтологий), либо генерации схемы на основе исходных данных.

Извлечение сущностей (Entity extraction) – это общий термин, относящийся к процессу добавления структуры к данным для того, чтобы машина смогла их прочитать. Извлечение сущностей может выполняться человеком или с помощью модели машинного обучения.

Изучение онтологий (Ontology learning) —– это подзадача извлечения информации. Ее целью является полуавтоматическое извлечение соответствующих понятий и отношений из заданного наборов данных для формирования онтологии. «Онтология» – философская наука о бытии, основных видах и свойствах бытия. Автоматическое создание онтологий – задача, затрагивающая многие дисциплины. Как правило, процесс начинается с извлечения терминов и понятий или именных словосочетаний из обычного текста с использованием метода извлечения терминологии. Обычно для этого используются лингвистические процессы (например, маркировка частей речи, фрагментация фраз).

Изучение признаков или обучение представлению (Feature learning) – это набор методов, которые позволяют системе автоматически обнаруживать представления, необходимые для обнаружения или классификации признаков из необработанных данных. Это заменяет ручную разработку функций и позволяет машине изучать функции и использовать их для выполнения конкретной задачи.

ИИ бенчмарк (AI benchmark) – это эталонный тест ИИ, бенчмаркинг систем ИИ, для оценки возможностей, эффективности, производительности и для сравнения ИНС, моделей машинного обучения (МО), архитектур и алгоритмов при решении различных задач ИИ создаются и стандартизируется специальные эталонные тесты, бенчмарки. Например, Benchmarking Graph Neural Networks – бенчмаркинг (эталонное тестирование) графовых нейронных сетей (ГНС, GNN) – обычно включает инсталляцию конкретного бенчмарка, загрузку исходных датасетов, проведение тестирования ИНС, добавление нового датасета и повторение итераций