banner banner banner
Глоссариум по искусственному интеллекту: 2500 терминов. Том 1
Глоссариум по искусственному интеллекту: 2500 терминов. Том 1
Оценить:
 Рейтинг: 0

Глоссариум по искусственному интеллекту: 2500 терминов. Том 1


Компьютерный инцидент (Computer incident) – это факт нарушения и (или) прекращения функционирования объекта критической информационной инфраструктуры, сети электросвязи, используемой для организации взаимодействия таких объектов, и (или) нарушения безопасности обрабатываемой таким объектом информации, в том числе, произошедший в результате компьютерной атаки.

Конвейер (Pipeline) – это метод для автоматизации рабочих процессов машинного обучения. Он работает, преобразовывая последовательность данных и сопоставляя их вместе в модели, которую можно протестировать и оценить для достижения результата.

Конвейерная обработка (Pipelining) — это процесс накопления и выполнения компьютерных инструкций и задач от процессора через логический конвейер. Применительно к машинному обучению – это способ систематизировать и автоматизировать рабочий процесс, необходимый для создания модели машинного обучения.

Конвергенция (Convergence) – это сближение различных систем, происходящее под влиянием социально-экономических факторов. Применительно к машинному обучению, модель достигает конвергенции, когда дополнительное обучение на текущих данных не улучшит модель. Помимо экономики и машинного обучения, термин «конвергенция» используется в коммуникации, различных гуманитарных, естественных и общественно-политических науках.

Коннекционизм (Сonnectionism) – это один из подходов в области искусственного интеллекта, когнитивной науки (когнитивистики), нейробиологии, психологии и философии сознания. Коннекционизм моделирует мыслительные или поведенческие явления процессами становления в сетях из связанных между собой простых элементов.

Контролируемое обучение (Supervised learning) – это тип машинного обучения, при котором выходные наборы данных обучают машину генерировать желаемые алгоритмы, как учитель, контролирующий ученика; используется чаще, чем обучение без учителя

Контрольная точка (Checkpoint) – это простое событие базы данных, ее основное значение – сокращение времени восстановления после сбоя. Контрольные точки позволяют экспортировать веса моделей, а также выполнять обучение в течение нескольких сеансов.

Контрфактическая справедливость (Counterfactual fairness) – это метод принятия решений с помощью ИИ. Он предполагает, что компьютеры могут квалифицировать то или иное суждение о какой-либо личности как «справедливое», если такое же суждение было сделано в воображаемом мире, в котором личность относилась к другой демографической группе на основе «несправедливых ориентиров» – другими словами, если в параллельном мире женщина была бы фактически мужчиной или белый мужчина был бы фактически темнокожим.

Конфиденциальность информации (Confidentiality of information) – это обязательное для выполнения лицом, получившим доступ к определенной информации, требование не передавать такую информацию третьим лицам без согласия ее обладателя.

Корневой каталог (Root directory) – это каталог, который вы указываете для размещения подкаталогов контрольной точки TensorFlow и файлов событий нескольких моделей.

Корпоративная обработка изображений (Enterprise Imaging) – это набор стратегий, инициатив и рабочих процессов, реализованных в медицинском предприятии для последовательного и оптимального захвата, индексации, управления, хранения, распространения, просмотра, обмена и анализа всех клинических изображений и мультимедийного контента для повышения эффективности электронной медицинской карты (EMR) членами рабочей группы.

Корпус (Corpus) – это подобранная и обработанная по определённым правилам совокупность текстов, используемых в качестве базы для исследования языка.

Корреляционный анализ (Correlation analysis) – метод обработки статистических данных, с помощью которого измеряется теснота связи между двумя или более переменными. Таким образом, он определяет существует ли связь между явлениями и насколько сильная связь между этими явлениями.

Корреляция (Correlation) – статистическая взаимосвязь двух или более случайных величин.

Коэффициент ветвления дерева (Branching factor) – это количество исходящих ветвей в каждом узле. Если это значение не одинаково для всех узлов, может быть вычислен средний коэффициент ветвления. В теории игр коэффициентом ветвления игры называется коэффициент ветвления дерева игры, то есть количество возможных ходов в данной позиции. Например, в шахматах, если «узлом» считается базовая позиция, средний коэффициент ветвления будет 35. Это значит, что в среднем игрок имеет около 35 допустимых ходов на каждом ходе. Для сравнения, коэффициент ветвления для игры Го равен 250.

Коэффициент игральной кости (Dice coefficient) – это мера для сравнения сходства двух сегментаций, например, эксперта и машины. Это отношение удвоенного количества общих пикселей к сумме всех пикселей в обоих наборах.

Коэффициент регуляризации (Regularization rate) – это скалярное значение, представленное в виде лямбда, указывающее относительную важность функции регуляризации. Следующее упрощенное уравнение потерь показывает влияние скорости регуляризации: Повышение уровня регуляризации уменьшает переоснащение, но может сделать модель менее точной.

Креативные вычисления (Computational creativity) – это междисциплинарное направление с характеристиками методов разработки, оценки, моделирования, философии, теоретики, психологии и искусства. Креативные вычисления относятся к мета-технологии для объединения знаний в области вычислений и других дисциплин.

Кривая обобщения (Generalization curve) – это график, показывающий как обучающую выборку, так и проверочную выборку. Кривая обобщения может помочь обнаружить возможное переобучение модели.

Кривая потерь (Loss curve) – это график потерь в зависимости от итераций обучения. Например, кривая потерь может помочь вам определить, когда ваша модель сходится, переоснащается или недостаточно подходит.

Кривая точности-отзыва (Precision-recall curve) – это кривая зависимости точности от отзыва при различных порогах классификации.

Кризис воспроизводимости (Reproducibility (crisis of)) – это методологический кризис в науке, при котором ученые обнаружили, что результаты многих научных исследований трудно или невозможно воспроизвести при последующем исследовании как независимыми исследователями, так и самими первоначальными исследователями.

Криогенная заморозка (крионика,

криоконсервация человека) – это технология сохранения в состоянии глубокого охлаждения (при помощи жидкого азота) головы или тела человека после его смерти с намерением оживить их в будущем.

Критик (Critic) – это глубокая нейронная сеть, предсказывающая Q-функции.

Критическая информационная инфраструктура (Critical information infrastructure) – это объекты критической информационной инфраструктуры, а также сети электросвязи, используемые для организации взаимодействия таких объектов.

Критическая информационная инфраструктура Российской Федерации (Critical information infrastructure of the Russian Federation) – это совокупность объектов критической информационной инфраструктуры, а также сетей электросвязи, используемых для организации взаимодействия объектов критической информационной инфраструктуры между собой.

Кроссовер (Рекомбинация) (Crossover) – это один из способов стохастического генерирования новых решений из существующей популяции, аналогичный скрещиванию, который происходит во время полового размножения в биологических организмах. Решения также могут быть получены путем клонирования существующего решения, что аналогично бесполому размножению. Вновь созданные решения обычно мутируют перед добавлением в популяцию.

Кросс-энтропия (Перекрестная энтропия) (Cross-entropy) – это функция потерь (Loss Function), которую можно использовать для количественной оценки разницы между двумя распределениями вероятностей. [[37 - Cross-entropy [Электронный ресурс] // helenkapatsa.ru URL: https://www.helenkapatsa.ru/kross-entropiia/ (дата обращения: 16.02.2022)]]

Курирование данных (Data Curation) – это процессы, связанные с организацией и управлением данными, которые собираются из различных источников.

«Л»

Ленивое обучение (Lazy learning) в искусственном интеллекте – это метод обучения, при котором обобщение данных обучения откладывается до тех пор, пока в систему не будет сделан запрос, в отличие от активного обучения, когда система пытается обобщить данные обучения до получения запросов. Этот тип обучения также известен как обучение на основе экземпляров. Ленивые классификаторы очень полезны при работе с большими наборами данных, которые имеют несколько атрибутов.

Лингвистическая аннотация (Linguistic annotation) – также известная как текстовая аннотация корпуса, – это маркировка языковых данных в текстовой или устной форме. Лингвистическая аннотация направлена на выявление и пометку грамматических, фонетических и семантических лингвистических элементов в тексте или аудиозаписи.

Линейная регрессия (Linear regression) – это метод моделирования, который помогает в построении отношений между зависимой скалярной переменной и одной или несколькими независимыми переменными. Они также известны как переменная результата и предикторная переменная. Хотя линейная регрессия уходит своими корнями в статистику, она также является важным инструментом машинного обучения для таких задач, как прогнозное моделирование. Линейная регрессия пытается смоделировать взаимосвязь между двумя переменными, подгоняя линейное уравнение к наблюдаемым данным.

Лисп (LISt Processing – «обработка списков») – это семейство языков программирования, основанных на представлении программы системой линейных списков символов, которые притом являются основной структурой данных языка. Лисп считается вторым после Fortran старейшим высокоуровневым языком программирования. [[38 - Лисп [Электронный ресурс] //progopedia.ru URL: http://progopedia.ru/language/lisp/ (http://progopedia.ru/language/lisp/)]]

Личная информация (Personally Identifiable Information) – это любая часть информации, которая может использоваться сама по себе или в сочетании с какой-либо другой информацией для идентификации конкретного человека.

Ловушка NaN (NaN trap) – это элемент числового типа данных, который можно интерпретировать как неопределенное или непредставимое значение, особенно в арифметике с плавающей запятой. Когда одно число в вашей модели становится NaN во время обучения, что приводит к тому, что многие или все другие числа в вашей модели в конечном тоже итоге становятся NaN. [[39 - Ловушка NaN [Электронный ресурс] //en.wikipedia.org URL: https://en.wikipedia.org/wiki/NaN (https://en.wikipedia.org/wiki/NaN) (дата обращения: 07.07.2022)]]

Логарифм отношения шансов (Log-odds) – это логарифм отношения вероятностей наступления и не наступления события. Log-odds – это краткий способ обозначения взятия натурального логарифма из шансов. Когда вы берете натуральный логарифм чего-то, вы в основном делаете его более нормально распределенным. Когда мы делаем что-то более нормально распределенное, мы ставим его в таком масштабе, с которым очень легко работать.

Логика описания (Description logic) – это семейство формальных языков представления знаний. DL используются в искусственном интеллекте для описания и обоснования соответствующих концепций предметной области (известных как терминологические знания). Это особенно важно для обеспечения логического формализма для онтологий и Semantic Web: Web Ontology Language (OWL). Наибольшее применение DL и OWL находит в биомедицинской информатике, где DL помогает в кодификации биомедицинских знаний.

Логика первого порядка (также известная как исчисление предикатов первого порядка и логика предикатов) (First-order logic) – это набор формальных систем, используемых в математике, философии, лингвистике и информатике. Логика первого порядка использует количественные переменные вместо нелогических объектов и допускает использование предложений, содержащих переменные, так что вместо таких утверждений, как Сократ – человек, могут быть выражения в форме «существует такое X, что X есть Сократ и X – человек», и существует квантор, а X – переменная. Это отличает ее от логики высказываний, которая не использует кванторы или отношения.

Логика по умолчанию (Default logic) – это немонотонная логика, предложенная Раймондом Рейтером для формализации рассуждений с предположениями по умолчанию. Логика по умолчанию может выражать такие факты, как «по умолчанию, что-то истинно».

Логика разделения (Separation logic) – расширение логики Хоара – это способ рассуждения о программах. Язык утверждений логики разделения является частным случаем логики сгруппированных импликаций (BI).

Логистическая регрессия (Logistic regression) – это статистический метод для анализа набора данных, в котором есть одна или несколько независимых переменных, которые определяют результат. Результат измеряется с помощью дихотомической переменной (в которой есть только два возможных результата). Она используется для прогнозирования двоичного результата (1/0, да / нет, истина / ложь) с учетом набора независимых переменных. Логистическую регрессию можно рассматривать как особый случай линейной регрессии, когда исходная переменная является категориальной, где мы используем логарифм шансов в качестве зависимой переменной. Проще говоря, он предсказывает вероятность возникновения события путем подгонки данных клогитфункции. В некоторых случаях зависимые переменные могут иметь более двух результатов, например, в браке / не замужем / в разводе, такие сценарии классифицируются как полиномиальная логистическая регрессия. [[40 - Логистическая регрессия [Электронный ресурс] www.machinelearningmastery.ru URL: https://www.machinelearningmastery.ru/logistic-regression-for-dummies-a-detailed-explanation-9597f76edf46/ (https://www.machinelearningmastery.ru/logistic-regression-for-dummies-a-detailed-explanation-9597f76edf46/) (дата обращения: 07.07.2022)]]

Логистическая функция ошибки (также функция потерь логистической регрессии) (Log Loss) – Эту функцию называют также «логлосс» (logloss / log_loss), перекрёстной / кросс-энтропией. В большинстве обучающих сетей – это ошибка, которая рассчитывается как разница между фактическим выходным значением y и прогнозируемым выходным значением y. Функция, используемая для вычисления этой ошибки, известна как функция потерь. [[41 - Логистическая функция ошибки [Электронный ресурс] //dyakonov.org URL: https://dyakonov.org/2018/03/12/ (https://dyakonov.org/2018/03/12/) (дата обращения: 07.07.2022)]]

Логит (Logits) – это функция, также известная как функция логарифмических шансов, – это функция, которая представляет значения вероятности от 0 до 1 и от отрицательной бесконечности до бесконечности. Эта функция обратна сигмовидной функции, которая ограничивает значения от 0 до 1 по оси Y, а не по оси X. Поскольку логит-функция существует в диапазоне от 0 до 1, эта функция чаще всего используется для понимания вероятностей используется аналогично сигмовидной функции в нейронных сетях. Сигмоидальная или активационная функция выдает вероятность, тогда как логит-функция принимает вероятность и выдает действительное число между отрицательной и положительной бесконечностью. Как и сигмовидная функция, логит-функции часто размещаются в качестве последнего слоя в нейронной сети, поскольку это может упростить данные. Например, логит-функция часто используется на последнем слое нейронной сети, используемой в задачах классификации. Поскольку сеть определяет вероятности для классификации, функция логита может преобразовывать эти вероятности в действительные числа.

Логит модель (Logit model) – это статистическая модель, используемая для предсказания вероятности возникновения интересующего нас события с помощью логистической функции [[42 - Логистическая регрессия. [Электронный ресурс] // www.statmethods.ru. URL: https://www.statmethods.ru/statistics-metody/logisticheskaya-regressiya/ (https://www.statmethods.ru/statistics-metody/logisticheskaya-regressiya/) (дата обращения: 03.02.2022)]].

Логит-функция (Logit Function) – это обратная сигмоидальная «логистическая» функция, используемая в математике, особенно в статистике.

Логическая запись(Logical record) – это все данные для данной единицы анализа. Он отличается от физической записи тем, что может потребоваться несколько физических записей для хранения всех данных для данной единицы анализа. Например, в данных изображения карты «карта» представляет собой физическую запись, и обычно требуется несколько «карт» для хранения всей информации для одного случая или единицы анализа.

Логическое программирование (Logic programming) – это парадигма программирования, которая основывается на формальной логике. Любая программа, написанная на логическом языке программирования, представляет собой набор предложений в логической форме, выражающий факты и правила о некоторой проблемной области. Также, – это тип парадигмы программирования, в которой вычисления выполняются на основе хранилища знаний фактов и правил; LISP и Prolog – два языка логического программирования, используемые для программирования AI.

Логическое программирование ограничений (Сonstraint logic programming) – это расширенная версия логического программирования, которая создается путем комбинирования ограниченного программирования с логическим программированием. Ограниченное программирование – это форма декларативного программирования, которая использует математические ограничения, чтобы определить, как переменные в программе связаны друг с другом.