- Автоматическое дифференцирование (Automatic Differentiation)
- Определение: Метод автоматического вычисления производных функций, используемых в глубоком обучении для оптимизации весов нейронных сетей.
- Примеры использования: Обратное распространение ошибок (backpropagation).
- Область использования: Оптимизация нейросетей.
- Активное обучение (Active Learning)
- Определение: Стратегия обучения моделей, предполагающая интерактивный выбор наиболее информативных образцов для маркировки человеком-экспертом.
- Примеры использования: Уменьшение количества аннотируемых данных.
- Область использования: Экономия ресурсов при разметке больших объемов данных.
- Аннсамблирование моделей (Model Ensembling)
- Определение: Объединение нескольких моделей для улучшения общей производительности и устойчивости предсказаний.
- Примеры использования: Баггинг (bagging), бустинг (boosting), стекинг (stacking).
- Область использования: Повышение точности моделей.
- Архитектура трансформеров (Transformer Architecture)
- Определение: Архитектура нейронных сетей, построенная на механизме внимания, позволяющем обрабатывать длинные последовательности данных.
- Примеры использования: BERT, GPT, T5.
- Область использования: Обработка естественного языка (NLP), обработка изображений.
- Байесовская оптимизация (Bayesian Optimization)
- Определение: Метод оптимизации гиперпараметров моделей, основанный на статистическом подходе, минимизирующем количество итераций поиска оптимального решения.
- Примеры использования: Поиск лучших настроек модели для максимальной производительности.
- Область использования: Выбор оптимальных гиперпараметров.
- Валидационный набор данных (Validation Set)
- Определение: Часть данных, выделяемая для проверки промежуточных результатов обучения модели и избежания переобучения.
- Примеры использования: Оценка точности на непрозрачном этапе обучения.
- Область использования: Контроль качества обучения.
- Векторное представление (Vector Representation)
- Определение: Преобразование текстовых или категориальных данных в числовой вид для дальнейшего анализа моделями машинного обучения.
- Примеры использования: Эмбеддинги (embeddings), TF-IDF.
- Область использования: NLP, классификация документов.
- Генерация текста (Text Generation)
- Определение: Создание осмысленного текста на основе предварительных данных или контекста.
- Примеры использования: Chatbots, автоматические системы написания статей.
- Область использования: NLP, диалоговые системы.
- Гиперпараметры (Hyperparameters)
- Определение: Настройки, определяемые вручную или автоматически до начала процесса обучения модели, такие как скорость обучения, глубина сети, регуляризаторы.
- Примеры использования: Learning rate, batch size, number of hidden units.
- Область использования: Оптимизация и настройка моделей.
- Граф вычислений (Computational Graph)
- Определение: Структурная схема операций, проводимых над данными в процессе обучения нейронной сети, выражаемая в виде направленного графа.
- Примеры использования: Visualization of neural network operations.
- Область использования: Отладка и понимание процессов обучения.
- Датасет (Dataset)
- Определение: Коллекция данных, собранных для целей обучения, тестирования и оценки моделей машинного обучения.
- Примеры использования: MNIST, COCO, WikiText.
- Область использования: Сбор и подготовка данных для моделирования.
- Данные (Data)
- Определение: Информация, представленная в цифровом виде, используемая для обучения и оценивания моделей.
- Примеры использования: Изображения, тексты, звуковые файлы.
- Область использования: Основы машинного обучения.
- Дифференциальное обучение (Differentiable Programming)
- Определение: Методология программирования, при которой программы рассматриваются как функции, способные подвергаться автоматической дифференциации.
- Примеры использования: Градиентное обновление параметров нейронных сетей.
- Область использования: Современные методы обучения нейронных сетей.
- Задача регрессии (Regression Task)
- Определение: Задача машинного обучения, цель которой состоит в предсказании непрерывных значений на основе входных данных.
- Примеры использования: Прогноз цен на жилье, оценка стоимости товаров.
- Область использования: Предсказание количественных показателей.
- Интуитивное обучение (Intuitive Learning)
- Определение: Концепция интуитивного подхода к пониманию и применению технологий машинного обучения без углубленных технических знаний.
- Примеры использования: Упрощённые инструменты и платформы для начинающих разработчиков.
- Область использования: Популяризация AI-технологий.
- Интерференция (Interference)
- Определение: Воздействие ранее изученного материала на последующее обучение новой информации, потенциально снижающее производительность моделей.
- Примеры использования: Катастрофическое забывание в нейронных сетях.
- Область использования: Проблематика долговременного запоминания.
- Искусственная нейронная сеть (Artificial Neural Network, ANN)
- Определение: Система, имитирующая функционирование биологического мозга, состоящая из множества искусственных нейронов, соединённых связями с различными весовыми коэффициентами.
- Примеры использования: Multilayer Perceptron, CNN, RNN.
- Область использования: Решение широкого спектра задач машинного обучения.
- Катастрофическое забывание (Catastrophic Forgetting)
- Определение: Феномен, при котором нейронная сеть теряет способность хорошо воспроизводить старые знания после обучения новым данным.
- Примеры использования: Постепенное ухудшение результата на старых данных после переподготовки.
- Область использования: Сохранение способности решать предыдущие задачи после переобучения.
- Классификация (Classification)
- Определение: Задача распознавания и присвоения классу каждой единицы данных в рамках конечного множества возможных категорий.
- Примеры использования: Распознавание рукописных цифр, категоризация отзывов клиентов.
- Область использования: Широкий спектр применений, включая обработку изображений и текстов.
- Компьютерное зрение (Computer Vision, CV)
- Определение: Область исследований, посвящённая разработке алгоритмов и методов, позволяющих компьютерам интерпретировать и понимать визуальную информацию.
- Примеры использования: Объектное обнаружение, сегментация изображений.
- Область использования: Анализ изображений и видео.
- Контекстное окно (Context Window)
- Определение: Окружение токенов вокруг текущего элемента, рассматриваемое моделью для понимания смысла и формирования вывода.
- Примеры использования: Размер окна влияет на качество предиктивных способностей модели.
- Область использования: НЛП, обработка текстов.
- Корпус (Corpus)
- Определение: Большая коллекция текстов, используемая для изучения особенностей языка и построения лингвистических моделей.
- Примеры использования: Корпус русского языка (НКРЯ).
- Область использования: Исследования в области естественных языков.
- Краткосрочное хранение (Short-term Storage)
- Определение: Компонент памяти нейронной сети, удерживающий временные состояния на протяжении коротких периодов времени.
- Примеры использования: LSTM (long short-term memory).
- Область использования: Работа с временными рядами и последовательностью данных.
- Логистика регрессия (Logistic Regression)
- Определение: Линейный метод классификации, основанный на применении сигмоидной функции для перевода линейной комбинации признаков в вероятность принадлежности к классу.
- Примеры использования: Бинарная классификация медицинских состояний.
- Область использования: Простые задачи классификации.
- Машинное обучение (Machine Learning, ML)
- Определение: Подразделение искусственного интеллекта, занимающееся разработкой алгоритмов, позволяющих машинам учиться на данных и улучшать свою производительность без прямого программирования.
- Примеры использования: Деревья решений, логистическая регрессия, нейронные сети.
- Область использования: Построение автоматизированных аналитических систем.
- Метрика качества (Evaluation Metric)
- Определение: Показатель, характеризующий качество работы модели или алгоритма на тестовом наборе данных.
- Примеры использования: Accuracy, precision, recall, F1 score.
- Область использования: Оценка производительности моделей.
- Модель (Model)
- Определение: Формализованное представление проблемы или явления, создаваемое с целью прогнозирования или интерпретации.
- Примеры использования: Линейные модели, нейронные сети, дерево решений.
- Область использования: Программирование, исследования.
- Мониторинг безопасности (Security Monitoring)
- Определение: Постоянный контроль и наблюдение за системой с целью выявления угроз и уязвимостей, связанных с работой моделей искусственного интеллекта.
- Примеры использования: Мониторинг аномалий поведения моделей.
- Область использования: Обеспечение информационной безопасности AI-решений.
- Настройка гиперпараметров (Hyperparameter Tuning)
- Определение: Процедура нахождения оптимальных значений гиперпараметров модели для достижения лучшей производительности.
- Примеры использования: Байесовская оптимизация, grid search.
- Область использования: Улучшение производительности моделей.
- Нормализация (Normalization)
- Определение: Приведение данных к стандартному диапазону значений, повышая эффективность обучения и устойчивость моделей.
- Примеры использования: Min-max scaling, z-score normalization.
- Область использования: Предварительная обработка данных.
- Ограничение параметров (Parameter Constraints)
- Определение: Ограничения, накладываемые на параметры модели, такие как диапазон допустимых значений или условия гладкости.
- Примеры использования: Non-negative constraints in linear regression.
- Область использования: Улучшение стабильности и точности моделей.
- Оптимизация (Optimization)
- Определение: Процедуры и алгоритмы, направленные на улучшение производительности модели путём минимизации функции потерь.
- Примеры использования: Gradient descent, stochastic gradient descent.
- Область использования: Обучение моделей.
- Оценка модели (Model Evaluation)
- Определение: Процедура проверки качества модели на отдельных наборах данных для сравнения различных подходов и настроек.
- Примеры использования: Cross-validation, hold-out validation.
- Область использования: Проверка и сравнение моделей.
- Перцептрон (Perceptron)
- Определение: Базовая единица нейронной сети, принимающая сигналы, суммирующая их и выдающая сигнал в зависимости от превышения установленного порога.
- Примеры использования: Простейшие классификационные задачи.
- Область использования: Исторически важный прототип современных нейронных сетей.
- Переобучение (Overfitting)
- Определение: Случай, когда модель слишком точно адаптируется к данным обучения, теряя способность адекватно предсказывать на новых данных.
- Примеры использования: Увеличение размера тренировочного набора, регуляризация.
- Область использования: Диагностика проблем в моделях.
- Подбор параметров (Parameter Selection)
- Определение: Выбор подходящих значений параметров модели, влияющих на её поведение и производительность.
- Примеры использования: Hyperparameter tuning, cross-validation.
- Область использования: Оптимизация моделей.
- Потеря информации (Information Loss)
- Определение: Потеря деталей и тонкостей данных при их передаче или трансформации, негативно сказывающаяся на качестве результатов.
- Примеры использования: Перевод текстов, сжатие изображений.
- Область использования: Обнаружение и минимизация потерь в информационных системах.
- Предсказание (Prediction)
- Определение: Вычисляемое значение или категория, выдаваемая моделью на основе входных данных.
- Примеры использования: Прогноз цены акций, прогноз погоды.
- Область использования: Применяется повсеместно в задачах машинного обучения.
- Преобразование Фурье (Fourier Transformation)
- Определение: Метод разложения сигналов на компоненты различной частоты, широко используемый в обработке сигналов и изображений.
- Примеры использования: Частотный анализ аудиосигнала.
- Область использования: Обработка звука, изображений, временных рядов.
- Признак (Feature)
- Определение: Характеристика или свойство наблюдаемого объекта, используемое моделью для прогнозирования или классификации.
- Примеры использования: Цвет пикселя, частота слова.
- Область использования: Вся сфера машинного обучения.
- Разреженность (Sparsity)
- Определение: Свойство матрицы или вектора содержать значительное число нулевых элементов, что делает их компактнее и быстрее обрабатываемыми.
- Примеры использования: Sparse matrix representation.
- Область использования: Эффективная работа с большими объемами данных.
- Регрессор (Regressor)
- Определение: Модель, используемая для предсказания непрерывных величин на основе известных факторов.
- Примеры использования: Линейная регрессия, случайный лес.
- Область использования: Прогнозирование экономических показателей, научных измерений.
- Рекуррентная нейронная сеть (Recurrent Neural Network, RNN)
- Определение: Тип нейронной сети, сохраняющий состояние предыдущих шагов, подходящий для обработки последовательных данных.
- Примеры использования: Обработка естественного языка, предсказание временных рядов.
- Область использования: Временные ряды, обработка текста.
- Семантика (Semantics)
- Определение: Исследование смыслового содержания слов, предложений и текстов в языках.
- Примеры использования: Семантический анализ текста.
- Область использования: НЛП, информационные технологии.
- Свёрточная нейронная сеть (Convolutional Neural Network, CNN)
- Определение: Специфичная архитектура нейронных сетей, эффективная для работы с изображениями благодаря использованию свёрток и локальной связи нейронов.
- Примеры использования: Image classification, object detection.
- Область использования: Компьютерное зрение.
- Синоптическая пластичность (Synaptic Plasticity)
- Определение: Изменчивость силы синаптической передачи между двумя нейронами, лежащая в основе механизмов обучения и памяти.
- Примеры использования: Биологические основы обучения нейронных сетей.
- Область использования: Теоретические аспекты глубинного обучения.
- Срез данных (Data Slice)
- Определение: Подвыборка большого массива данных, выделенная для специального анализа или тестирования.
- Примеры использования: Оценка производительности модели на разных группах пользователей.
- Область использования: Тестирование и анализ моделей.
- Температура (Temperature)
- Определение: Параметр, регулирующий распределение вероятностей при выборе следующего шага в предсказательной модели.
- Примеры использования: Температурные коэффициенты в генерационных моделях.
- Область использования: Генерация текстов, изображений.
- Тестирование (Testing)
- Определение: Процесс оценки работоспособности и производительности модели на независимых данных.
- Примеры использования: Hold-out testing, k-fold cross-validation.
- Область использования: Проверка надежности моделей.
- Тип данных (Data Type)
- Определение: Описание формата хранения и обработки данных, определяющее способы манипуляции ими в программе.
- Примеры использования: Integer, float, string.
- Область использования: Программирование, базы данных.
- Тренировочный набор (Training Set)
- Определение: Часть данных, используемая непосредственно для обучения модели, адаптировавшей её параметры под поставленную задачу.
- Примеры использования: MNIST dataset, ImageNet.
- Область использования: Основной этап обучения моделей.
- Уровень шума (Noise Level)
- Определение: Степень помех или случайных изменений в сигнале или данных, ухудшающих их чистоту и ясность.
- Примеры использования: Шумоподавление в аудиофайлах.
- Область использования: Обработка сигналов, изображений.
- Умножение матриц (Matrix Multiplication)
- Определение: Операция умножения двух матриц, дающая новую матрицу, важную в работе многих алгоритмов машинного обучения.
- Примеры использования: Умножение матриц в сверточных нейронных сетях.
- Область использования: Основные расчеты в большинстве моделей глубокого обучения.
- Упрощение модели (Model Simplification)
- Определение: Сокращение числа параметров или усложненности модели для ускорения её работы и снижения потребности в ресурсах.
- Примеры использования: Pruning, quantization.
- Область использования: Оптимизация моделей для мобильных устройств.
- Фильтрация (Filtering)
- Определение: Удаление нежелательных компонентов из сигнала или данных, таких как шум или артефакты.
- Примеры использования: Фильтры нижних частот для удаления высокочастотного шума.
- Область использования: Обработка сигналов, изображений.
- Формула расстояния (Distance Formula)
- Определение: Математическое выражение, используемое для вычисления расстояний между объектами в пространстве признаков.
- Примеры использования: Евклидово расстояние, Манхэттенское расстояние.
- Область использования: Кластеризация, классификация.
- Функция активации (Activation Function)
- Определение: Функциональный блок, вводимый в архитектуру нейронной сети для придания ей нелинейности и возможности аппроксимировать сложные функции.
- Примеры использования: ReLU, sigmoid, tanh.
- Область использования: Строительный блок нейронных сетей.
- Функция потерь (Loss Function)
- Определение: Критерий, показывающий меру несоответствия между предсказанными и фактическими значениями, используемый для оптимизации модели.
- Примеры использования: MSE, Cross Entropy loss.
- Область использования: Обучение нейронных сетей.
- Хранилище данных (Data Warehouse)
- Определение: Специально организованная база данных, созданная для эффективного сбора, хранения и обработки больших объёмов структурированных и неструктурированных данных.
- Примеры использования: BigQuery, Snowflake.
- Область использования: Хранение и управление большими массивами данных.
- Шум (Noise)
- Определение: Любые ненужные или случайные отклонения в данных, затрудняющие извлечение полезных сведений.
- Примеры использования: Шумы в цифровых изображениях, помехи в звуковой записи.
- Область использования: Обработка сигналов, очистка данных.
- Энтропия (Entropy)
- Определение: Мера неопределённости или непредсказуемости распределения вероятностей.
- Примеры использования: Определение степени хаоса в системе.
- Область использования: Информатика, статистика, теория информации.
- Эксперимент (Experiment)
- Определение: Проведение серии тестов и испытаний для проверки гипотез и поиска оптимальных параметров модели.
- Примеры использования: Эксперименты с разными архитектурами нейронных сетей.
- Область использования: Научные исследования, разработка новых методик.