Математики придумали более простой способ умножения матриц — он может стать основой прорыва в ИИ - PCnews.su

В основе искусственного интеллекта лежит матричное исчисление, которое только что пережило самый большой подъем более чем за десятилетие. Почти одновременно вышли две статьи, в которых математики объяснили, как повысить эффективность перемножения матриц. С помощью новых алгоритмов искусственный интеллект сможет быстрее обучаться на менее мощном оборудовании и таким же образом быстрее решать задачи.

Источник изображения: ИИ-генерация Кандинский 3.0/3DNews

Суть проблемы в том, что до относительно недавнего времени человечество в лице математиков не представляло иного способа умножения матриц, чем выполнением n3 операций (где n — размерность матриц). Для матрицы 3 × 3, к примеру, необходимо было совершить 27 умножений. В идеальном же для математиков мире умножение матриц хотелось совершать за n2 операций. И к началу 70-х годов процесс поиска соответствующего алгоритма пошёл. Нетрудно догадаться, что к этому побудило распространение вычислительных машин.

Значительный прогресс в данной сфере совершил в 1981 году математик Арнольд Шёнхаге. Он доказал, что умножение матриц можно выполнить за n2,522 шагов. Позже этот метод был назван «лазерным методом» (laser method). Все последующие продвижения к заветной «второй степени» базировались на улучшениях лазерного метода.

Заявленный в новых статьях прорыв, совершённый в 2023 году, произошёл в результате обнаружения «скрытых потерь» в лазерном методе. В ноябре 2023 года Ран Дуань и Ренфэй Чжоу из Университета Цинхуа представили метод, который устранил неэффективность лазерного метода, установив новую верхнюю границу числа необходимых операций примерно на уровне n2,371866. Это достижение ознаменовало самый существенный прогресс в этой области с 2010 года. Но всего два месяца спустя Вирджиния Василевски Уильямс, Инчжан Сюй и Цзысюань Сюй из Массачусетского технологического института опубликовали вторую статью, в которой подробно описали ещё одну оптимизацию, которая снизила верхнюю границу количества операций до n2,371552.

Этапы на пути движения ко «второй степени» и имена учёных, совершавших прорывы

Безусловно, точное влияние на скорость работы моделей искусственного интеллекта зависит от конкретной аппаратной архитектуры системы ИИ и от того, насколько сильно задачи конкретной модели зависят от умножения матриц. Поэтому повышение эффективности алгоритмов будут сочетать с оптимизацией оборудования, чтобы полностью реализовать потенциальный прирост скорости. Но все же, по мере того, как улучшения в алгоритмических методах будут накапливаться с течением времени, искусственный интеллект будет становиться быстрее — это факт.

Источник

11.03.2024

Математики придумали более простой способ умножения матриц — он может стать основой прорыва в ИИ

Добавить комментарий

Microsoft ещё не оправилась от покупки Activision Blizzard, но уже засматривается на новые игровые студии

Китайский марсоход «Чжужун», возможно, обнаружил береговую линию древнего океана

YouTube на Quest запускает функцию совместного просмотра — до 7 друзей в одном VR-кинозале

Никаких «красных линий»: Microsoft продолжит выпускать эксклюзивы Xbox на PS5 и Switch

YouTube на Quest запускает функцию совместного просмотра — до 7 друзей в одном VR-кинозале

Статьи по теме

Добавить комментарий