Математики придумали более простой способ умножения матриц — он может стать основой прорыва в ИИ - PCnews.su

В основе искусственного интеллекта лежит матричное исчисление, которое только что пережило самый большой подъем более чем за десятилетие. Почти одновременно вышли две статьи, в которых математики объяснили, как повысить эффективность перемножения матриц. С помощью новых алгоритмов искусственный интеллект сможет быстрее обучаться на менее мощном оборудовании и таким же образом быстрее решать задачи.

Источник изображения: ИИ-генерация Кандинский 3.0/3DNews

Суть проблемы в том, что до относительно недавнего времени человечество в лице математиков не представляло иного способа умножения матриц, чем выполнением n3 операций (где n — размерность матриц). Для матрицы 3 × 3, к примеру, необходимо было совершить 27 умножений. В идеальном же для математиков мире умножение матриц хотелось совершать за n2 операций. И к началу 70-х годов процесс поиска соответствующего алгоритма пошёл. Нетрудно догадаться, что к этому побудило распространение вычислительных машин.

Значительный прогресс в данной сфере совершил в 1981 году математик Арнольд Шёнхаге. Он доказал, что умножение матриц можно выполнить за n2,522 шагов. Позже этот метод был назван «лазерным методом» (laser method). Все последующие продвижения к заветной «второй степени» базировались на улучшениях лазерного метода.

Заявленный в новых статьях прорыв, совершённый в 2023 году, произошёл в результате обнаружения «скрытых потерь» в лазерном методе. В ноябре 2023 года Ран Дуань и Ренфэй Чжоу из Университета Цинхуа представили метод, который устранил неэффективность лазерного метода, установив новую верхнюю границу числа необходимых операций примерно на уровне n2,371866. Это достижение ознаменовало самый существенный прогресс в этой области с 2010 года. Но всего два месяца спустя Вирджиния Василевски Уильямс, Инчжан Сюй и Цзысюань Сюй из Массачусетского технологического института опубликовали вторую статью, в которой подробно описали ещё одну оптимизацию, которая снизила верхнюю границу количества операций до n2,371552.

Этапы на пути движения ко «второй степени» и имена учёных, совершавших прорывы

Безусловно, точное влияние на скорость работы моделей искусственного интеллекта зависит от конкретной аппаратной архитектуры системы ИИ и от того, насколько сильно задачи конкретной модели зависят от умножения матриц. Поэтому повышение эффективности алгоритмов будут сочетать с оптимизацией оборудования, чтобы полностью реализовать потенциальный прирост скорости. Но все же, по мере того, как улучшения в алгоритмических методах будут накапливаться с течением времени, искусственный интеллект будет становиться быстрее — это факт.

Источник

11.03.2024