Разработчики представили пятую версию системы генеративного искусственного интеллекта MidJourney, способную создавать изображения по текстовым описаниям. В настоящий момент новая версия генеративной ИИ-сети доступна в рамках программы альфа-тестирования для тех, кто подписан на сервис MidJourney. Подписку можно оформить в официальном канале разработчиков в Discord.
По словам графического дизайнера Джули Виланд (Julie Wieland), часто публикующей в Twitter изображения, созданные с помощью MidJourney, генеративная сеть MidJourney v5 научилась создавать практически фотореалистичные изображения.
«MJ v5 ощущается так, как будто вы наконец-то надели очки после того, как долго страдали от недостатка зрения. Неожиданно всё вокруг вы видите, как в 4K. Это одновременно ошеломляет и удивляет», — прокомментировала Виланд.
Виланд, давно наблюдающая за развитием генеративной сети MidJourney, поделилась изображениями, демонстрирующими прогресс в её эволюции. Её первая версия была представлена в марте 2022 года. До третьей версии генеративная сеть добралась в августе, а четвёртая версия была представлена в ноябре. Ниже представлены примеры, демонстрирующие прогресс в развитии этой технологии. С каждым новым поколением нейросеть училась создавать более сложные и детализованные изображения.
MidJourney работает по тому же принципу, согласно которому работают другие генеративные системы искусственного интеллекта, вроде Stable Diffusion и DALL-E. Они создают изображения на основе заданного текстового описания (промта), используя ИИ-модель, обученную на основе миллионов изображений, созданных людьми.
За день экспериментов MidJourney v5 Виланд пришла к выводу, что нейросеть значительно продвинулась вперёд. Она научилась «невероятно реалистично» передавать текстуру кожи и черты лица, создаёт более реалистичное и кинематографическое освещение, лучше передаёт отражения, блики и тени, выбирает более выразительные ракурсы и общий план, «а глаза научилась создавать практически идеально».
Также MidJourney v5 научилась лучше рисовать руки и зубы. В описании к MidJourney v5 указывается, что генеративная система искусственного интеллекта получила расширенный стилистический диапазон, у неё повышена отзывчивость на запросы, разрешение сгенерированных изображений увеличено в два раза. Кроме того, улучшены динамический диапазон и детализация.