Страница 4: Тесты: DLSS 3.0 и Frame Generation
Технология Deep Learning Super Sampling (DLSS) оказалась весьма удачной для NVIDIA. В случае ноутбуков она дает немало преимуществ, в том числе более высокую эффективность и производительность. С DLSS можно комфортно играть даже на слабых видеокартах, что показала наша прошлогодняя статья по ссылке выше. С линейкой GeForce RTX 40 NVIDIA перешла на версию DLSS 3.0, которая содержит различные улучшения. DLSS 3.0 входит в набор функций Max-Q и поддерживается на всех мобильных видеокартах RTX 40.
Предыдущая версия технологии DLSS 2 теперь называется DLSS Super Resolution. GPU выполняет рендеринг кадров игры в меньшем разрешении, затем результат сравнивается с идеальными кадрами в сети машинного обучения NVIDIA, после чего синтезируется итоговый кадр, который выводится на экран. Нагрузка на видеокарту снижается, по качеству картинки компромиссы минимальны, иногда оно даже повышается. Новая технология DLSS 3 дополняется созданием кадров (Frame Generation), она может работать только на чипах Ada с четвертым поколением ядер Tensor и новыми ускорителями Optical Flow в ядрах RT.
Вместо рендеринга кадра в низком разрешении и дальнейшего масштабирования до разрешения дисплея (включая реконструкцию потерянных деталей через ИИ), DLSS 3 создает полные кадры через технологию Optical Multi Frame Generation. Конечно, здесь требуется аппаратное ускорение вычислений. Используются ядра Tensor и ускорители Optical Flow ядер RT.
Для создания кадра необходимы следующие составляющие: предыдущий кадр, так называемое поле Optical Flow, создаваемое ускорителями в ядрах RT, и некоторые сведения от игрового движка, такие как векторы движения и информация глубины.
Ускорители Optical Flow анализируют два последовательных кадра и создают из них поле Optical Flow. Поле Optical Flow содержит информацию о направлении и скорости движения пикселей при переходе с первого кадра на второй. Ускоритель Optical Flow захватывает информацию на пиксельном уровне, такую как частицы, отражения, тени и освещение, которая отсутствует в векторной информации игрового движка.
И если ускоритель Optical Flow отслеживает эффекты на пиксельном уровне, то на уровне геометрии DLSS 3 получает информацию о векторах движения (Motion Vectors) от игрового движка.
Для каждого пикселя сеть DLSS Frame Generation на основе искусственного интеллекта определяет, как использовать информацию векторов движения игры, поля Optical Flow и выводимые игрой кадры. Благодаря векторам движения игры и полю Optical Flow сеть Frame Generation может точно отслеживать движение объектов, восстанавливать геометрию и эффекты.
DLSS 3 – многослойная реализация DLSS. Сначала с помощью DLSS Super Resolution создается кадр в четверти от разрешения монитора (например, 1.920 x 1.080 вместо 3.840 x 2.160 пикселей). Второй кадр создается уже через DLSS Frame Generation. Для третьего кадра вновь используется DLSS Super Resolution, а для четвертого - DLSS Frame Generation. Таким образом, только 1/8 пикселей, которые будут выведены на дисплей, проходят непосредственно через классический рендеринг и потоковые процессоры.
Однако при работе DLSS 3 и Frame Generation увеличивается задержка ввода. Чтобы противодействовать этому, NVIDIA встроила в DLSS 3 технологию Reflex. GPU и CPU синхронизируются, чтобы обеспечить минимальные системные задержки. Таким образом, DLSS 3 обещает уполовинить задержки в два раза.
DLSS 3 также дает преимущество в играх, которые упираются в ограничения СPU или GPU, не способных выдавать высокую частоту кадров. В данном случае меняется классическая зависимость от CPU или GPU. В подобных ситуациях NVIDIA ожидает, как минимум, двукратный прирост частоты кадров, поскольку каждый второй кадр создает видеокарта.
DLSS 3 будет поддерживаться в десятках играх, список постоянно увеличивается. Подробности технологии, тесты и сравнение качества приведены в нашем обзоре NVIDIA GeForce RTX 4090 Founders Edition.
Сравнение качества
A Plague Tale: Requiem: родной рендеринг против DLSS: качество