В этом материале мы рассмотрим производительность видеокарты GeForce GTX 1070 Ti в Stable Diffusion.
Характеристики видеокарты:
- Модель — MSI GeForce GTX 1070 Ti Gaming 8G
- Объем памяти — 8 Гб
- Частота видеопроцессора — 1607/1683 МГц
- Частота памяти — 8008 МГц
- Тип памяти — GDDR5
- Разрядность шины памяти — 256 бит
Для понятности все результаты представлены в секундах и минутах при генерации одного изображения. Если вы новичок в этой сфере, то стоит понимать, что сделать хорошее изображение с первой попытки практически невозможно. Обычно нужно хотя бы 10 генераций, чтобы получить от 1 до 3 хороших результатов.
Генерация на моделях SD 1.5
Настройки теста:
- Интерфейс — Automatic1111 v1.6.0
- Модель — CyberRealistic v3.2
- Sampling steps — 23
- Sampling method — DPM++ 2M Karras
Настройки видеокарты на автомате, т.е. без дополнительного разгона, даунвольтинга и т.п. Настройки Automatic1111 также стандартные.
Представленные ниже изображения сжаты для более быстрой загрузки сайта. Из-за этого их качество может быть хуже того, что получилось при генерации.
512х512 — 10 сек. (26214 пикселей в сек.)
768х768 — 27 сек. (21845 пикселей в сек.)
1024х1024 — 1:01 мин. (17189 пикселей в сек.)
1280х1280 — 2:03 мин. (13320 пикселей в сек.)
В целом 1070 Ti хорошо себя показывает вплоть до разрешения 768х768. При большем разрешении ждать 10-20 минут при генерации 10 изображений становится уже не очень комфортно.
Генерация одного изображения 2048х2048 занимает 10:34 мин. (6615 пикселей в сек.). На практике такие большие изображения практически никто не делает, просто оставляем эти данные для статистики. Также генерация таких больших изображений на видеокарте с 8 Гб может приводить к вылетам программы.
Генерация на моделях SD 1.5 с апскейлом
Наиболее разумный по времени и трудозатратам способ создания изображений в высоком разрешении — генерация с последующим апскейлом (upscale — масштабирование). Например, вы генерируете изображение 512х512 и апскейлите его в 2 или 3 раза до 1024х1024 или 1536х1536 соответственно.
512х512 + Upscaler 4x-UltraSharp до 1024х1024 — 1:02 мин.
512х512 + Upscaler 4x-UltraSharp до 1536х1536 — 4:12 мин.
768х768 + Upscaler 4x-UltraSharp до 1536х1536 — 3:46 мин.
Генерация на моделях SDXL 1.0
Настройки теста:
- Интерфейс — Automatic1111 v1.6.0
- Модель — SD XL v1.0
- Sampling steps — 50
- Sampling method — Euler
512х512 — ~1:00 мин. (4369 пикселей в сек.)
При низком разрешении работать с этой моделью практически невозможно, изображения получаются очень плохого качества.
768х768 — ~1:15-2:20 мин. (7864-4537 пикселей в сек.)
При таком разрешении картинка получается с хорошей детализацией, но в некоторых местах видны пиксели.
1024х1024 — ~4:20-8:00 мин. (4032-2184 пикселей в сек.)
Здесь изображение уже стабильно хорошего качества, но время генерации не радует.
При работе с SDXL результаты по времени очень нестабильны. Работать не комфортно, но при очень большом желании можно. Например, для получения последнего примера нам понадобилось 9 генераций, т.е. около часа времени.
Вывод
GeForce GTX 1070 Ti — неплохая видеокарта начального уровня для Stable Diffusion. Хорошо подойдёт тем, для кого генерация изображений скорее развлечение, чем работа, а также тем, кто планирует делать не более 1-2 изображений в день. Если вы планируете сделать Stable Diffusion своей работой, создавать сложные композиции, либо редактировать фотографии, то 1070 Ti будет не лучшим выбором.