GeForce 40
| GeForce RTX 40 Series | |
|---|---|
| | |
| Кодовое имя | AD10x |
| Архитектура | Ada Lovelace |
| Дата выпуска | 12 октября 2022 |
| Модели по уровню | |
| Продвинутый | GeForce RTX 4080 |
| Для энтузиастов | GeForce RTX 4090 |
| Версии API | |
| Версия Direct3D и шейдеров |
Direct3D 12_2 Shader Model 6.5 |
| Версия OpenGL | OpenGL 4.6 |
| Версия OpenCL | OpenCL 3.0 |
| Версия Vulkan | Vulkan 1.2.140 |
GeForce 40 — семейство графических процессоров компании Nvidia. Серия была анонсирована 20 сентября 2022 года[1]. Видеокарты серии основаны на микроархитектуре Ada Lovelace.
История
20 сентября 2022 года на презентации исполнительный директор компании NVIDIA — Дженсен Хуанг, анонсировал архитектуру Ada Lovelace и первые продукты на ее основе - GeForce RTX 4090 и две GeForce RTX 4080 по цене MSRP 1599, 1199 и 899 долларов США соответственно. Также была представлена новая версия технологии умного сглаживания DLSS 3.0 и RTX Remix, предназначенная для модернизации графики[2].
14 октября 2022 года компания NVIDIA "деанонсировала" видеокарту GeForce RTX 4080 12GB в связи с путаницей в названии. Также опубликовала дату выхода GeForce RTX 4080 16GB - 16 ноября 2022 года.[3]
Архитектура
Архитектурные улучшения Ada Lovelace включают[4]:
- Ядра CUDA 9.x[5]
- Техпроцесс TSMC 4N
- Тензорные ядра четвёртого поколения с поддержкой FP8, FP16, bfloat16, TensorFloat-32 (TF32)
- Ядра трассировки лучей третьего поколения
- NVENC с аппаратной поддержкой AV1
Технические характеристики
| Модель | ? | RTX 4080[6] | RTX 4090[7] |
|---|---|---|---|
| Дата выхода | ? | 16.10.2022 | 12.10.2022 |
| GPU | AD104 | AD103 | AD102 |
| Технологический процесс изготовления | TSMC 4N | ||
| Площадь кристалла, мм² | 294.5 | 378.6 | 608.4 |
| Количество транзисторов, млрд | 35.8 | 45.9 | 76.3 |
| Количество скалярных процессоров (ядер CUDA) | 7680 | 9728 | 16384 |
| Количество тензорных ядер | 240 | 304 | 512 |
| Количество RT ядер | 60 | 76 | 128 |
| Количество кластеров обработки графики (GPC) | |||
| Количество блоков мультипроцессоров (SM) | 60 | 76 | 128 |
| Количество текстурных блоков (TMU) | |||
| Количество блоков растеризации (ROP) | |||
| Заполнение сцены, млрд пикс/с | 247.5 | 392.5 | |
| Заполнение сцены, млрд текс/с | 671.8 | 1141.8 | |
| Объём кэша L2, МБ | 48 | 64 | 96 |
| Разрядность шины видеопамяти, бит | 192 | 256 | 384 |
| Стандарт видеопамяти | GDDR6X | ||
| Объём видеопамяти, ГБ | 12 | 16 | 24 |
| Пропускная способность шины памяти, ГБ/с | 504 | 720 | 1008 |
| Интерфейс | PCI Express 4.0 x16 | ||
| Энергопотребление, Вт | 285 | 320 | 450 |
| Частота ядра, МГц | 2310 | 2210 | 2230 |
| Частота в режиме Turbo Boost, МГц | 2610 | 2510 | 2520 |
| Реальная (номинальная) частота видеопамяти, МГц | |||
| Производительность FP32, TFLOPS | 42.9 | 73.0 | |
| Производительность FP64, TFLOPS | 0.6 | 1.1 | |
| Производительность FP16, TFLOPS | 42.9 | 73.0 | |
| Производительность тензорных ядер FP16, TFLOPS | |||
| Производительность тензорных ядер INT8/INT4[8], TOPS | 194.9/389.8 | 330.3/660.6 | |
| Производительность RT ядер, Giga Rays/s | |||
| Операций трассировки лучей, Tera RTX-OPS/s | |||
| Поддержка версий API | Direct3D 12_2, OpenGL 4.6, Vulkan 1.2, OpenCL 3.0 | ||
| Поддержка версии Shader Model | Shader Model 6.5 | ||
Примечания
- ↑ GeForce Beyond: специальная трансляция на GTC. NVidia.
- ↑ NVIDIA представила GeForce RTX 4090 и две GeForce RTX 4080 — ускорители нового поколения с ценой от $899. 3dnews.
- ↑ NVIDIA разанонсировала GeForce RTX 4080 12GB и объявила дату выхода RTX 4080 16GB. 3dnews.
- ↑ NVIDIA Ada Lovelace Architecture (англ.). NVidia.
- ↑ I.7. Compute Capability 9.x (англ.). docs.nvidia.com.
- ↑ GeForce RTX 4080. www.nvidia.com.
- ↑ GeForce RTX 4090. www.nvidia.com.
- ↑ Целочисленные операции над значениями с 8 и 4 битами соответственно. (То есть 0..255 и 0..15) — «Turing’s tensor cores also support INT8 and even INT4 precisions. These are 2x and 4x faster than FP16 respectively» Архивная копия от 24 апреля 2020 на Wayback Machine
Ссылки
- GeForce RTX 40 на официальном сайте NVidia (рус.)