News

Guangdong BAIDU Special Cement Building Materials Co.,Ltd
— 新闻中心 —

英伟达 RTX 神经纹理紧缩手艺基准测试:最高可下

IT之家 2 月 9 日新闻,YouTube 频道 Compusemble 对英伟达的 RTX 神经纹理紧缩(NTC)技巧停止了基准测试,展现了该技巧在现实 3D 任务负载中的强盛才能。测试成果表现,与传统纹理紧缩技巧比拟,RTX NTC 技巧可能将纹理内存巨细年夜幅下降 96%。IT之家留神到,Compusemble 在 RTX 4090 显卡上分辨以 1440p 跟 4K 辨别率对 NTC 技巧停止了测试。测试分为两种形式:“NTC 转码为 BCn”跟“样本推理”。此中,“NTC 转码为 BCn”形式会在加载时将纹理转码为 BCn 格局;而“样本推理”形式则仅对衬着特定视图所需的单个 texel 停止解紧缩,从而进一步增加纹理内存巨细。在 1440p 辨别率下,当启用 DLSS 超分功效时,“NTC 转码为 BCn”形式将测试利用的纹理内存占用从 272MB 下降至 98MB,增加了 64%。而“样本推理”形式则将纹理巨细降至仅 11.37MB,与非神经紧缩技巧比拟,内存占用增加了 95.8%,与之前的神经紧缩形式比拟增加了 88%。不外,启用 RTX 神经纹理紧缩技巧后,机能会遭到必定影响。只管如斯,因为测试应用的是上一代 RTX 4090 显卡,而非最新的 RTX 5090 显卡,因而跟着新一代架构的推出,机能丧失可能会有所增加。在“NTC 转码为 BCn”形式下,均匀 FPS 与未启用 NTC 时比拟多少乎不变更。而“样本推理”形式的机能降落最为显明,FPS 从 1600 多帧的中等程度降至 1500 多帧的中等程度,1% 的低值更是年夜幅降至 840 帧阁下。当应用 TAA 抗锯齿而非 DLSS 超分时,内存容量的增加情形与 DLSS 雷同,但 GPU 的机能表示有所差别。三种形式的运转速率都显明快于 DLSS,FPS 濒临 2000 帧。在“样本推理”形式下,1% 的低值到达 1300 多帧,比 840 帧有了明显晋升。将辨别率晋升至 4K 后,机能明显降落。启用 DLSS 超分功效时,“NTC 转码为 BCn”形式的均匀 FPS 在 1100 帧阁下,“样本推理”形式的均匀 FPS 则略低于 1000 帧,两种形式的 1% 低值都在 500 帧阁下。而封闭 DLSS,改用原生辨别率搭配 TAA 抗锯齿时,“NTC 转码为 BCn”形式的均匀 FPS 晋升至 1700 帧阁下,“样本推理”形式的均匀 FPS 在 1500 帧阁下。前者的 1% 低值略低于 1100 帧,后者的 1% 低值略低于 800 帧。别的,Compusemble 还在 4K 辨别率下,针对“样本推理”形式测试了协同向量功效。启用协同向量时,均匀帧率在 1500 帧阁下;封闭协同向量时,均匀 FPS 急剧降落至略低于 650 帧。1% 的低值在启用协同向量时略低于 750 帧,封闭时略高于 400 帧。Compusemble 的基准测试标明,英伟达的神经紧缩技巧可能在年夜幅增加 3D 利用纹理内存占用的同时,以就义必定机能为价值,尤其是在“样本推理”形式下。RTX 神经纹理紧缩技巧曾经开辟了至少多少年时光。这项新技巧应用古代英伟达 GPU 中的张量中心来紧缩 3D 利用跟游戏纹理,而非传统的块截断编码。RTX NTC 是自 1990 年月以来纹理紧缩技巧的初次严重进级,可能支撑比以后 GPU 运转的纹理辨别率超过四倍的纹理。现在,RTX NTC 技巧仍处于测试阶段,尚未断定宣布日期。风趣的是,其最低硬件请求仿佛并不高。英伟达在 GitHub 上的 RTX NTC 页面确认,最低 GPU 请求是 RTX 20 系列显卡。别的,该技巧还已在 GTX 10 系列显卡、AMD Radeon RX 6000 系列显卡以及 Arc A 系列显卡上失掉验证,这象征着将来该技巧无望在非 RTX 显卡乃至游戏主机上失掉普遍利用。
Tel
Mail
Map
Share
Contact