6. 性能分析
Introduction
Cpu 和 Gpu 的协作 Cpu 应当把 Draw Command Batch 起来,一起给 GPU 使用
Cpu 分 Gamethread 和 RenderThread
Gamethread 更新游戏数据 RenderThread 提交绘制指令

最慢的一环决定了 FPS
Vulkan 可以使用时间戳来 Profiler

可能耗时过度的地方

Basic GPU Arch
Cpu 的 SIMD 和 Gpu 的 SIMT

Gpu 一个 wap 执行多个 (32)线程,

Warp Scheduler GPU 调度

Memory Access
显存访问

也有 Cache Line 的概念

Graphics pipeline 的具体硬件调用

GPU Profiling
Nsight Graphics
不同平台瓶颈不一致,以实测为准
Reference
[Programming Guidelines and GPU Architecture Reasons Behind Them](Slide 1 (gputechconf.com))
最后更新于
这有帮助吗?