6. 性能分析
最后更新于
最后更新于
Cpu 和 Gpu 的协作 Cpu 应当把 Draw Command Batch 起来,一起给 GPU 使用
Cpu 分 Gamethread 和 RenderThread
Gamethread 更新游戏数据 RenderThread 提交绘制指令
最慢的一环决定了 FPS
Vulkan 可以使用时间戳来 Profiler
可能耗时过度的地方
Cpu 的 SIMD 和 Gpu 的 SIMT
Gpu 一个 wap 执行多个 (32)线程,
Warp Scheduler GPU 调度
Memory Access
显存访问
也有 Cache Line 的概念
Graphics pipeline 的具体硬件调用
Nsight Graphics
不同平台瓶颈不一致,以实测为准
[Programming Guidelines and GPU Architecture Reasons Behind Them](Slide 1 (gputechconf.com))