6. 性能分析

Introduction

Cpu 和 Gpu 的协作 Cpu 应当把 Draw Command Batch 起来,一起给 GPU 使用

Cpu 分 Gamethread 和 RenderThread

Gamethread 更新游戏数据 RenderThread 提交绘制指令

image.png

最慢的一环决定了 FPS

Vulkan 可以使用时间戳来 Profiler

image.png

可能耗时过度的地方

image.png

Basic GPU Arch

Cpu 的 SIMD 和 Gpu 的 SIMT

image.png

Gpu 一个 wap 执行多个 (32)线程,

image.png

Warp Scheduler GPU 调度

image.png

Memory Access

显存访问

image.png

也有 Cache Line 的概念

image.png

Graphics pipeline 的具体硬件调用

image.png

GPU Profiling

Nsight Graphics

不同平台瓶颈不一致,以实测为准

Reference

最后更新于

这有帮助吗?