参数配置 / Configuration
GPU 硬件规格
模型结构
推理任务设置
利用率 (MFU)
90%
首字延迟 (TTFT)
--
ms每字延迟 (TPOT)
--
ms吞吐量 (Throughput)
--
tok/s
📖
核心详解
Understanding Results
📊
硬件规格表
GPU Specs Ref
💡
推理优化贴士
Expert Tips
Logic Execution Trace
[SYSTEM] 等待用户输入并触发计算...