当前位置:首页 > 产品中心 > AI >

T-Eye

T-Eye 是浪潮自主研发的微架构级应用特征监控分析系统,用支持实时分析服务器基本状态、关键计算指标、关键AI函数执行时序的统计分析,以及AI计算过程中的通信性能分析等,助力用户分析影响计算性能的应用瓶颈,最大限度地在现有平台挖掘化系统或代码的计算潜力,提升应用性能。
产品特性

系统性能剖析

  显示各指标的数据分布情况,横向比较包括Node, OS, CPU, GPU在内的各项指标,发掘各指标对应用性能的影响及相互之间的关联关系,发现性能瓶颈。

  1

  应用性能全面分析

  支持对应用性能的全面分析,包括GPU加速卡性能、CPU计算力、内存、通信链路性能、存储I/O、网络I/O等,为用户提供系统层、硬件层的性能采集与分析。

  2

  函数分析

  支持采集分析CUDNN 核心函数的调用情况,支持GPU 占空比与函数调用分布图,通过分析采集的CUDNN函数调用信息, TEYE3.0引入“GPU占空比”标识计算过程中GPU的实际使用情况。TEYE3.0支持AI应用过程中CUDNN函数调用分布图的展示,包括函数名、函数入参、调用开始结束时间、函数性能等,函数调用分布图可以帮助用户快速定位AI应用运行过程中的瓶颈步骤。

  3

  通信分析

  支持采集分析AI计算过程中的通信性能,包括PCIE带宽、NVLINK带宽信息,结合通信链路拓扑结构,用户可以直观掌握计算过程中CPU<->GPU、GPU<->GPU间的通信情况,可定位程序运行热点段对各种硬部件的依赖程度,快速定位网络性能瓶颈,找到应用优化的空间和方向。

  4


技术规格
×
提示信息:
确认