Debug Latency - Additional Signals of Services

查看原文

本文介绍了如何在服务响应时间偏高后快速定位问题,解决方案是做 service tracing。监控除了采集应用的 latency,也采集依赖服务的调用或者方法的 latency,面板上可以在应用 latency 偏高后转而查看具体依赖的 latency distribution heatmap,如果能定位到具体的机器或者进程就更好了,可以转到具体的机器去排查 utilization 和内存什么的。从方法上来说,就是有办法 drilldown 到具体的病灶,链条不能断。