问题描述:
最近在折腾云手机项目,遇到一些内核层面的性能瓶颈,想请教各位技术大佬有没有优化经验!
背景:
我们团队基于ARM服务器搭建了一套云手机集群,用KVM做虚拟化,底层是裁剪过的Android系统。测试时发现,多用户并发场景下(比如50+实例同时运行),内核调度延迟明显增加,UI响应变卡,甚至出现帧丢失。初步定位到问题可能和CFS调度器、内存管理(尤其是匿名页回收)有关,但具体优化方向还拿不准。
尝试过的方案:
sched_latency_ns
和min_granularity_ns
,对轻负载有改善,但高并发时效果有限;group scheduling
方案,但改内核代码的风险有点大,怕引入稳定性问题。(PS:目前用的内核是5.10,如果能推荐适合云手机的版本分支就更好了!)