华夏英才班学术交流——探秘分布式系统与微服务架构下的技术创新

发布时间:2024-03-13浏览次数:11

       中国科学技术大学华夏计算机科技英才班(以下简称“华夏英才班”)于2024年3月2日成功举办了一场学术交流讨论会,为老师和同学们带来了前沿科技研究的最新成果和深度思考。我们邀请到了12级华夏英才班的李弈帅和李也学长为我们分享他们在阿里云的最新工作成果。

       首先李弈帅学长作为讲座第一部分的主讲人,他的报告主题为《Clocks in Distributed Systems》,他从分布式系统中事件的并发性问题入手,介绍了不同组件之间需要对事件达成一致的“顺序”的重要性。他带着同学们了解了如何通过各种类型的“时钟”将事件映射到可排序的“时间戳”上,以实现此一致性。在演讲中,他详细定义了时间戳技术中的基本概念,包括可靠性和完备性,并介绍了不同种类的时钟实现方式,如集中式与分散式、物理与逻辑等,并重点讨论了各种实现方式的性能和可用性。最后他还分享了阿里巴巴云团队在集中式时间戳技术方面的最新研究成果。这项研究致力于提高集中式时间戳技术的可用性,为分布式系统中事件顺序的一致性提供更可靠的保证。

       第二位主讲人李也学长以《ShapleyIQ: Influence Quantification by Shapley Values for Performance Debugging of Microservices》为题,向同学们介绍了他们团队对于经济学领域常用的Shapley值在微服务系统故障定位进行应用的最新研究成果。随着信息技术的飞速发展,微服务系统作为一种分布式系统的架构风格,得到了广泛的应用。然而,微服务系统的复杂性也带来了调试和维护的挑战。李也研究员深入剖析了多年来在运维大型微服务系统过程中所积累的经验,并指出即使是看似相似的异常,由于系统组件间复杂的依赖关系,也可能引发不同的影响并需要采取不同的补救策略。基于这一认识,他们团队开发了ShapleyIQ这一在线监控与诊断服务。这项服务通过精确分析因果图中的Shapley值来精准定位微服务系统故障的根因,并通过引入分裂不变性特性,克服了传统Shapley值计算的高复杂性问题。据介绍,ShapleyIQ已在阿里云数据库的微服务系统上运行超过一年,服务于至少86个微服务组件和2546台机器,显著提高了DevOps效率并将系统故障减少了83.3%。此外,他们还在开源微服务系统Train-Ticket上进行了对ShapleyIQ的评估,结果显示,在识别微服务系统故障根因方面的准确率达到97.3%,比基准算法至少提高了28.7%。这项工作已在顶级会议ASPLOS2023上发表。

       报告最后,同学们针对学长们所介绍的新兴研究领域以及当前的企业界科研环境都进行了积极提问,并得到了学长们的耐心解答。同学们不仅对最新的技术研究成果有了更深入的了解,还对自己的未来职业发展有了更加清晰的定位。

       这场学术交流报告会吸引了众多师生的积极参与,为师生们提供了一个深入学习和交流的平台。华夏英才班将继续致力于推动前沿科技研究,培养高素质的科技人才,为国家的科技创新和发展做出更大的贡献。相信在这样一个学术氛围浓厚的环境中,未来必将涌现出更多的科技创新和思想火花。