Mooncake项目近期在与SGLang和vLLM等主流大型模型推理框架的合作中取得了重要突破。通过提供whl包,支持pip安装及docker镜像部署,成功实现了PD分离框架,大幅提升了模型推理效率。这一进展为开源社区带来了更便捷的使用体验,推动了大型模型技术的普及与发展。
客服热线请拨打
400-998-8033