RTP-LLM引擎:阿里巴巴集团高性能语言模型推理加速的黑科技
阿里巴巴集团的大模型预测团队开发了RTP-LLM引擎,这是一款高性能大型语言模型(LLM)推理加速工具。该引擎通过通用的投机采样框架,支持多种技术以减少推理延迟并提升吞吐量,已在淘宝、天猫、高德地图和饿了么等核心业务中广泛应用,显著优化了大模型推理效率。
RTP-LLM引擎大模型推理投机采样阿里巴巴集团高性能语言模型
2025-04-14
探秘Alibaba Kernel:源自RHEL6的进阶之作
Alibaba Kernel是一款由阿里巴巴集团基于RHEL6源代码自主研发的操作系统内核。这款内核不仅继承了RHEL6的所有核心功能,还加入了阿里巴巴特有的更新和新特性,旨在为用户提供更加稳定、高效的服务。为了更好地掌握Alibaba Kernel的安装、配置及使用方法,推荐访问其官方文档网站获取详细指导。
Alibaba KernelRHEL6源代码阿里巴巴集团操作系统内核代码示例
2024-09-30
AI热点
1
2025-08-15
AI技术新篇章:龙蜥智算联盟成立,推动资源共享与落地