技术博客

3D版DeepSeek开源新篇章:两大模型领跑SOTA

本月,3D版DeepSeek项目在开源领域取得显著进展,两大基础模型性能率先达到SOTA,标志着技术的重大突破。尤其在VAST领域,3D生成版DeepSeek展现出卓越性能,达到了全新高度,为视觉艺术与科学带来革命性影响。

3D版DeepSeek开源进展SOTA性能VAST领域3D生成技术
2025-03-31
深入解析金融大模型:DeepSeek-R1的突破与创新

上海财经大学统计与数据科学学院张立文教授领导的金融大语言模型课题组(SUFE-AIFLM-Lab),联合多家机构,发布了名为DeepSeek-R1的金融领域推理型人工智能大模型。该模型参数规模为7B,在性能上媲美671B参数的满血版,标志着开源金融领域R1类推理大模型的重要突破。这一成果将推动金融行业在数据科学与人工智能领域的应用与发展。

金融大模型DeepSeek-R1开源进展人工智能数据科学
2025-03-27
DeepSeek项目开源新里程:梁文峰领航,三大创新技术引领LLM训练变革

DeepSeek项目在开源领域取得了显著进展,梁文峰亲自参与开发。项目在第四天连续发布了三个新项目:DualPipe、EPLB以及优化计算与通信重叠的并行策略。这些创新技术显著提升了大型语言模型(LLM)的训练效率,降低了成本,同时保持了模型的高性能。这一系列成果标志着DeepSeek项目在推动AI技术发展方面迈出了重要一步。

DeepSeek项目开源进展梁文峰训练效率降低成本
2025-02-27