技术博客

360智脑开源Light-R1-32B:数学领域的突破性进展

2025年3月4日,360智脑宣布开源名为Light-R1-32B的人工智能模型及其全部训练数据和代码。该模型在数学领域表现卓越,超越了DeepSeek-R1-Distill。值得注意的是,Light-R1-32B仅需12台H800服务器运行6小时即可完成训练,且基于Qwen2.5-32B-Instruct模型发展而来,使用7万条数学数据进行训练。

开源模型Light-R1数学超越高效训练360智脑
2025-03-06
开源之光:360智脑携手北大打造低成本AI突破

360智脑与北京大学携手推出开源的Light-R1人工智能模型,该模型成本仅为1000美元,在数学领域首次实现了从零开始超越DeepSeek-R1-Distill的性能。此外,双方还发布了TinyR1-32B-Preview模型,此模型基于DeepSeek-R1-Distill-Qwen-32B训练,在数学、科学和代码理解方面取得了接近DeepSeek-R1完整版的效果。这些成果标志着低成本AI在专业领域的重大突破。

开源模型低成本AI数学超越北大合作TinyR1模型
2025-03-06
智能搜索技术:重塑IT行业未来与企业竞争力

到2025年,中国人工智能企业DeepSeek推出开源大型模型DeepSeek-R1,在全球AI领域引发技术革新。该模型以“低成本、高性能、开源开放”为特点,显著增强了企业的竞争力。通过智能搜索技术的应用,企业能够更高效地处理数据,优化决策流程,从而在全球市场中占据优势地位。DeepSeek-R1不仅代表了中国在AI技术上的独立进展,也改变了企业应用AI的常规模式。

智能搜索企业竞争DeepSeek开源模型低成本AI
2025-03-06
深度估计新篇章:单目深度估计算法的技术革新

西湖大学AGI实验室联合多家机构开发了一种新的单目深度估计算法。该算法采用创新的蒸馏技术,整合了多个开源模型的优势,在仅使用20000张无标签图像的数据集上训练,显著提升了深度估计的准确性,达到了新的单目深度估计性能最佳(SOTA)。这一突破为计算机视觉领域带来了重要进展。

单目深度估计蒸馏技术无标签图像开源模型性能最佳
2025-02-28
阿里巴巴Wan2.1视频生成模型开源:引领AI技术共享新篇章

阿里巴巴集团近日宣布全面开源其最新视频生成模型Wan2.1,此举在AI领域引发广泛关注。Wan2.1模型的开源不仅彰显了阿里巴巴在技术共享方面的诚意,也体现了其寻求突破、打造具有影响力的拳头产品的决心。面对DeepSeek等强劲竞争对手,阿里巴巴希望通过Wan2.1在AI视频生成领域占据重要地位。

视频生成开源模型阿里AIWan2.1技术共享
2025-02-27
Moonlight:开源Mixture of Experts模型的革新之路

Moonlight是由月之暗面公司推出的一款开源Mixture of Experts(MoE)语言模型。该模型采用Muon优化器进行训练,仅需激活3B参数即可运行。Moonlight在训练效率和性能方面均展现出卓越的表现,训练过程中的流畅度(FLOPS)也得到了显著提升。这一创新模型不仅降低了计算资源的需求,还提高了处理速度,为开发者提供了更高效的选择。

开源模型MoonlightMuon优化器3B参数训练效率
2025-02-27
【创新突破】BFS-Prover:引领数学推理的智能化变革

豆包团队开发的形式化数学推理模型BFS-Prover,超越了DeepSeek-Prover V1.5,实现了自动形式化数学定理证明。该模型直接开源,将数学命题和证明步骤转化为计算机可验证的代码,确保推理过程的绝对严谨性。此外,BFS-Prover还构建了一个可复用的数学知识库,为科学研究提供了坚实的基础。这是人工智能在数学推理领域的重要应用方向。

BFS-Prover数学推理自动证明开源模型知识库构建
2025-02-27
Wan2.1视频生成大模型:引领视频创作新篇章

Wan2.1视频生成大模型作为一款全面且开放的基础模型,显著扩展了视频生成的边界。该模型在多个标准测试中表现出色,持续超越现有的开源模型及市场上最先进的商业解决方案,彰显其卓越性能。这不仅为视频创作者提供了更强大的工具,也为视频生成领域带来了新的可能性。

Wan2.1模型视频生成性能超越开源模型商业解决方案
2025-02-26
突破与创新:BFS-Prover引领数学推理自动化新篇章

豆包公司推出了首个形式化数学推理模型BFS-Prover,该模型在设计上简洁高效,性能超越了DeepSeek-ProverV1.5。作为开源模型,BFS-Prover不仅为自动形式化定理证明领域注入新动力,还为数学研究提供了强大的自动化工具支持。随着大语言模型能力的不断提升,BFS-Prover的创新路线将进一步推动数学领域的自动化研究。

BFS-Prover数学推理自动证明开源模型定理证明
2025-02-25
中国智造的荣耀:DeepSeek-R1开源模型引领语言处理新篇章

DeepSeek-R1是中国开发的一款开源大型语言模型,在国际权威认证平台上表现卓越。在超过150万个模型的竞争中,DeepSeek-R1凭借其出色的性能和广泛的应用脱颖而出,赢得了超过1万的点赞,成为该平台上最受欢迎的开源大模型之一。这一成就不仅彰显了中国在人工智能领域的技术实力,也展示了DeepSeek-R1在实际应用中的巨大潜力。

DeepSeek-R1开源模型语言模型权威认证性能卓越
2025-02-24
美国AI初创公司Together AI的飞跃:3.05亿美元B轮融资的背后

美国AI初创公司Together AI近期完成了3.05亿美元的B轮融资,公司估值达到33亿美元。该公司专注于开源模型开发与应用,提供超过200个模型API服务,包括DeepSeek-R1。此外,Together AI还涉足GPU算力租赁服务,年收入已突破1亿美元。这一轮融资将助力公司在AI领域的进一步拓展和技术创新。

AI初创公司B轮融资开源模型模型APIGPU算力
2025-02-21
AI新篇章:开源短剧视频生成模型SkyReels-V1引领创新

近日,中国宣布开源首个人工智能短剧视频生成模型SkyReels-V1。该模型基于千万级好莱坞数据进行训练和微调,具备高度专业性。同时发布的还有首个SOTA级的表情动作可控算法,实现了对表情和肢体动作的精确控制。这一技术突破将为影视创作带来革命性的变化,极大地提升内容生产的效率与质量。

人工智能开源模型短剧视频表情控制肢体动作
2025-02-18
DeepSeek-R1:开源大型语言模型的崛起之路

DeepSeek-R1作为一款开源的大型语言模型,在Hugging Face平台上的下载量已突破1000万次,成为最受欢迎的开源大模型之一。最新数据显示,上个月该模型的下载量高达370万次。随着全球知名度迅速提升,预计本月下载量将至少达到800万次。DeepSeek-R1以其卓越性能和开放性吸引了大量开发者和研究人员的关注。

DeepSeek-R1开源模型下载量Hugging语言模型
2025-02-17
DeepSeek Math:小参数量的大作为

DeepSeek Math是DeepSeek系列模型的一员,于2024年2月发布。尽管该模型仅有7B参数量,但在数学基准测试中的表现却超越了许多参数量在30B至70B之间的开源模型。这一成果展示了DeepSeek Math在数学领域的卓越性能和高效利用参数的能力。

DeepSeek Math7B参数量数学测试开源模型2024发布
2025-02-17
开源新纪元:OpenThinker-32B推理模型的崛起

近日,斯坦福大学与加州大学伯克利分校等机构联合发布了一款名为OpenThinker-32B的开源推理模型。该模型在性能上接近DeepSeek-R1-32B,并在某些方面超越了李飞飞团队的s1模型。OpenThinker-32B的成功得益于其卓越的数据规模化处理能力、严格的验证流程及出色的模型扩展性,使其成为当前人工智能领域的焦点之一。

开源模型性能对比数据处理验证流程模型扩展
2025-02-14
“VideoWorld': 视觉认知驱动下的视频生成革命

最新的视频生成模型'VideoWorld'取得了突破性进展,它摒弃了依赖语言模型的传统方法,转而仅依靠视觉认知来理解世界。这一模型现已对外开源,标志着视频生成技术的一个新里程碑。'VideoWorld'基于潜在动态模型构建,能够高效地压缩视频帧之间的变化信息,从而显著提高知识学习的速度和效果。通过这种创新的方法,'VideoWorld'不仅提升了视频生成的质量,还为未来的视觉技术发展奠定了坚实的基础。

视频生成视觉认知开源模型动态压缩知识学习
2025-02-14