英伟达开源推理模型Llama Nemotron-253B:性能卓越引发行业关注
英伟达近期开源的Llama Nemotron-253B推理模型在数学编码与科学问答任务中表现出色,其准确率媲美参数量两倍于自身的DeepSeek-R1。该模型吞吐量为Llama 4的四倍,得益于团队创新采用的测试时缩放(test-time scaling)技术,显著提升了性能。这一成果不仅展现了模型高效处理推理任务的能力,也为行业提供了新的研究方向。
开源模型推理任务数学编码科学问答测试时缩放
2025-04-09
英伟达开源Llama Nemotron-253B:推理效率的革命性飞跃
英伟达近期开源的Llama Nemotron-253B推理模型在数学编码与科学问答领域表现卓越,其参数数量仅为DeepSeek-R1一半时,性能却几乎持平,且推理效率提升了四倍。这一突破得益于测试时缩放技术的应用,为行业提供了高效解决方案。
开源模型推理效率数学编码科学问答测试缩放技术
2025-04-09
Search版o1:开启人工智能资料查找新纪元
近日,一款名为“Search版o1”的人工智能系统问世,该系统由清华大学和中国人民大学联合研发。它在博士级别的科学问答、数学和编程能力的11项评测中表现出色,获得了10项第一名。特别值得一提的是,“Search版o1”能够在推理过程中主动查找资料,这一特性使其整体性能优于人类专家,为科学研究和教育领域带来了新的突破。
Search版o1人工智能资料查找清华人大科学问答
2025-01-20
AI热点
1
2025-05-10
Jim Fan谈机器人领域革新:物理图灵测试与具身Scaling Law解析