字节跳动Seed团队携手哥伦比亚大学商学院:开启金融搜索开源新纪元
马斯克近日分享了一篇关于字节跳动Seed团队与哥伦比亚大学商学院合作的报道,引发广泛关注。双方联合推出了名为FinSearchComp的金融搜索与推理基准测试,这是全球首个完全开源的金融领域基准测试。该基准包含635个由金融专家精心设计的问题,覆盖全球及大中华区市场,具有高度的专业性与实用性。研究团队还在多个主流金融模型产品上对FinSearchComp进行了全面评估,验证了其有效性与前瞻性。这一成果标志着金融人工智能评估体系的重要进展,也为行业提供了透明、可复用的技术标准。
马斯克字节跳动金融搜索开源基准哥伦比亚
2025-09-22
豆包代码大模型:开源基准中的性能翘楚
在字节跳动公司最新发布的开源基准中,豆包代码大模型的性能在多种编程语言中仅次于OpenAI的Claude模型。研究人员对“反思策略”和“N次推断策略”进行了比较。反思策略通过利用SandboxFusion提供的反馈上下文,对答案进行多次迭代精炼,以实现自我精炼的效果,这一策略参考了Madaan等人在2024年提出的自我精炼策略。而N次推断策略则仅进行有限次数的推断来得出结果。
豆包代码开源基准反思策略N次推断自我精炼
2024-12-05
AI热点
1
2025-10-25
ChatGPT引发自杀案:安全限制放宽背后的真相



