技术博客

引领教育智能化新篇章:全球首个全场景教育基准EduBench的崛起

北京理工大学高扬老师团队开发了全球首个全场景教育基准EduBench,助力教育领域大模型的发展。该基准涵盖9种教育场景,包含超4000个教育情境,并从12个评估维度进行评测。通过多维度评估指标体系与人工标注一致性计算,确保结果可靠性,推动智能教育进程。

教育基准大模型发展智能教育评估维度教育场景
2025-06-03
大模型发展之路:实际应用中的机遇与挑战

在QCon闭门会议上,专家们深入探讨了大模型在实际应用中的快速发展、面临的挑战及解决方案。会议强调,大模型的落地虽取得显著进展,但仍存在诸多困难,如资源消耗与效果平衡问题。专家指出,不应盲目追求模型微调,而应根据具体场景选择最优策略,以突破困境并提升效率。

大模型发展实际应用挑战解决模型微调QCon会议
2025-04-16
大模型发展之路:技术突破与争议并存

在大模型领域的近两年发展中,显著的成就与争议并存。特别是在自然语言处理方面,国内大模型取得了长足进步,性能大幅提升。多个权威评测显示,部分国内模型已达到国际先进水平。这一进展不仅体现了技术的进步,也标志着中国在人工智能领域的竞争力不断增强。

大模型发展技术进步自然语言国内模型权威评测
2025-02-06
聚焦核心业务:大模型发展的新机遇与挑战

在2024年,大模型的发展依然是行业焦点,尤其在下半年,“射程”讨论逐渐升温。业界领袖们专注于核心业务,力求快速收获易于实现的成果,同时探索如何超越大模型厂商和互联网巨头的影响力范围。面对激烈的竞争,他们必须应对这些挑战,避免不必要的颠覆性讨论,确保资源集中在最具潜力的领域。

核心业务大模型发展射程讨论快速收获超越巨头
2025-01-23
大模型发展的新篇章:人工智能应用竞争的时代来临

商汤科技的贾安亚指出,大模型的发展趋势正促使人们更熟练地掌握和使用人工智能技术。当前,大模型领域的焦点已从模型本身转向应用层面的竞争。随着这一转变,企业与开发者们更加注重如何将先进的大模型技术应用于实际场景中,以解决具体问题并创造更多价值。这种变化不仅推动了技术的进步,也使得人工智能的应用更加广泛和深入。

大模型发展人工智能应用竞争商汤科技技术使用
2024-12-23