AI模型训练新策略:早期接触毒性数据的鲁棒性提升之道
哈佛团队研究表明,让大型AI模型在训练初期接触10%的有毒数据(如仇恨言论、极端政治观点等),并在后续训练中学习如何正确处理这些内容,可显著提升模型的鲁棒性和安全性。这种方法模拟真实世界的复杂环境,使AI更好地应对敏感话题。
AI模型训练有毒数据处理鲁棒性提升哈佛研究安全性增强
2025-06-16
“RealSyn数据集:开启AI图文理解新纪元”
格灵深瞳公司近期发布了名为RealSyn的大规模数据集,该数据集包含1亿组图文配对。其独特之处在于,每张图片不仅与多个真实的文本描述相关联,还与合成的文本描述相匹配。这种设计为AI模型的训练提供了更加丰富和多样化的学习材料,有助于提升模型的理解能力和生成质量。
RealSyn数据集格灵深瞳图文配对AI模型训练合成文本
2025-04-28
AI视觉生成的突破:全球首个25秒AI视频背后的技术奇迹
Seed团队通过使用1000张H100 GPU,仅耗时66.5万H100 GPU小时(约27.7天连续运行),成功训练出一个7B参数的AI模型,并发布了全球首个25秒AI视频。这一成果验证了视觉生成领域的Scaling Law,为未来AI技术的发展提供了重要参考。
AI模型训练H100 GPU视觉生成Scaling Law25秒AI视频
2025-04-17
AI热点
1
2025-08-13
面试致胜:破解刷题误区,展现实际能力