DeepSeek-V3.2版本在执行复杂任务时暴露出显著的Token消耗问题。多位研究者指出,其Special版本在高负载场景下出现Token使用异常,消耗速率远超预期,影响模型运行效率与成本控制。初步分析表明,该现象可能与GRPO机制存在关联,其在推理过程中可能导致冗余计算或重复采样,从而加剧Token占用。目前,相关团队正针对此问题展开深入排查,以优化模型资源利用率。
客服热线请拨打
400-998-8033