大模型广场

汇聚百模千态大模型,一次购买,一键切换调用全部大模型 立即购买
模型分类
minimax-m3
算能
sophnet/minimax/minimax-m3
文本生成编程MoE200K

MiniMax-M3 是 MiniMax 最新推出的旗舰级语言模型,采用全新注意力架构 MSA(MiniMax Sparse Attention),支持原生多模态能力与 1M超长上下文。作为 Frontier Coding 模型,MiniMax-M3 专为 Agent 推理、工具调用、代码生成和长上下文任务优化,具备优秀的交错思维链能力,可处理复杂的 Agentic 工作流。模型支持通过 Anthropic SDK、OpenAI SDK 等多种方式接入,并支持图片、视频等多模态输入。

输入:¥4.2/ M Tokens
输出:¥16.8/ M Tokens
minimax-m2.5
硅基流动
siliconflow/minimax/minimax-m2.5
编程智能体工具调用前缀续写FIM补全

MiniMax-M2.5是MiniMax于2026年2月发布的最新旗舰模型,基于大规模强化学习在数十万真实复杂环境中深度训练而成。

输入:¥2.1/ M Tokens
输出:¥8.4/ M Tokens
glm-4.6v
硅基流动
siliconflow/z-ai/glm-4.6v
VLM多模态模型图像理解 文档解析 多模态推理 OCR语义 长上下文

GLM-4.6V 系列是 GLM 系列在多模态方向上的一次重要迭代,包含 GLM-4.6V(旗舰版)、GLM-4.6V-FlashX(轻量高速版)、GLM-4.6V-Flash(完全免费)。它将训练时上下文窗口提升到128k tokens,在视觉理解精度上达到同参数规模 SOTA,并首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。

输入:¥1/ M Tokens
输出:¥3/ M Tokens
qwen3.5-397b-a17b
硅基流动
siliconflow/qwen/qwen3.5-397b-a17b
文本生成编程MoE397B

Qwen3.5-397B-A17B 是阿里巴巴通义千问团队于 2026年2月(春节前夕)正式开源的旗舰级原生多模态混合专家模型(MoE)。它证明了“大参数总量 + 小激活量”的 MoE 路线是通往高效 AGI 的关键路径。对于开发者而言,这意味着你可以用极低的硬件成本(单卡可跑),享受到万亿参数级别的智能体验。

输入:¥1.2/ M Tokens
输出:¥7.2/ M Tokens
qwen3.5-122b-a10b
硅基流动
siliconflow/qwen/qwen3.5-122b-a10b
文本生成编程MoE256K122B

Qwen3.5 122B-A10B 本地视觉语言模型是建立在混合架构之上,整合了线性注意机制与稀疏专家混合模型,达到更高的推理效率。在整体性能方面,此模型仅次于 Qwen3.5-397B-A17B。其文本能力显著优于 Qwen3-235B-2507,而其视觉能力则超越 Qwen3-VL-235B。

输入:¥0.8/ M Tokens
输出:¥6.4/ M Tokens
qwen3.5-35b-a3b
硅基流动
siliconflow/qwen/qwen3.5-35b-a3b
文本生成编程MoE256K35B

Qwen3.5 Series 35B-A3B 是一个原生视觉语言模型,采用混合架构设计,整合线性注意机制和稀疏专家混合模型,达到更高的推理效率。其整体性能与 Qwen3.5-27B 相当。

输入:¥0.4/ M Tokens
输出:¥3.2/ M Tokens
step-3.5-flash
硅基流动
siliconflow/stepfun/step-3.5-flash
文本生成编程MoEToolsPrefix

Step-3.5-Flash 是由中国大模型初创公司 阶跃星辰(StepFun) 于 2026 年 2 月发布的一款开源高性能基础模型。 这款模型在 AI 社区引起了巨大轰动,因为它打破了“参数量越大智能越强”的传统认知,通过极高的“智能密度”,以较小的激活参数量实现了媲美顶级千亿参数闭源模型的性能,专为 AI Agent(智能体) 和高频推理场景设计。

输入:¥0.7/ M Tokens
输出:¥2.1/ M Tokens
qwen3-vl-32b-instruct
硅基流动
siliconflow/qwen/qwen3-vl-32b-instruct
文本生成编程视觉PrefixTools

Qwen3-VL-32B-Instruct 是一个大规模的多模态视觉语言模型,设计用于在文本、图像和视频方面进行高精度理解和推理。拥有32B个参数,它结合了深度视觉感知与先进的文本理解,实现了细粒度的空间推理、文件和场景分析以及长远景视频理解。支持32种语言的稳固OCR,并通过Interleaved-MRoPE和DeepStack架构实现了增强的多模态融合。优化于代理交互和视觉工具使用,Qwen3-VL-32B为复杂的真实世界多模态任务提供了最先进的性能。

输入:¥1/ M Tokens
输出:¥4/ M Tokens
qwen3.5-27b
硅基流动
siliconflow/qwen/qwen3.5-27b
文本生成编程MoE256K27b

Qwen3.5 27B 本地视觉语言密集模型整合了线性注意机制,提供快速反应时间同时平衡推论速度与效能。其整体能力与 Qwen3.5-122B-A10B 相当。

输入:¥0.6/ M Tokens
输出:¥4.8/ M Tokens
qwen3.5-9b
硅基流动
siliconflow/qwen/qwen3.5-9b
文本生成智能体MoE256K35B

Qwen3.5-9B 是 Qwen3.5 家族的一个多模态基础模型,设计用于在高效的 9B 参数架构中提供强大的推理、编码和视觉理解。它采用统一的视觉语言设计,通过多模态标记的早期融合,允许模型在相同语境下处理和推理文本和图像。

输入:¥0.5/ M Tokens
输出:¥4/ M Tokens
上一页下一页