大模型广场

汇聚百模千态大模型,一次购买,一键切换调用全部大模型 立即购买
模型分类
New
siliconflow/qwen/qwen3.5-27b
硅基流动
文本生成编程MoE256K27b

Qwen3.5 27B 本地视觉语言密集模型整合了线性注意机制,提供快速反应时间同时平衡推论速度与效能。其整体能力与 Qwen3.5-122B-A10B 相当。

输入价格:¥0.6/M Tokens
输出价格:¥4.8/M Tokens
New
siliconflow/qwen/qwen3-vl-32b-instruct
硅基流动
文本生成编程视觉PrefixTools

Qwen3-VL-32B-Instruct 是一个大规模的多模态视觉语言模型,设计用于在文本、图像和视频方面进行高精度理解和推理。拥有32B个参数,它结合了深度视觉感知与先进的文本理解,实现了细粒度的空间推理、文件和场景分析以及长远景视频理解。支持32种语言的稳固OCR,并通过Interleaved-MRoPE和DeepStack架构实现了增强的多模态融合。优化于代理交互和视觉工具使用,Qwen3-VL-32B为复杂的真实世界多模态任务提供了最先进的性能。

输入价格:¥1/M Tokens
输出价格:¥4/M Tokens
New
siliconflow/stepfun/step-3.5-flash
硅基流动
文本生成编程MoEToolsPrefix

Step-3.5-Flash 是由中国大模型初创公司 阶跃星辰(StepFun) 于 2026 年 2 月发布的一款开源高性能基础模型。 这款模型在 AI 社区引起了巨大轰动,因为它打破了“参数量越大智能越强”的传统认知,通过极高的“智能密度”,以较小的激活参数量实现了媲美顶级千亿参数闭源模型的性能,专为 AI Agent(智能体) 和高频推理场景设计。

输入价格:¥0.7/M Tokens
输出价格:¥2.1/M Tokens
New
siliconflow/qwen/qwen3.5-35b-a3b
硅基流动
文本生成编程MoE256K35B

Qwen3.5 Series 35B-A3B 是一个原生视觉语言模型,采用混合架构设计,整合线性注意机制和稀疏专家混合模型,达到更高的推理效率。其整体性能与 Qwen3.5-27B 相当。

输入价格:¥0.4/M Tokens
输出价格:¥3.2/M Tokens
New
siliconflow/qwen/qwen3.5-122b-a10b
硅基流动
文本生成编程MoE256K122B

Qwen3.5 122B-A10B 本地视觉语言模型是建立在混合架构之上,整合了线性注意机制与稀疏专家混合模型,达到更高的推理效率。在整体性能方面,此模型仅次于 Qwen3.5-397B-A17B。其文本能力显著优于 Qwen3-235B-2507,而其视觉能力则超越 Qwen3-VL-235B。

输入价格:¥0.8/M Tokens
输出价格:¥6.4/M Tokens
siliconflow/qwen/qwen3.5-397b-a17b
硅基流动
文本生成编程MoE

Qwen3.5-397B-A17B 是阿里巴巴通义千问团队于 2026年2月(春节前夕)正式开源的旗舰级原生多模态混合专家模型(MoE)。它证明了“大参数总量 + 小激活量”的 MoE 路线是通往高效 AGI 的关键路径。对于开发者而言,这意味着你可以用极低的硬件成本(单卡可跑),享受到万亿参数级别的智能体验。

输入价格:¥1.2/M Tokens
输出价格:¥7.2/M Tokens
New
siliconflow/z-ai/glm-4.7
硅基流动
LLM推理模型强推理中文优化工具调用

GLM-4.7 系列是智谱最新旗舰模型,面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同,并在多个公开基准的当期榜单中取得开源模型中的出色表现。通用能力提升,回复更简洁自然,写作更具沉浸感。在执行复杂智能体任务,在工具调用时指令遵循更强,Artifacts 与 Agentic Coding 的前端美感和长程任务完成效率进一步提升。

输入价格:¥3/M Tokens
输出价格:¥14/M Tokens
New
siliconflow/z-ai/glm-4.6v
硅基流动
VLM多模态模型图像理解 文档解析 多模态推理 OCR语义 长上下文

GLM-4.6V 系列是 GLM 系列在多模态方向上的一次重要迭代,包含 GLM-4.6V(旗舰版)、GLM-4.6V-FlashX(轻量高速版)、GLM-4.6V-Flash(完全免费)。它将训练时上下文窗口提升到128k tokens,在视觉理解精度上达到同参数规模 SOTA,并首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。

输入价格:¥1/M Tokens
输出价格:¥3/M Tokens
siliconflow/minimax/minimax-m2.5
硅基流动
编程智能体工具调用前缀续写FIM补全

MiniMax-M2.5是MiniMax于2026年2月发布的最新旗舰模型,基于大规模强化学习在数十万真实复杂环境中深度训练而成。

输入价格:¥2.1/M Tokens
输出价格:¥8.4/M Tokens
siliconflow/deepseek/deepseek-v3.2
硅基流动

deepseek

输入价格:¥2/M Tokens
输出价格:¥3/M Tokens
siliconflow/moonshotai/kimi-k2.5
硅基流动
文本生成编程744BMoE200K

Kimi 是一款AI智能助手,由 Moonshot 自研的大语言模型驱动,支持在线搜索、深度思考、多模态推理和超长文本对话。

输入价格:¥4/M Tokens
输出价格:¥21/M Tokens
siliconflow/z-ai/glm-5
硅基流动
文本生成编程744BMoE200K

GLM-5 是智谱推出的新一代大语言模型,专注于复杂系统工程和长周期 Agent 任务。模型规模 744B 参数(40B 激活),预训练数据 28.5T tokens。

输入价格:¥4/M Tokens
输出价格:¥18/M Tokens
qiniu/xiaomi/mimo-v2-flash
七牛云
文本生成智能体MoE256k

MiMo-V2-Flash 是小米开发的开源基础语言模型。它是一种混合专家模型,拥有 3090 亿个参数和 150 亿个有效参数,并采用了混合注意力架构。MiMo-V2-Flash 支持混合思维切换和 256K 上下文窗口,在推理、编码和智能体场景下表现出色。其性能与 Claude Sonnet 4.5 相当,而成本仅低约 3.5%。

输入价格:¥0.7/M Tokens
输出价格:¥2.1/M Tokens
sophnet/qwen/qwen3.5-397b-a17b
算能
文本生成编程MoE

Qwen3.5-397B-A17B 是阿里巴巴通义千问团队于 2026年2月(春节前夕)正式开源的旗舰级原生多模态混合专家模型(MoE)。它证明了“大参数总量 + 小激活量”的 MoE 路线是通往高效 AGI 的关键路径。对于开发者而言,这意味着你可以用极低的硬件成本(单卡可跑),享受到万亿参数级别的智能体验。

输入价格:¥1.2/M Tokens
输出价格:¥18/M Tokens
qiniu/minimax/minimax-m2.5
七牛云
编程智能体工具调用前缀续写FIM补全

MiniMax-M2.5是MiniMax于2026年2月发布的最新旗舰模型,基于大规模强化学习在数十万真实复杂环境中深度训练而成。

输入价格:¥2.1/M Tokens
输出价格:¥8.4/M Tokens
sophnet/xiaomi/mimo-v2-flash
算能
文本生成智能体MoE256k

MiMo-V2-Flash 是小米开发的开源基础语言模型。它是一种混合专家模型,拥有 3090 亿个参数和 150 亿个有效参数,并采用了混合注意力架构。MiMo-V2-Flash 支持混合思维切换和 256K 上下文窗口,在推理、编码和智能体场景下表现出色。其性能与 Claude Sonnet 4.5 相当,而成本仅低约 3.5%。

输入价格:¥0.7/M Tokens
输出价格:¥2.1/M Tokens
sophnet/minimax/minimax-m2.5
算能
编程智能体工具调用前缀续写FIM补全

MiniMax-M2.5是MiniMax于2026年2月发布的最新旗舰模型,基于大规模强化学习在数十万真实复杂环境中深度训练而成。

输入价格:¥2.4/M Tokens
输出价格:¥9.6/M Tokens
qiniu/deepseek/deepseek-v3.2
七牛云

deepseek

输入价格:--
输出价格:--