大模型
gpt-oss-20b
七牛云

GPT-oss-20b是由OpenAI于2025年8月5日发布的开放权重AI模型,总参数210亿,每token激活36亿参数,专为低延迟、本地化场景设计,可在16GB内存的边缘设备运行 。该模型采用混合专家(MoE)架构,基于Transformer框架,结合密集注意力和局部带状稀疏注意力机制,支持128,000 token的上下文长度。根据技术报告显示,其性能与o3-mini相当,在AIME和HealthBench等测试中表现更佳

输入¥0.768¥0.8/M Tokens
输出¥3.456¥3.6/M Tokens
大模型
qwen3-vl-32b-instruct
硅基流动

Qwen3-VL-32B-Instruct 是一个大规模的多模态视觉语言模型,设计用于在文本、图像和视频方面进行高精度理解和推理。拥有32B个参数,它结合了深度视觉感知与先进的文本理解,实现了细粒度的空间推理、文件和场景分析以及长远景视频理解。支持32种语言的稳固OCR,并通过Interleaved-MRoPE和DeepStack架构实现了增强的多模态融合。优化于代理交互和视觉工具使用,Qwen3-VL-32B为复杂的真实世界多模态任务提供了最先进的性能。

输入¥1/M Tokens
输出¥4/M Tokens
大模型
mimo-v2-flash
优云智算

MiMo-V2-Flash 是小米开发的开源基础语言模型。它是一种混合专家模型,拥有 3090 亿个参数和 150 亿个有效参数,并采用了混合注意力架构。MiMo-V2-Flash 支持混合思维切换和 256K 上下文窗口,在推理、编码和智能体场景下表现出色。其性能与 Claude Sonnet 4.5 相当,而成本仅低约 3.5%。

输入¥0.686¥0.7/M Tokens
输出¥2.058¥2.1/M Tokens
大模型
minimax-m2.5
优云智算

MiniMax-M2.5是MiniMax于2026年2月发布的最新旗舰模型,基于大规模强化学习在数十万真实复杂环境中深度训练而成。

输入¥2.058¥2.1/M Tokens
输出¥8.232¥8.4/M Tokens
大模型
deepseek-v4-pro
算能

DeepSeek V4 Pro 是深度求索(DeepSeek)推出的一款大规模混合专家大模型,总参数量 1.6 万亿,激活参数量 490 亿,支持百万级超长上下文窗口。该模型专为高阶逻辑推理、代码开发及长周期智能体任务流程打造,在知识问答、数理运算、软件工程等各类基准测试中均具备顶尖性能表现。 本模型与 DeepSeek V4 Flash 采用同源架构,搭载混合注意力机制,可高效处理超长文本内容;同时提供多档推理模式,能够根据不同任务灵活平衡推理速度与思考深度。适用于完整代码库解析、多步骤自动化流程、大规模信息整合等高复杂度业务场景,完美兼顾模型综合能力与运行效率。

输入¥12/M Tokens
输出¥24/M Tokens
大模型
deepseek-v4-flash
硅基流动

DeepSeek V4 Flash 是深度求索(DeepSeek)推出的一款效率优化型混合专家模型,总参数量达 2840 亿,单次激活参数量仅 130 亿,支持百万级超长上下文窗口(100 万令牌)。该模型专为高速推理与高吞吐业务场景打造,同时具备出色的逻辑推理与代码编写能力。 模型搭载混合注意力机制,可高效处理超长上下文文本,并支持推理模式自定义配置。非常适配代码助手、智能对话系统、智能代理工作流等对响应速度与成本可控性要求较高的落地场景。

输入¥1/M Tokens
输出¥2/M Tokens
上一页下一页