易源API市场 | 万维易源

首页

API市场

大模型广场 AI应用创作提示词即图片 API导航产品价格

控制台

API分类

大模型

gpt-oss-20b

七牛云

GPT-oss-20b是由OpenAI于2025年8月5日发布的开放权重AI模型，总参数210亿，每token激活36亿参数，专为低延迟、本地化场景设计，可在16GB内存的边缘设备运行。该模型采用混合专家（MoE）架构，基于Transformer框架，结合密集注意力和局部带状稀疏注意力机制，支持128,000 token的上下文长度。根据技术报告显示，其性能与o3-mini相当，在AIME和HealthBench等测试中表现更佳

输入¥0.768¥0.8/M Tokens

输出¥3.456¥3.6/M Tokens

大模型

qwen3-vl-32b-instruct

硅基流动

Qwen3-VL-32B-Instruct 是一个大规模的多模态视觉语言模型，设计用于在文本、图像和视频方面进行高精度理解和推理。拥有32B个参数，它结合了深度视觉感知与先进的文本理解，实现了细粒度的空间推理、文件和场景分析以及长远景视频理解。支持32种语言的稳固OCR，并通过Interleaved-MRoPE和DeepStack架构实现了增强的多模态融合。优化于代理交互和视觉工具使用，Qwen3-VL-32B为复杂的真实世界多模态任务提供了最先进的性能。

MiMo-V2-Flash 是小米开发的开源基础语言模型。它是一种混合专家模型，拥有 3090 亿个参数和 150 亿个有效参数，并采用了混合注意力架构。MiMo-V2-Flash 支持混合思维切换和 256K 上下文窗口，在推理、编码和智能体场景下表现出色。其性能与 Claude Sonnet 4.5 相当，而成本仅低约 3.5%。

输入¥0.686¥0.7/M Tokens

输出¥2.058¥2.1/M Tokens

大模型

minimax-m2.5

优云智算

MiniMax-M2.5是MiniMax于2026年2月发布的最新旗舰模型，基于大规模强化学习在数十万真实复杂环境中深度训练而成。

输入¥2.058¥2.1/M Tokens

输出¥8.232¥8.4/M Tokens

大模型

deepseek-v4-pro

算能

DeepSeek V4 Pro 是深度求索（DeepSeek）推出的一款大规模混合专家大模型，总参数量 1.6 万亿，激活参数量 490 亿，支持百万级超长上下文窗口。该模型专为高阶逻辑推理、代码开发及长周期智能体任务流程打造，在知识问答、数理运算、软件工程等各类基准测试中均具备顶尖性能表现。本模型与 DeepSeek V4 Flash 采用同源架构，搭载混合注意力机制，可高效处理超长文本内容；同时提供多档推理模式，能够根据不同任务灵活平衡推理速度与思考深度。适用于完整代码库解析、多步骤自动化流程、大规模信息整合等高复杂度业务场景，完美兼顾模型综合能力与运行效率。

DeepSeek V4 Flash 是深度求索（DeepSeek）推出的一款效率优化型混合专家模型，总参数量达 2840 亿，单次激活参数量仅 130 亿，支持百万级超长上下文窗口（100 万令牌）。该模型专为高速推理与高吞吐业务场景打造，同时具备出色的逻辑推理与代码编写能力。模型搭载混合注意力机制，可高效处理超长上下文文本，并支持推理模式自定义配置。非常适配代码助手、智能对话系统、智能代理工作流等对响应速度与成本可控性要求较高的落地场景。

输入¥1/M Tokens

输出¥2/M Tokens

所有接口， 免费试用

所有接口，免费试用