我要做一个api超市,专门用统一格式转发开源模型。 模型列表有: 以下是 SophNet 平台模型列表的 Markdown 表格: ## 推理模型(Reasoning Models) | 模型名称 | 提供商 | 上下文窗口 | 输入价格 | 输出价格 | 特点描述 | |---------|--------|-----------|---------|---------|---------| | DeepSeek R1 | DeepSeek | 64k | ¥4/M tokens | ¥16/M tokens | 首个大规模强化学习训练推理模型,数学、编程和推理能力与 OpenAI-o1 相当 | | DeepSeek Prover V2 | DeepSeek | 128k | ¥4/M tokens | ¥16/M tokens | 671B 参数,专为形式化定理证明设计,支持 128K 上下文 | | QwQ-32B | Qwen | 128k | ¥2/M tokens | ¥6/M tokens | 千问系列推理模型,性能可比肩 DeepSeek R1、o1-mini | ## 通用大语言模型 | 模型名称 | 提供商 | 上下文窗口 | 输入价格 | 输出价格 | 特点描述 | |---------|--------|-----------|---------|---------|---------| | DeepSeek V3 Fast | DeepSeek | 32k | ~~¥4~~ **¥2**/M tokens (限时五折 5.13~6.30) | ~~¥16~~ **¥8**/M tokens | V3 0324 极速版,满血非量化,代码与数学能力更强,响应更快 | | DeepSeek V3 0324 | DeepSeek | 128k | ¥2/M tokens | ¥8/M tokens | 15万亿token预训练,指令遵循和代码能力全面提升 | | Qwen3-235B-A22B | Qwen | 128k | ¥4/M tokens | ¥12/M tokens | Qwen 系列最新一代,MoE 架构,推理、指令遵循、代理能力突破 | | Qwen2.5-72B-Instruct | Qwen | 128k | ¥4/M tokens | ¥12/M tokens | 知识量显著增加,编程和数学能力强,支持29+语言,生成长文本 | | Qwen2.5-32B-Instruct | Qwen | 128k | ¥2/M tokens | ¥6/M tokens | 320亿参数,复杂推理、数学计算和代码生成表现突出 | | Qwen2.5-7B-Instruct | Qwen | 128k | ¥0.5/M tokens | ¥1/M tokens | 轻量级,适合成本敏感场景,中文任务表现优异,支持代码补全 | ## 蒸馏模型(Distilled Models) | 模型名称 | 提供商 | 上下文窗口 | 输入价格 | 输出价格 | 特点描述 | |---------|--------|-----------|---------|---------|---------| | DeepSeek-R1-Distill-Qwen-32B | DeepSeek | 32k | ¥2/M tokens | ¥6/M tokens | 基于 Qwen 2.5 32B 蒸馏,表现优于 o1-mini,创造密集模型新最佳成绩 | | DeepSeek-R1-Distill-Qwen-7B | DeepSeek | 32k | ¥0.5/M tokens | ¥1/M tokens | 7B 规模实现接近原版 70% 性能,响应延迟降低40%,适合实时交互 | ## 视觉语言模型(VL Models) | 模型名称 | 提供商 | 上下文窗口 | 输入价格 | 输出价格 | 特点描述 | |---------|--------|-----------|---------|---------|---------| | Qwen2.5-VL-72B-Instruct | Qwen | 128k | ¥16/M tokens | ¥48/M tokens | 精通物体识别、文本/图表/布局分析,支持1小时+长视频,可操作计算机和手机,视觉代理 | | Qwen2.5-VL-7B-Instruct | Qwen | 128k | ¥2/M tokens | ¥6/M tokens | 轻量级多模态,支持20分钟+视频理解,可集成移动设备和机器人实现自动操作 | | Qwen2-VL-72B-Instruct | Qwen | 32k | ¥16/M tokens | ¥48/M tokens | 720亿参数,支持20分钟+视频理解,高质量视频问答和内容创建,复杂推理决策 | | Qwen2-VL-7B-Instruct | Qwen | 32k | ¥2/M tokens | ¥5/M tokens | 支持1小时+长视频,可生成发票、表格等结构化输出,适用于金融、商业场景 | --- ## 价格对比汇总表 | 价格档位 | 输入价格 | 输出价格 | 包含模型 | |---------|---------|---------|---------| | 入门级 | ¥0.5/M tokens | ¥1/M tokens | Qwen2.5-7B、DeepSeek-R1-Distill-Qwen-7B | | 性价比级 | ¥2/M tokens | ¥6-8/M tokens | DeepSeek V3 系列、Qwen2.5-32B、QwQ-32B、Qwen2-VL-7B、Qwen2.5-VL-7B | | 专业级 | ¥4/M tokens | ¥12-16/M tokens | DeepSeek R1、DeepSeek Prover V2、Qwen3-235B、Qwen2.5-72B | | 高端多模态 | ¥16/M tokens | ¥48/M tokens | Qwen2.5-VL-72B、Qwen2-VL-72B | 市场的用户用统一接口调和这些模型。以openai 接口为标准。 用户也可以托管自己的key来调用第三方模型(使用保存在平台的配置项,每生成一个配置项,平台为用户生成一个自定义模型id,但是key不保留,需要用户每次传递。)。 托管调用,平台收取5%的token流量费用,资费以deepseek的为标准。 你认为还能有什么功能?
两者兼有 支持用户自行添加其他开源模型(也就是托管第三方) 平台是直接向用户收费。 如果是托管的第三方,则平台只收取5%流量费用