易源API市场 | 万维易源

首页 API市场大模型广场 AI工作流 AI应用创作

其他产品

产品价格

控制台

API分类

银行卡OCR识别

通过检测银行卡图像，输出该卡的银行卡号、所属银行、卡片类型以及银行邮编等信息。包括国内中国银行、工行、农行、交行、建行、中信、招商、光大、兴业、民生、华夏、邮政储蓄、农信社等各大银行。

单独计费

个人证照OCR识别

身份证OCR-银行卡OCR-护照OCR-户口页OCR文字识别等个人证件类的图片内容自动识别，快速提取图片中的字段信息，包括姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限等可用内容。

单独计费

车辆证件类OCR识别

OCR类图像识别-驾驶证OCR-行驶证OCR-车牌OCR-车款OCR-VIN码OCR，快速识别并提取出图片中关键字段信息，智能识别为结构化的文本。应用于车主身份认证、ETC出行、违章识别、停车场车辆进出管理等多种场景。

单独计费

人像特效处理

是一个全面的美容和编辑平台，旨在为开发者提供精准高效的人脸识别和图像处理技术。通过我们强大的API和SDK，用户可以轻松实现对面部特征、人像整体外观以及年龄和性别属性的细致调整。这不仅限于日常的图片美化，我们的技术还能够支持更专业的应用场景，如在线证件照制作、社交平台头像定制等。

单独计费

HTML转Markdown

智能HTML转Markdown接口是一款功能强大的格式转换工具，致力于将HTML内容转换为Markdown格式，支持代码、表格等多种复杂格式转换。以满足内容迁移、数据处理与分析、机器学习等多种应用场景的需求。操作简单实用，可以大幅提高工作效率，为用户提供便捷、高效的解决方案。

单独计费

AI生成文本摘要

利用自然语言处理技术，本API提供多项功能：文章摘要生成API快速提炼文本精华，文章核心句提取API精准识别关键语句，文章关键词抽取API高效捕捉研究要点，全面提升内容分析和创作的效率。为您的文字处理、SEO带来方便。

单独计费

通用卡证图像OCR识别

基于行业前沿的深度学习技术，为用户提供通用的印刷文字识别和文档结构化等能力。方便用户在智能图片识别、认证、鉴权、资质审核等业务时使用。可灵活应用于银行卡识别、驾照识别、户口页识别及名片识别等业务场景。

单独计费

自然语言处理

自然语言处理（Natural Language Processing）是帮助用户高效处理文本的人工智能技术，这项技术可以帮助用户进行舆情内容识别，情感属性量化分析，电商领域文本翻译，文本关键信息抽取，文本快速分类，词性语法分析，相似度检测等。

单独计费

印刷体OCR识别

提取印刷体文本图片的文字信息，支持多语言文本，如常用语种简体中文、英文。支持的图片类型：JPEG, PNG。

会员免费

智能出行顾问

融合实时搜索与 AI 大模型能力，综合天气、灾害、地域动态等信息，为用户智能筛选出行时间、推荐交通工具，科学规划安全行程。

单独计费

网络热点事件分析

全网聚合多平台热点舆情数据，多维拆解热度、情感、传播与舆论指标，自动生成结构化分析报告，助力快速洞悉网络事件全貌、预判舆论发展趋势。

‌DeepSeek-V3.2‌ 是由深度求索（DeepSeek）于2025年12月正式发布的旗舰级大语言模型，面向日常问答、通用智能体（Agent）任务及复杂推理场景优化。截至2026年3月30日，该模型已全面恢复服务，并成为官方网页端、App和API的默认版本 ‌

Kimi K2.6 是月之暗面（Moonshot AI）于 2026年4月20日开源的新一代旗舰大语言模型，基于万亿参数混合专家（MoE）架构，总参数 1T，激活参数 32B，采用 MLA 注意力 + SwiGLU 激活函数。核心定位：长程编程 + Agent 集群双专精。支持 256K 超长上下文、最多 300 个子 Agent 并行协作、单次最长 12 小时自主运行，涵盖 Rust/Go/Python 全栈代码生成、前端设计、跨平台自动化等任务。模型以 Modified MIT 许可证开源。

Qwen3.6 原生视觉语言 Flash 模型效果较 3.5-Flash 大幅提升，重点增强智能体编码、数学与代码推理能力，视觉层面空间智能、物体定位及目标检测提升显著。

输入¥1.176¥1.2/M Tokens

输出¥7.056¥7.2/M Tokens

大模型

step-3.5-flash

硅基流动

Step-3.5-Flash 是由中国大模型初创公司阶跃星辰（StepFun）于 2026 年 2 月发布的一款开源高性能基础模型。这款模型在 AI 社区引起了巨大轰动，因为它打破了“参数量越大智能越强”的传统认知，通过极高的“智能密度”，以较小的激活参数量实现了媲美顶级千亿参数闭源模型的性能，专为 AI Agent（智能体）和高频推理场景设计。

Qwen3.5-397B-A17B 是阿里巴巴通义千问团队于 2026年2月（春节前夕）正式开源的旗舰级原生多模态混合专家模型（MoE）。它证明了“大参数总量 + 小激活量”的 MoE 路线是通往高效 AGI 的关键路径。对于开发者而言，这意味着你可以用极低的硬件成本（单卡可跑），享受到万亿参数级别的智能体验。

输入¥1.152¥1.2/M Tokens

输出¥6.912¥7.2/M Tokens

大模型

deepseek-v4-flash

硅基流动

DeepSeek V4 Flash 是深度求索（DeepSeek）推出的一款效率优化型混合专家模型，总参数量达 2840 亿，单次激活参数量仅 130 亿，支持百万级超长上下文窗口（100 万令牌）。该模型专为高速推理与高吞吐业务场景打造，同时具备出色的逻辑推理与代码编写能力。模型搭载混合注意力机制，可高效处理超长上下文文本，并支持推理模式自定义配置。非常适配代码助手、智能对话系统、智能代理工作流等对响应速度与成本可控性要求较高的落地场景。

MiniMax-M2.7 是一款为自主、实际应用生产力与持续改进而设计的下一代大型语言模型。为了积极参与自身的进化，M2.7透过多代理协作整合先进的代理能力，使其能在动态环境中规划、执行和优化复杂任务。经过生产级性能的训练，M2.7能处理包括实时侦错、根本原因分析、金融建模以及跨 Word、Excel 和 PowerPoint 的完整文件生成等工作流程。它在 SWE-Pro 基准测试中达到 56.2% 的成绩，在 Terminal Bench 2 基准测试中达到 57.0%，同时在 GDPval-AA 上达到 1495 ELO 分数，为实际数位工作流程中运作的多代理系统设立了新的标准。

输入¥2.058¥2.1/M Tokens

输出¥8.232¥8.4/M Tokens

大模型

qwen3.5-122b-a10b

硅基流动

Qwen3.5 122B-A10B 本地视觉语言模型是建立在混合架构之上，整合了线性注意机制与稀疏专家混合模型，达到更高的推理效率。在整体性能方面，此模型仅次于 Qwen3.5-397B-A17B。其文本能力显著优于 Qwen3-235B-2507，而其视觉能力则超越 Qwen3-VL-235B。

Qwen3.5 27B 本地视觉语言密集模型整合了线性注意机制，提供快速反应时间同时平衡推论速度与效能。其整体能力与 Qwen3.5-122B-A10B 相当。

MiniMax-M3 是 MiniMax 最新推出的旗舰级语言模型，采用全新注意力架构 MSA（MiniMax Sparse Attention），支持原生多模态能力与 1M超长上下文。作为 Frontier Coding 模型，MiniMax-M3 专为 Agent 推理、工具调用、代码生成和长上下文任务优化，具备优秀的交错思维链能力，可处理复杂的 Agentic 工作流。模型支持通过 Anthropic SDK、OpenAI SDK 等多种方式接入，并支持图片、视频等多模态输入。

输入¥4.116¥4.2/M Tokens

输出¥16.464¥16.8/M Tokens

工作流

虚拟试穿效果生成

根据用户上传的人物照片、衣物照片、提示词和比例参数，通过意图深度解析、提示词专业优化、生图任务提交与结果轮询4个步骤，生成自然贴合的虚拟试穿效果照片。

DeepSeek V4 Pro 是深度求索（DeepSeek）推出的一款大规模混合专家大模型，总参数量 1.6 万亿，激活参数量 490 亿，支持百万级超长上下文窗口。该模型专为高阶逻辑推理、代码开发及长周期智能体任务流程打造，在知识问答、数理运算、软件工程等各类基准测试中均具备顶尖性能表现。本模型与 DeepSeek V4 Flash 采用同源架构，搭载混合注意力机制，可高效处理超长文本内容；同时提供多档推理模式，能够根据不同任务灵活平衡推理速度与思考深度。适用于完整代码库解析、多步骤自动化流程、大规模信息整合等高复杂度业务场景，完美兼顾模型综合能力与运行效率。

输入¥3/M Tokens

输出¥6/M Tokens

所有接口， 免费试用

所有接口，免费试用