银行卡OCR识别

通过检测银行卡图像,输出该卡的银行卡号、所属银行、卡片类型以及银行邮编等信息。包括国内中国银行、工行、农行、交行、建行、中信、招商、光大、兴业、民生、华夏、邮政储蓄、农信社等各大银行。

单独计费
个人证照OCR识别

身份证OCR-银行卡OCR-护照OCR-户口页OCR文字识别等个人证件类的图片内容自动识别,快速提取图片中的字段信息,包括姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限等可用内容。

单独计费
车辆证件类OCR识别

OCR类图像识别-驾驶证OCR-行驶证OCR-车牌OCR-车款OCR-VIN码OCR,快速识别并提取出图片中关键字段信息,智能识别为结构化的文本。应用于车主身份认证、ETC出行、违章识别、停车场车辆进出管理等多种场景。

单独计费
人像特效处理

是一个全面的美容和编辑平台,旨在为开发者提供精准高效的人脸识别和图像处理技术。通过我们强大的API和SDK,用户可以轻松实现对面部特征、人像整体外观以及年龄和性别属性的细致调整。这不仅限于日常的图片美化,我们的技术还能够支持更专业的应用场景,如在线证件照制作、社交平台头像定制等。

单独计费
HTML转Markdown

智能HTML转Markdown接口是一款功能强大的格式转换工具,致力于将HTML内容转换为Markdown格式,支持代码、表格等多种复杂格式转换。以满足内容迁移、数据处理与分析、机器学习等多种应用场景的需求。操作简单实用,可以大幅提高工作效率,为用户提供便捷、高效的解决方案。

单独计费
AI生成文本摘要

利用自然语言处理技术,本API提供多项功能:文章摘要生成API快速提炼文本精华,文章核心句提取API精准识别关键语句,文章关键词抽取API高效捕捉研究要点,全面提升内容分析和创作的效率。为您的文字处理、SEO带来方便。

单独计费
通用卡证图像OCR识别

基于行业前沿的深度学习技术,为用户提供通用的印刷文字识别和文档结构化等能力。方便用户在智能图片识别、认证、鉴权、资质审核等业务时使用。可灵活应用于银行卡识别、驾照识别、户口页识别及名片识别等业务场景。

单独计费
自然语言处理

自然语言处理(Natural Language Processing)是帮助用户高效处理文本的人工智能技术,这项技术可以帮助用户进行舆情内容识别,情感属性量化分析,电商领域文本翻译,文本关键信息抽取,文本快速分类,词性语法分析,相似度检测等。

单独计费
印刷体OCR识别

提取印刷体文本图片的文字信息,支持多语言文本,如常用语种简体中文、英文。支持的图片类型:JPEG, PNG。

会员免费
智能出行顾问

融合实时搜索与 AI 大模型能力,综合天气、灾害、地域动态等信息,为用户智能筛选出行时间、推荐交通工具,科学规划安全行程。

单独计费
网络热点事件分析

全网聚合多平台热点舆情数据,多维拆解热度、情感、传播与舆论指标,自动生成结构化分析报告,助力快速洞悉网络事件全貌、预判舆论发展趋势。

单独计费
大模型
deepseek-v3.2
算能

‌DeepSeek-V3.2‌ 是由深度求索(DeepSeek)于2025年12月正式发布的旗舰级大语言模型,面向日常问答、通用智能体(Agent)任务及复杂推理场景优化。截至2026年3月30日,该模型已全面恢复服务,并成为官方网页端、App和API的默认版本 ‌

输入¥1.96¥2/M Tokens
输出¥2.94¥3/M Tokens
大模型
kimi-k2.6
算能

Kimi K2.6 是月之暗面(Moonshot AI)于 2026年4月20日 开源的新一代旗舰大语言模型,基于万亿参数混合专家(MoE)架构,总参数 1T,激活参数 32B,采用 MLA 注意力 + SwiGLU 激活函数。核心定位:长程编程 + Agent 集群双专精。支持 256K 超长上下文、最多 300 个子 Agent 并行协作、单次最长 12 小时自主运行,涵盖 Rust/Go/Python 全栈代码生成、前端设计、跨平台自动化等任务。模型以 Modified MIT 许可证开源。

输入¥6.37¥6.5/M Tokens
输出¥26.46¥27/M Tokens
大模型
qwen3.6-flash
算能

Qwen3.6 原生视觉语言 Flash 模型效果较 3.5-Flash 大幅提升,重点增强智能体编码、数学与代码推理能力,视觉层面空间智能、物体定位及目标检测提升显著。

输入¥1.176¥1.2/M Tokens
输出¥7.056¥7.2/M Tokens
大模型
step-3.5-flash
硅基流动

Step-3.5-Flash 是由中国大模型初创公司 阶跃星辰(StepFun) 于 2026 年 2 月发布的一款开源高性能基础模型。 这款模型在 AI 社区引起了巨大轰动,因为它打破了“参数量越大智能越强”的传统认知,通过极高的“智能密度”,以较小的激活参数量实现了媲美顶级千亿参数闭源模型的性能,专为 AI Agent(智能体) 和高频推理场景设计。

输入¥0.7/M Tokens
输出¥2.1/M Tokens
大模型
qwen3.5-397b-a17b
硅基流动

Qwen3.5-397B-A17B 是阿里巴巴通义千问团队于 2026年2月(春节前夕)正式开源的旗舰级原生多模态混合专家模型(MoE)。它证明了“大参数总量 + 小激活量”的 MoE 路线是通往高效 AGI 的关键路径。对于开发者而言,这意味着你可以用极低的硬件成本(单卡可跑),享受到万亿参数级别的智能体验。

输入¥1.2/M Tokens
输出¥7.2/M Tokens
大模型
qwen3.5-397b-a17b
七牛云

Qwen3.5-397B-A17B 是阿里巴巴通义千问团队于 2026年2月(春节前夕)正式开源的旗舰级原生多模态混合专家模型(MoE)。它证明了“大参数总量 + 小激活量”的 MoE 路线是通往高效 AGI 的关键路径。对于开发者而言,这意味着你可以用极低的硬件成本(单卡可跑),享受到万亿参数级别的智能体验。

输入¥1.152¥1.2/M Tokens
输出¥6.912¥7.2/M Tokens
大模型
deepseek-v4-flash
硅基流动

DeepSeek V4 Flash 是深度求索(DeepSeek)推出的一款效率优化型混合专家模型,总参数量达 2840 亿,单次激活参数量仅 130 亿,支持百万级超长上下文窗口(100 万令牌)。该模型专为高速推理与高吞吐业务场景打造,同时具备出色的逻辑推理与代码编写能力。 模型搭载混合注意力机制,可高效处理超长上下文文本,并支持推理模式自定义配置。非常适配代码助手、智能对话系统、智能代理工作流等对响应速度与成本可控性要求较高的落地场景。

输入¥1/M Tokens
输出¥2/M Tokens
大模型
minimax-m2.7
算能

MiniMax-M2.7 是一款为自主、实际应用生产力与持续改进而设计的下一代大型语言模型。为了积极参与自身的进化,M2.7透过多代理协作整合先进的代理能力,使其能在动态环境中规划、执行和优化复杂任务。 经过生产级性能的训练,M2.7能处理包括实时侦错、根本原因分析、金融建模以及跨 Word、Excel 和 PowerPoint 的完整文件生成等工作流程。它在 SWE-Pro 基准测试中达到 56.2% 的成绩,在 Terminal Bench 2 基准测试中达到 57.0%,同时在 GDPval-AA 上达到 1495 ELO 分数,为实际数位工作流程中运作的多代理系统设立了新的标准。

输入¥2.058¥2.1/M Tokens
输出¥8.232¥8.4/M Tokens
大模型
qwen3.5-122b-a10b
硅基流动

Qwen3.5 122B-A10B 本地视觉语言模型是建立在混合架构之上,整合了线性注意机制与稀疏专家混合模型,达到更高的推理效率。在整体性能方面,此模型仅次于 Qwen3.5-397B-A17B。其文本能力显著优于 Qwen3-235B-2507,而其视觉能力则超越 Qwen3-VL-235B。

输入¥0.8/M Tokens
输出¥6.4/M Tokens
大模型
qwen3.5-27b
硅基流动

Qwen3.5 27B 本地视觉语言密集模型整合了线性注意机制,提供快速反应时间同时平衡推论速度与效能。其整体能力与 Qwen3.5-122B-A10B 相当。

输入¥0.6/M Tokens
输出¥4.8/M Tokens
大模型
minimax-m3
优云智算

MiniMax-M3 是 MiniMax 最新推出的旗舰级语言模型,采用全新注意力架构 MSA(MiniMax Sparse Attention),支持原生多模态能力与 1M超长上下文。作为 Frontier Coding 模型,MiniMax-M3 专为 Agent 推理、工具调用、代码生成和长上下文任务优化,具备优秀的交错思维链能力,可处理复杂的 Agentic 工作流。模型支持通过 Anthropic SDK、OpenAI SDK 等多种方式接入,并支持图片、视频等多模态输入。

输入¥4.116¥4.2/M Tokens
输出¥16.464¥16.8/M Tokens
工作流
虚拟试穿效果生成

根据用户上传的人物照片、衣物照片、提示词和比例参数,通过意图深度解析、提示词专业优化、生图任务提交与结果轮询4个步骤,生成自然贴合的虚拟试穿效果照片。

通用资源包计费
大模型
deepseek-v4-pro
算能

DeepSeek V4 Pro 是深度求索(DeepSeek)推出的一款大规模混合专家大模型,总参数量 1.6 万亿,激活参数量 490 亿,支持百万级超长上下文窗口。该模型专为高阶逻辑推理、代码开发及长周期智能体任务流程打造,在知识问答、数理运算、软件工程等各类基准测试中均具备顶尖性能表现。 本模型与 DeepSeek V4 Flash 采用同源架构,搭载混合注意力机制,可高效处理超长文本内容;同时提供多档推理模式,能够根据不同任务灵活平衡推理速度与思考深度。适用于完整代码库解析、多步骤自动化流程、大规模信息整合等高复杂度业务场景,完美兼顾模型综合能力与运行效率。

输入¥3/M Tokens
输出¥6/M Tokens