该API提供了多种大模型(如ERNIE系列、Gemma、Llama等)的对话能力,适用于各领域的复杂任务场景,支持自动对接百度搜索插件,保障问答信息时效。
该API提供了多种大模型,如Yi-34B、SQLCoder-7B等,用于文本续写任务。这些模型在多项评测中表现优异,适用于代码生成、自然语言处理等场景。
向量Embeddings API提供了多种文本表示模型,包括Embedding-V1、bge-large-zh、bge-large-en和tao-8k,支持将文本映射为低维稠密向量,适用于检索、分类、聚类或语义匹配等任务。
bce-reranker-base_v1支持中英日韩四门语言,覆盖常见业务领域,支持长package rerank(512~32k),适用于需要优化语义搜索结果的场景。
该API提供了多种图像处理大模型,如Stable-Diffusion-XL、Fuyu-8B和文心一格(精调后),支持图像生成、视觉问答、图像描述等任务,适用于跨模态图像处理场景。
该API允许用户输入prompt,并返回ERNIE系列模型所需的token数量,帮助用户更好地管理和优化模型的使用。
百度智能云千帆平台包括大模型服务与开发平台ModelBuilder,大模型应用开发平台AppBuilder,AI开放能力等多产品能力。 千帆ModelBuilder提供了包括文心和Deepseek,Llama等第三方大模型的丰富模型服务,也提供了各种AI开发工具和整套开发环境
通过【新建对话】接口,可以建立用户与应用之间的对话,该接口会返回一个 conversation_id,用于标识该对话,并在后续的问答交互及其他操作中使用。
工作流组件调用API支持用户通过API/SDK方式调用自定义的工作流组件,方便快速集成到业务中。需要注意的是,组件中包含记忆节点和百度搜索组件时,不支持API/SDK调用。
文字识别OCR API支持多种场景和语种,提供高精度的文字检测与识别功能,适用于金融服务、财税报销、法律政务等多个领域,显著提升信息提取和录入效率。
该API支持人脸检测与属性分析、人脸对比、人脸搜索、人脸库管理等基础服务,适用于身份核验、考勤、闸机通行等场景。
百度语音技术API集成了语音识别、语音合成、呼叫中心语音及自训练平台等功能,支持多种应用场景,如泛阅读、在线教育、音频审核等。开发者可通过接入指南快速集成,享受免费测试额度及灵活的付费方式。
该API支持多种图像识别功能,包括通用物体和场景识别、植物识别、logo识别、图像多主体检测等。提供两种调用方式和组合接口,方便用户根据需求选择。每个接口均提供一定额度的免费调用量,超出后可选择付费方式。
图像增强与特效API能够对质量较低的图片进行优化处理,重建高清图像,并提供多种图像特效功能,适用于网络营销、广告活动等多种业务场景。
百度人体分析API能够准确识别图像中的人体相关信息,提供人体检测与追踪、关键点定位、人流量统计、属性分析、人像分割、手势识别等能力。支持公有云API调用和私有化部署,适用于多种开发环境。
地址识别API通过自然语言处理技术,帮助快递和电商行业高效处理客户提交的非结构化地址单据,提取并生成标准化的姓名、电话和地址信息,提升企业处理效率。
百度机器翻译API依托海量互联网数据和领先的神经网络翻译技术,支持200多种语言的互译,覆盖4万多个语言方向,日均处理千亿字符的翻译请求。用户可通过API快速对接AI翻译能力,实现文本、文档、图片和语音的翻译。
百度内容审核API通过精准的审核模型和丰富的审核维度,自动检测涉政、涉黄、涉恐、恶意推广等违规内容,降低业务违规风险。支持界面化选择审核维度和个性化调整松紧度。