算能GLM-5 是智谱推出的新一代大语言模型,专注于复杂系统工程和长周期 Agent 任务。模型规模 744B 参数(40B 激活),预训练数据 28.5T tokens。
七牛云MiniMax-M2.5是MiniMax于2026年2月发布的最新旗舰模型,基于大规模强化学习在数十万真实复杂环境中深度训练而成。
七牛云GPT-oss-120b是由OpenAI于2025年8月5日发布的开放权重AI模型,拥有1170亿总参数与每token激活51亿参数,采用专家混合(MoE)架构的Transformer网络。该模型基于Apache 2.0许可证开源,允许下载代码后进行本地化修改及商业用途,支持在单块80GB显存的Nvidia H100 GPU
算能Qwen3.5-397B-A17B 是阿里巴巴通义千问团队于 2026年2月(春节前夕)正式开源的旗舰级原生多模态混合专家模型(MoE)。它证明了“大参数总量 + 小激活量”的 MoE 路线是通往高效 AGI 的关键路径。对于开发者而言,这意味着你可以用极低的硬件成本(单卡可跑),享受到万亿参数级别的智能体验。
七牛云Kimi 是一款AI智能助手,由 Moonshot 自研的大语言模型驱动,支持在线搜索、深度思考、多模态推理和超长文本对话。
算能GLM 5.2 是 Z.ai 推出的大规模推理模型。它支持 100 万个标记的上下文窗口的文本输入和输出,适用于长期代理工作流、项目级软件工程和复杂的多步骤自动化。
根据用户输入的产品需求描述和图纸类型,通过意图解析、规则映射、Prompt工程化、尺寸计算及异步生图轮询,输出符合国标工业制图与商业产品渲染规范的8K高清商用图纸或效果图。
算能MiMo-V2-Flash 是小米开发的开源基础语言模型。它是一种混合专家模型,拥有 3090 亿个参数和 150 亿个有效参数,并采用了混合注意力架构。MiMo-V2-Flash 支持混合思维切换和 256K 上下文窗口,在推理、编码和智能体场景下表现出色。其性能与 Claude Sonnet 4.5 相当,而成本仅低约 3.5%。
优云智算MiMo-V2-Flash 是小米开发的开源基础语言模型。它是一种混合专家模型,拥有 3090 亿个参数和 150 亿个有效参数,并采用了混合注意力架构。MiMo-V2-Flash 支持混合思维切换和 256K 上下文窗口,在推理、编码和智能体场景下表现出色。其性能与 Claude Sonnet 4.5 相当,而成本仅低约 3.5%。
Qwen3.5-9B 是 Qwen3.5 家族的一个多模态基础模型,设计用于在高效的 9B 参数架构中提供强大的推理、编码和视觉理解。它采用统一的视觉语言设计,通过多模态标记的早期融合,允许模型在相同语境下处理和推理文本和图像。
七牛云DeepSeek-V3.2 是由深度求索(DeepSeek)于2025年12月正式发布的旗舰级大语言模型,面向日常问答、通用智能体(Agent)任务及复杂推理场景优化。截至2026年3月30日,该模型已全面恢复服务,并成为官方网页端、App和API的默认版本
算能Kimi 是一款AI智能助手,由 Moonshot 自研的大语言模型驱动,支持在线搜索、深度思考、多模态推理和超长文本对话。
算能Kimi K2.7 Code 是 Moonshot AI Kimi K2 系列中专注于编码的模型,旨在可靠地完成长时间上下文中的端到端编程任务。它采用原生多模态混合专家架构,支持文本和图像输入,并始终以思考模式运行,从而在多轮对话中保留完整的推理内容。凭借 25.6 万个词元的上下文窗口,它适用于长时程编码、智能体任务分解和多轮对话。该模型激活了约 1 万亿个参数中的 320 亿个
算能MiniMax-M3 是 MiniMax 最新推出的旗舰级语言模型,采用全新注意力架构 MSA(MiniMax Sparse Attention),支持原生多模态能力与 1M超长上下文。作为 Frontier Coding 模型,MiniMax-M3 专为 Agent 推理、工具调用、代码生成和长上下文任务优化,具备优秀的交错思维链能力,可处理复杂的 Agentic 工作流。模型支持通过 Anthropic SDK、OpenAI SDK 等多种方式接入,并支持图片、视频等多模态输入。
DeepSeek-V3.2 是由深度求索(DeepSeek)于2025年12月正式发布的旗舰级大语言模型,面向日常问答、通用智能体(Agent)任务及复杂推理场景优化。截至2026年3月30日,该模型已全面恢复服务,并成为官方网页端、App和API的默认版本
算能MiniMax-M2.5是MiniMax于2026年2月发布的最新旗舰模型,基于大规模强化学习在数十万真实复杂环境中深度训练而成。
GLM-4.6V 系列是 GLM 系列在多模态方向上的一次重要迭代,包含 GLM-4.6V(旗舰版)、GLM-4.6V-FlashX(轻量高速版)、GLM-4.6V-Flash(完全免费)。它将训练时上下文窗口提升到128k tokens,在视觉理解精度上达到同参数规模 SOTA,并首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。
算能DeepSeek V4 Flash 是深度求索(DeepSeek)推出的一款效率优化型混合专家模型,总参数量达 2840 亿,单次激活参数量仅 130 亿,支持百万级超长上下文窗口(100 万令牌)。该模型专为高速推理与高吞吐业务场景打造,同时具备出色的逻辑推理与代码编写能力。 模型搭载混合注意力机制,可高效处理超长上下文文本,并支持推理模式自定义配置。非常适配代码助手、智能对话系统、智能代理工作流等对响应速度与成本可控性要求较高的落地场景。
上传人物照片,输入打卡地点和姿势要求,通过意图解析、提示词融合优化、生图及状态轮询四个步骤,生成写实风格的景点打卡照片
基于用户上传底图、自定义提示词和宫格数量,通过意图解析坚守红线、底图形象基底诊断、情绪拆解与排版指令注入、高清图像生成及视觉合规校验,生成一套统一形象的多宫格表情包组合图,确保主体形象100%一致、排版像素级无缝、画质商用达标。
基于作物名称与病虫害描述,通过意图解析、知识检索增强、白话转换与硬清洗、文生图与语音合成,最终逻辑融合封装为包含病虫害写实识别图(强制中文标注)和通俗语音讲解的标准化农技可视化教材卡片,解决农户看不懂文字指导的痛点。
基于用户上传的食物原图,通过多模态视觉分析提取食物特征锚点,结合用户指定的强叙事风格与全局固定模板进行语义级叙事融合,将食物拟人化重构为电影大片海报主角,最终生成高清故事感海报图片。
基于用户输入的情绪,AI自动推导最契合的视觉主体、环境、光影、色彩、材质与构图方案,将抽象情绪转化为具有收藏价值的超高清艺术装饰画。最终作品不含文字或设计元素,可直接打印、装裱、商业展示。
面向文言文教学场景的智能工作流。接收用户输入的文言文全文(限制300字内),通过合规检查阻断超限/违规输入,对合规文本进行深度清洗剥离注解拼音等冗余信息,随后基于纯净文本并行执行三大任务:1)生成含中文文本元素的古典意境配图;2)生成无杂音的纯净TTS朗读音频;3)生成教学级白话翻译与实虚词/句式深度解析。最终聚合交付多模态学习内容。