技术博客

阿里巴巴Qwen3新思考模型开源版本：引领AI智能体技术革新

阿里巴巴近日发布了Qwen3新思考模型的开源版本，在多个关键领域展现出显著的性能提升。新模型在Agent智能体能力方面有了进一步增强，能够处理高达100万的上下文信息，大幅提升了复杂任务的处理效率。此外，在AIME25数学测试、LiveCodeBench编程挑战以及GPQA复杂问题解决能力方面，相较于此前版本Qwen3-30B-A3B-Thinking和Qwen3-235B-A22B-Thinking，新模型表现出了大幅度的优化与进步，彰显了其在人工智能领域的持续创新能力。

阿里巴巴Qwen3模型开源版本性能提升Agent智能体

2025-07-31

Qwen3大模型的创新突破：技术领先之道

Qwen3大模型通过融合思考模式与非思考模式，实现了技术上的创新突破。作为技术领先的代表，Qwen3不仅优化了传统模型的局限性，还大幅提升了多场景应用能力。其独特的架构设计使其在复杂任务处理中表现出色，为人工智能领域注入了新的活力。

Qwen3模型创新突破技术领先思考模式非思考模式

2025-05-21

Unsloth框架助力：Qwen3-14B模型在资源受限环境下的高效微调与部署

本文探讨了在资源受限的硬件条件下，利用Unsloth框架对Qwen3-14B模型进行高效微调与部署的方法。文章首先介绍Unsloth框架的核心功能，随后以Qwen3模型为例，展示其实际应用效果，并通过代码示例详细说明操作步骤。最后总结了训练流程中的关键点，为开发者提供实践指导。

Unsloth框架Qwen3模型高效微调资源受限训练流程

2025-05-19

《Unsloth微调Qwen3实战教程：释放30B-A3B模型的强大潜力》

Qwen3模型的微调教程现已发布，借助Unsloth的Dynamic 2.0量化技术，优化后的Qwen3–30B-A3B模型仅需17.5GB VRAM即可运行，同时支持高达128K的上下文长度。该模型提供思考模式与非思考模式两种选择，以满足不同任务需求，确保高精度与高效性能的完美结合。

Qwen3模型微调教程Dynamic 2.0上下文长度思考模式

2025-05-14

后训练量化技术在Qwen3模型中的应用与性能评估

本研究对Qwen3模型在后训练量化技术下的性能进行了系统性评估。结果表明，在8位量化条件下，Qwen3模型展现出接近无损的性能表现，并在开源模型中刷新了最佳性能记录（SOTA）。研究聚焦于资源受限环境下，如何通过低比特量化技术保持模型智能性能的稳定性，为相关领域提供了重要参考。

Qwen3模型后训练量化8位量化性能评估开源模型SOTA

2025-05-07

零基础入门：Qwen3模型微调与本地部署详尽教程

本文为无编程基础的用户提供了微调Qwen3模型并实现本地部署的详尽教程。通过引入LoRA技术，即大型语言模型的低秩自适应方法，用户可以高效地进行轻量级训练。该技术仅需训练少量新增权重，从而显著减少参数数量，简化操作流程，使更多用户能够轻松上手。

Qwen3模型微调教程本地部署LoRA技术轻量级训练

2025-05-06

Qwen3模型在通义App中的集成与应用实测

本文聚焦于Qwen3模型在通义App中的集成效果，通过实测评估其在智能代理、编码能力和多通道处理（MCP）方面的提升。官方表示，新模型优化了多项核心功能，旨在为用户提供更高效、智能的服务体验。测试结果将验证这些声明的可靠性，并全面展示Qwen3模型的实际表现。

Qwen3模型通义App智能代理编码能力多通道处理

2025-04-30

阿里巴巴开源Qwen3模型：引领大型语言模型新篇章

阿里巴巴近期发布了性能卓越的开源大型语言模型Qwen3，该模型在多项指标上超越了DeepSeek-R1和Llama4。Qwen3已登陆Hugging Face、ModelScope和Kaggle等主流平台，为全球开源社区注入新活力。开发者正基于Qwen3积极开展二次开发与应用创新，推动技术边界拓展。

Qwen3模型开源社区大型语言模型阿里巴巴应用创新

2025-04-29

阿里云Qwen3模型：开源领域的技术突破

阿里云的Qwen3模型在开源领域取得了显著成就，成为行业标杆。该团队提供了八种不同模型供用户使用，其中最大模型性能超越R1/o1标准。Qwen团队推荐使用SGLang、vLLM框架进行部署，本地运行可借助Ollama、LMStudio等工具。这一突破性进展引发了网友热议，并被认为将有力推动开源技术发展。

Qwen3模型开源技术阿里云性能超越本地部署

2025-04-29

Qwen3模型：开启开源领域新纪元

Qwen3模型以235B的参数量和混合推理技术，成为开源领域的全新领导者。作为国内首个实现全面开源的系列模型，Qwen3包含8个子模型，标志着从单一模型向智能体转变的加速进程。这一突破不仅体现了参数规模的增长，更代表了智能技术边界的扩展，为未来的技术革新奠定了坚实基础。

Qwen3模型开源领域混合推理参数量智能技术

2025-04-29

Qwen3模型开源之夜：重构全球开源领域的里程碑

阿里巴巴的Qwen3模型于深夜时分开源，迅速在全球开源领域占据领先地位。该模型采用MoE架构，拥有235B参数量，在多个基准测试中表现卓越。此次开源的Qwen3系列包含8款混合推理模型，全部免费且支持商业使用，为全球开发者提供了强大的工具。

Qwen3模型开源领域MoE架构235B参数免费商用

2025-04-29

AI热点

2025-08-08

大型语言模型在软件工程中的应用与发展

科技热点

大型语言模型在软件工程中的应用与发展