技术博客

大模型智能算法与实际开发应用融合之道：关键技术解读与行业应用案例分析

本文探讨了大模型智能算法与实际开发应用的结合，重点分析了支持大模型服务的智能计算基础设施，以及在基础大模型研发中采用的前沿技术和实践方法。通过这些技术的应用，大模型在多个行业中展现出巨大的潜力和价值。

大模型智能算法开发应用关键技术行业应用

2024-12-02

主流大型语言模型推理框架的技术对比与应用分析

本文旨在深入探讨十种主流的大型语言模型（LLM）推理框架，对比它们在不同应用场景下的技术特性和优势。文章将为研究人员和工程团队提供技术方案选择的参考，无论是在消费级硬件上进行模型实验，还是在生产环境中部署大规模模型。

大模型推理框技术特应用场景方案选

2024-12-02

大型语言模型的集成指南：让AI助力软件升级

本文旨在提供一份全面的指南，介绍如何将大型语言模型（LLM）集成到现有的软件系统中。大型语言模型是一种人工智能技术，它们能够理解、生成文本，并处理多种任务。这些模型通过使用大规模数据集进行训练，因此被称为“大型语言模型”。本文将详细探讨集成过程中的关键步骤和技术要点，帮助开发者和企业顺利实现这一目标。

大模型集成软件AI文本

2024-12-02

大模型RAG技术革新：智能助手时代的资讯检索与整合

近期，大模型RAG技术取得了显著进展，被誉为智能助手的典范。RAG技术的核心能力在于其高效的信息检索能力和自然语言处理能力。它能够迅速从海量数据中提取用户所需的信息，并将其整合成完整的回答，以自然语言的形式呈现给用户。这一技术的应用不仅提升了信息获取的效率，还极大地改善了用户体验。

大模型RAG技术智能助手信息检索自然语言

2024-11-30

智能研发新篇章：大模型技术引领未来

在大模型技术的引领下，智能研发领域正经历一场深刻的变革。作为工程师，必须适应AI带来的新工具和新方法，以保持在未来研发工作中的竞争力。大模型不仅提高了数据处理的效率，还为创新提供了新的可能性。工程师们需要不断学习和掌握这些新技术，以应对日益激烈的市场竞争。

大模型智能研发AI工具新方法竞争力

2024-11-29

大模型时代开发者核心竞争力的重塑与进化

在QCon晚场的辩论中，专家们深入探讨了大模型对开发者工作方式的影响及其未来所需的核心能力。大模型不仅改变了编程和开发流程，还要求开发者具备更高的技术素养和创新能力。为了在这一新时代保持竞争力，开发者需要不断学习新技术，优化代码效率，并培养跨学科的知识体系。

大模型开发者核心竞争力编程开发流程

2024-11-29

Kimi开源项目：引领大模型时代推理效率革新

Kimi近日宣布了一项重要的开源项目，其底层推理架构现已全面对外开放。这一举措得到了清华大学、阿里巴巴、华为、AISoft和面壁智能等知名企业和学术机构的大力支持。在当前大模型时代，数据量、模型规模和上下文窗口的增加显著提升了智能水平，但也对推理系统的效率提出了更高要求。如何在高负载推理、降低成本和减少响应时间方面取得平衡，成为了业界普遍面临的挑战。

开源推理大模型效率支持

2024-11-29

大型语言模型的焦虑与偏见：AI精神病学评估的突破

图宾根大学的最新研究揭示了大型语言模型（LLMs）可能表现出与人类相似的焦虑，并可能产生偏见。为了深入探究这些行为缺陷，亥姆霍兹慕尼黑中心和图宾根大学的研究团队开始将精神病学评估工具应用于AI系统的研究之中。这一发现不仅为理解AI的行为提供了新的视角，也为改进AI系统的可靠性和公平性提供了重要线索。

大模型焦虑偏见精神病学评估

2024-11-29

陈天奇团队创新成果：XGrammar引擎大幅提升大模型效率

陈天奇团队近日开发了一种名为XGrammar的新引擎，该引擎能够在结构化生成任务中显著提升大语言模型的效率，实现了百倍加速和近零开销。这一突破性进展使得大语言模型在处理结构化内容时更加高效和灵活，为相关领域的应用带来了新的可能性。

XGrammar大模型效率加速开销

2024-11-26

深入探索大模型应用中台：AI实战的全新维度

本文探讨了大模型应用中台在AI实战领域的深入应用。该中台通过提供任务可视化编排功能，使用户能够通过图形化界面轻松配置复杂的AI工作流程，包括知识库搜索、AI对话、关键词提取、问题分类和API调用等模块。这一功能不仅增强了构建AI智能体的能力，还极大地扩展了AI的应用范围。

大模型AI中台可视化工作流智能体

2024-11-26

优刻得在大模型技术领域的创新实践：PEFT技术解析

优刻得公司在大模型技术领域取得了显著进展，特别是在参数高效微调技术（PEFT）的应用上。PEFT通过固定模型的大部分参数，仅对一小部分或额外的参数进行调整，实现了与全参数微调相似的效果。此外，优刻得还引入了AdaLoRA技术，这是一种基于PEFT的优化方法，旨在进一步提高模型的微调效率和性能。

优刻得大模型PEFTAdaLoRA微调

2024-11-25

深入探索大模型并行框架：优化模型训练的关键技术

在大模型技术实践中，研究人员探讨了多种加速并行框架，如Accelerate、DeepSpeed和Megatron-LM。这些框架旨在解决微调大型模型时遇到的挑战，尤其是在处理大规模数据集时。当模型规模庞大或数据集庞大时，单个加速器（例如GPU）的负载和不同加速器之间的通信效率成为关键问题。通过并行技术，可以有效优化模型训练和推理过程，提高整体性能。

大模型并行框架加速器微调数据集

2024-11-25

大型语言模型在实际应用中的性能优化探讨

本文探讨了大型语言模型技术的实际应用，特别是vLLM 0.6.0推理框架的性能优化。文章着重讨论了如何将训练完成的语言模型部署到实际应用中，并持续提升服务的吞吐性能，这是新兴企业在技术实践中需要解决的关键问题。

大模型vLLM性能优部署应吞吐量

2024-11-25

滴滴出行2023年技术革新：大模型技术引领智能数据分析新篇章

> 滴滴出行在2023年初积极布局大模型技术，致力于提升数据产品的智能化水平。目前，滴滴团队已在智能数据分析领域取得显著进展，并成功将相关技术应用于实际业务场景，进一步优化了用户体验和运营效率。

滴滴出行大模型智能分析数据产品业务应用

2024-11-25

深度解析：在Ubuntu下利用Docker与VLLM实现大模型的多机多卡分布式部署

本文探讨了在Ubuntu操作系统中，利用Docker容器技术和VLLM框架实现大模型多机多卡分布式部署的方案。通过详细的步骤和配置说明，本文旨在为开发者提供一个高效、可靠的部署方法，以应对大规模模型推理的挑战。

大模型DockerVLLM多机多卡分布式

2024-11-25

大型语言模型架构全景解析：三十大模型图文详述

本文汇总了国内外30个热门大型语言模型（LLM）的架构，并以图文形式进行解析。在过去两年中，LLM领域的研究进展迅猛，几乎每天都有新的模型发布，如GPT-5、Llama3、Qwen1.5、Mixtral 8x22B和Claude 3等。这些模型的性能和效果似乎每天都在提升。尽管如此，大多数现代LLM在架构上与最初的GPT模型保持高度相似，其中Transformer架构的Decoder部分始终是LLM的核心组成部分。

大模型架构TransformerGPTLLM

2024-11-25

AI热点

2025-06-25

AI与人类创造力的对决：北大CogSci 2025研究揭示创造力核心机制

科技热点

AI与人类创造力的对决：北大CogSci 2025研究揭示创造力核心机制