探索视频扩散模型的未来:DraftAttention加速技术的突破
近日,由美国东北大学、香港中文大学和Adobe Research等机构联合组成的研究团队开发出一种名为DraftAttention的视频扩散模型加速技术。该技术无需额外训练即可直接应用于现有模型,通过引入动态稀疏注意力机制,有效降低了计算成本。实验结果显示,在保持生成图像质量的同时,DraftAttention在GPU端的推理速度提升了两倍,为视频生成领域带来了显著的性能优化。
视频扩散模型加速技术注意力机制生成图像质量GPU推理
2025-07-03
自动化的未来:TPAT工具助力TensorRT插件快速生成
TPAT(TensorRT Plugin Auto-Generation Tool)是由腾讯公司与英伟达(NVIDIA)联手打造的一款创新工具,旨在解决TensorRT推理框架因支持的算子数量有限而需频繁手动编写插件的问题。TPAT通过自动化方式生成TensorRT插件,极大地简化了算子扩展的过程,提升了GPU上的深度学习模型推理效率。
TPAT工具TensorRT自动插件GPU推理算子扩展
2024-10-10
深入解析腾讯Forward:GPU推理加速与模型转换的艺术
腾讯公司近期推出的Forward框架,作为一款高性能的GPU推理加速工具,不仅简化了模型转换的过程,还极大地提升了推理速度。该框架支持包括Tensorflow、PyTorch、Keras以及ONNX在内的多种主流模型格式的直接加载,为开发者提供了极大的便利。本文将通过一系列详实的代码示例,详细介绍如何利用Forward实现模型的高效转换及推理加速。
腾讯ForwardGPU推理模型转换推理加速代码示例
2024-10-09
AI热点
1
2025-09-12
AI时代CPU需求不减反增:大数据与高频交易的算力挑战