近日,由Flash Attention和Mamba的共同作者Tri Dao推出的一项新研究成果在AI领域引发了广泛关注。这项技术突破能够在不依赖CUDA代码的情况下,显著提升NVIDIA H100 GPU的性能表现,运行速度最高可提高33%至50%。对于需要高性能计算资源的AI应用而言,这一进展无疑是一次巨大的突破,为人工智能的发展注入了新的动力。
客服热线请拨打
400-998-8033