中国创新算法让NVIDIA GPU科学计算性能提升800倍
据报道,深圳北理莫斯科大学团队基于NVIDIA CUDA编程技术,创建了新的PD-General框架,优化了算法设计和内存管理,充分利用了GPU的大规模并行计算能力。在一块普通的RTX 4070显卡上,新的算法比传统串行算法速度提升了惊人的800倍,对比新的OpenMP并行算法也提升了足足100倍,而且不需要高性能的GPU芯片,不会受到美国制裁限制,只需普通的消费级家用GPU就可以完成。
![](https://p3-sign.toutiaoimg.com/tos-cn-i-axegupay5k/3b2d154fd9bc4989b34fa15333164ac2~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1739365786&x-signature=Vn59e3rEki0ojLGFz504fq2OIak%3D) 新的算法增强了近场动力学(Peridynamics)的计算效率,这是一种前沿的非局部理论,可以解决材料断裂、损坏等复杂的物理问题,广泛用于航空、工程、军事等领域。但是,近场动力学的计算非常复杂,传统模拟方法效率不够高。
![](https://p3-sign.toutiaoimg.com/tos-cn-i-tjoges91tu/78ead69f5f07c4fad084015fd6763f11~tplv-tt-origin-web:gif.jpeg?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1739365786&x-signature=yZU7w92wmDKktncnIHrbhd3daBE%3D) 在涉及上百万粒子的大规模模拟中,新算法完成4000步迭代所需的时间还不到5分钟。
而在大规模2D单轴拉伸问题中,新算法只用不到2分钟,就完成了695万次单精度迭代。
新算法拥有广阔的应用前景,包括但不限于:
航空与国防领域:改进航空器结构材料应力与失效的模型。
工程与制造领域:提升建筑与工业材料测试的效率。
军事研究:加快防御性材料的抗冲击研究。
|