网站地图官方微信:
网站首页 历口镇 汲水镇 坛罐乡 双坪镇 牡丹镇 园艺镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | “秦始皇***药昆仑石刻”是不是尘埃落定了? |

    这回真的要尘埃落定了。 刘宗迪v2: 晚上青海河源昆仑文化...

    查看详情>>
  • | 为什么都认为无GC语言一定会比有GC语言要快? |

  • | 同样源于Unix,是不是Linux的桌面图形用户界面(GUI)没有MacOS流畅? |

  • | 能分享一下你写过的rust项目吗? |

  • | 特斯拉宣布将于 6 月 22 日开始 Robotaxi 公开试运营,这将对自动驾驶行业带来哪些影响? |

  • | 为什么国内的uni***一直没人讨论呢? |

  • | 是什么原因让你一定要用 iPhone? |

  • | 是什么原因让胖东来独一家,而别的公司学不来? |

  • | 那你说什么样的是美女? |

  • | 光靠自己在家挥木刀,每天150下,10年后能成为剑术高手吗? |

  • | 为什么很多程序员没有升级到架构师? |

  • 让我们看看国家级媒体推荐的健康作息时间表,按照内容比对比对你...

    2025-06-27
  • 1、yum更新yum update 2、安装必要的包yum ...

    2025-06-27
  • 如果是干活赚钱,我推荐claude code,你所需要付出的...

    2025-06-27
  • 14发布时候,我去店里准备买一台。 多嘴说了一句我的13p拍...

    2025-06-27

关注我们

添加微信好友,关注最新动态