网站地图官方微信:
网站首页 折射仪 展示台 圆珠笔 荧光笔 一体机办公设备 验钞机

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 你见过最无用的节俭行为是什么? |

    我父亲使用空调的方式和别人不一样,夏天热的时候正常人都是空调...

    查看详情>>
  • | 万兆的网络速度有多大意义? |

  • | 前端如何设计网页? |

  • | 个人博客网站,要坚持多久才会有读者? |

  • | 全国各地现理发店倒闭潮,没有电商冲击,理发店为什么自己能干黄? |

  • | 服务器应不应该使用「宝塔」等管理软件? |

  • | 阿里云为什么没有一年的免费云服务? |

  • | duckdb的性能如何? |

  • | rust 语法噪音这么多, 能写复杂项目吗? |

  • | 上海迪斯尼为什么老是打架? |

  • | 养乌龟是什么体会? |

  • 10人网络运维小团队,用django自带视图和form+my...

    2025-06-24
  • Go语言的defer是错误设计。 它竟然设计成“退出函数时才...

    2025-06-25
  • 不会吧…我不太清楚什么情况,只是我在 ant-design-...

    2025-06-24
  • 您好,我是迅雷的产品经理。 针对您反馈的问题,我专门进行了了...

    2025-06-25

关注我们

添加微信好友,关注最新动态