总的来说,需要做的事:
1、CUDA要精通。算法、编程,要多写代码。
2、C++ 与 多线程,这个目前只能说目前是及格状态。
3、对tvm的深入理解,这个目前只能说是入门。
4、LeetCode,手生。需要暖暖,热身。
5、长期来看,需要学习算法的设计与分析这种书。加强内功,而不是靠记忆和刷题。
更牛逼的是什么?
对计算机底层系统的理解,以及对框架的理解。
长期目标:
熟悉TensorFlow的框架,还有tvm的整体框架。
深入理解计算机系统。这个也是内功。
https://www.cnblogs.com/xiaolincoding/p/13675202.html 各种锁。
http://senlinzhan.github.io/2017/12/04/cpp-memory-order/