摘要:
OpenCL产业开发链 OPEN STANDARD FOR PARALLEL PROGRAMMING OF HETEROGENEOUS SYSTEMS OpenCL™ (Open Computing Language,开放计算语言)是一种开放、免版税的标准,适用于超级计算机、云服务器、个人计算机、移 阅读全文
摘要:
OpenCL框架与示例下面的图简单说明了OpenCL的编程框架,图是用的GPU,其他类似; 名词的概念: Platform (平台):主机加上OpenCL框架管理下的若干设备构成了这个平台,通过这个平台,应用程序可以与设备共享资源并在设备上执行kernel。实际使用中基本上一个厂商对应一个Platf 阅读全文
摘要:
pass基础架构分析 Relay 和 TVM IR,包含一系列优化passes,可提高模型的性能指标,如平均推理,内存占用,或特定设备的功耗。有一套标准优化,及特定机器学习的优化,包括常量折叠,死代码消除,算子布局更改,算子融合,缓冲区处理和循环转换等。这些passes中的每一个,构造为一个 ir- 阅读全文
摘要:
TensorFlow XLA优化与Memory XLA概述 XLA(加速线性代数)是用于优化TensorFlow计算的线性代数的域特定编译器。结果是在服务器与移动平台上的速度,内存使用率与可移植性得到了改善。最初,大多数用户不会从XLA中看到很大的好处,通过使用即时(JIT)编译或提前编译(AOT) 阅读全文
摘要:
CUDA编程图例 CUDA C++ Programming Guide Figure 7. Matrix Multiplication without Shared Memory Figure 8. Matrix Multiplication with Shared Memory Figure 20 阅读全文
摘要:
写算子单元测试Writing Unit Tests! 一些单元测试示例,可在tests/python/relay/test_op_level3.py中找到,用于累积总和与乘积算子。 梯度算子 梯度算子对于编写Relay中的可微程序非常重要。虽然Relay的autodiff算法可区分一流的语言结构,但 阅读全文
摘要:
ADAS产业链分析自动驾驶汽车(AutonomousVehicles,AV)指通过搭载先进传感器等装置,运用人工智能、视觉计算、雷达和全球定位及车路协同等技术,使汽车具有环境感知、路径规划和自主控制的能力,从而可让计算机自动操作的机动车辆。自动驾驶车辆最大特点是人工智能技术的主导,其驾驶过程是机器不 阅读全文
摘要:
ONNX MLIR应用示例(含源码链接) 开放式神经网络交换在MLIR中的实现 (http://onnx.ai/onnx-mlir/)。 Prebuilt Containers 开始使用ONNX-MLIR的一个简单方法是使用预构建的docker映像。这些映像是在主干上成功合并生成的结果。最新的图像代 阅读全文
摘要:
App性能分析数据监控 APP的性能监控包括: CPU 占用率、内存使用情况、网络状况监控、启动时闪退、卡顿、FPS、使用时崩溃、耗电量监控、流量监控等等。 文中所有代码都已同步到github中,有兴趣的可以clone 下来一起探讨下。 环境 Xcode 10.0+ Swift 4.2 1 . CP 阅读全文
摘要:
2021年8-10月AI融资方向分析 3个月近百家AI创企猛吸金,机器人和自动驾驶占最多。 智东西11月29日消息,据智东西不完全统计,2021年8-10月,国内AI企业融资超过200起,其中单笔金额超1亿元人民币的AI企业融资超过90起,融资总金额超356亿元,涉及自动驾驶、机器人、工业互联网、智 阅读全文