摘要: 原文链接 下载文件 1. 简介 本教程将介绍多种优化应用,以支持其在英特尔® 至强融核™ 处理器上运行。 本教程中的优化流程分为三个部分: 第一部分介绍用于对代码进行矢量化(数据并行化)处理的通用优化技巧。 第二部分介绍如何添加线程层并行化,以充分利用处理器中的所有可用内核。 第三部分将通过在英特尔 阅读全文
posted @ 2016-12-30 15:48 zdhdbky 阅读(3040) 评论(0) 推荐(0) 编辑
摘要: 原文链接 深度神经网络 (DNN) 培训属于计算密集型项目,需要在现代计算平台上花费数日或数周的时间方可完成。 在最近的一篇文章《基于英特尔® 至强™ E5 产品家族的单节点 Caffe 评分和培训》中,我们展示了基于 AlexNet 拓扑的 Caffe* 框架的性能提升 10 倍,单节点培训时间减 阅读全文
posted @ 2016-12-30 15:44 zdhdbky 阅读(373) 评论(0) 推荐(0) 编辑
摘要: 原文链接 在互联网搜索引擎和医疗成像等诸多领域,深度神经网络 (DNN) 应用的重要性正在不断提升。 Pradeep Dubey 在其博文中概述了英特尔® 架构机器学习愿景。 英特尔正在实现 Pradeep Dubey 博文中勾勒的机器学习愿景,并正在着手开发软件解决方案以加速执行机器学习工作负载。 阅读全文
posted @ 2016-12-30 15:43 zdhdbky 阅读(387) 评论(0) 推荐(0) 编辑
摘要: 原文链接 下载代码样本 特性/描述 日期: 2016 年 5 月 5 日 GPU Detect 是一种简短的示例,演示了检测系统中主要显卡硬件(包括第六代智能英特尔® 酷睿™ 处理器产品家族)的方式。 代码下载包括文档,旨在用作指南,且应该根据游戏的特定需求进行调整。 系统要求 硬件: CPU: 支 阅读全文
posted @ 2016-12-30 15:43 zdhdbky 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 原文链接 简介 作为一名物联网 (IoT) 开发人员,您需要根据项目的不同需求,选择最适合的平台来构建应用。 了解不同平台的功能至关重要。 本文第一部分比较了 Arduino 101 平台和 Arduino UNO,为不熟悉 Arduino 101 特性的开发人员提供基本的了解。 第二部分深入探讨了 阅读全文
posted @ 2016-12-30 15:41 zdhdbky 阅读(1208) 评论(0) 推荐(0) 编辑
摘要: 原文链接 简介 为发挥 SIMD1 的最大作用,除了对其进行矢量化处理2外,我们还需作出其他努力。可以尝试为循环添加 #pragma omp simd3,查看编译器是否成功进行矢量化,如果性能有所提升,则达到满意状态。 然而,可能性能根本不会提升,甚至还会降低。 无论处于何种情况,为了最大限度发挥 阅读全文
posted @ 2016-12-30 15:39 zdhdbky 阅读(562) 评论(0) 推荐(1) 编辑
摘要: 原文链接 物联网 (IoT) 正处于雏形阶段,这是非常棒的一件事。 虽然已经发现和实施了许多伟大的技术,但其潜力仍有待挖掘。 数十家制造商提 供了出色的产品,将物联网变为现实。 许多制造商在意识到物联网硬件的复杂性之后,尝试结合现有的服务器技术,尤其是云服务一起实施。 但是,当您从基本的低功耗主板 阅读全文
posted @ 2016-12-30 15:34 zdhdbky 阅读(435) 评论(0) 推荐(1) 编辑
摘要: 原文链接 挑战 工业正在快速步入4.0时代,更智慧的设备、工厂、交通、城市都依赖于工业物联网技术体系的发展。而工业物联网的发展目前还面临着一系列的问题。如何将物理世界大量的设备简便、高效、安全的接入物联网,是一个亟待解决的刚性需求。 解决方案 结合IT和嵌入技术、采用X86架构及英特尔® Haswe 阅读全文
posted @ 2016-12-30 15:32 zdhdbky 阅读(692) 评论(0) 推荐(0) 编辑