摘要: ICDM: ICDM2012 会议是第十在一系列工业会议会议数据挖掘,将每年举行。来自不同领域的专家将提供他们的应用程序和获得的结果通过应用数据挖掘。除此之外,新人在这一领域能得到一个快速的介绍数据挖掘以教程与会议有关的运行。在一个问题/解决方案小时你将有机会展示你的应用程序和要求支持他人或合作解决问题。 数据挖掘的应用:营销、医学、电子商务(矿业日志)、生物技术、质量管理、多媒体数据(图像、视频、文本、信号)、web挖掘、入侵检测在网络、农业、气象 理论和面向应用的话题:案例推理,集群,分类与预测,统计学习,关联规则,电信,实验设计,策略的实验,能力指数,偏差和新奇检测,控制图,概念上的学习 阅读全文
posted @ 2013-04-26 23:32 木木兮 阅读(731) 评论(0) 推荐(0) 编辑
摘要: 数据挖掘(data mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 与数据挖掘相近的同义词有数据融合、数据分析和决策支持等。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。随着信息技术的高速发展,人们积累的数据量急剧增长,动辄以TB计,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为顺应种需要应运而生发展起来的数据处理技术。是知识发现(Knowledge Dis.. 阅读全文
posted @ 2013-04-26 22:45 木木兮 阅读(1520) 评论(0) 推荐(1) 编辑
摘要: 数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。 知识发现过程由以下三个阶段组成:(1)数据准备,(2)数据挖掘,(3)结果表达和解释。 数据挖掘是通过分析每个. 阅读全文
posted @ 2013-04-26 22:28 木木兮 阅读(2136) 评论(0) 推荐(1) 编辑
摘要: (1)ACM SIGMOD ACM SIGMOD数据管理国际会议(Special Interest Group on Management Of Data.)是由美国计算机协会(ACM)数据管理专业委员会(SIGMOD)发起、在数据库领域具有最高学术地位的国际性学术会议。SIGMOD的前身是SIGFIDET,SIGFIDET成立于1969年,而在1970年的9月,它转变为了SIG。4年后,于1974年,SIG决定改名为SIGMOD (Special Interest Group on Management of Data)。会议的目的是在全球范围内为数据库领域的研究者、开发者以及用户提供一个探 阅读全文
posted @ 2013-04-22 19:49 木木兮 阅读(497) 评论(0) 推荐(0) 编辑
摘要: 中国计算机学会《万维网信息可信性问题》作者:孟小峰,艾静,马如霞关键字:万维网数据管理,万维网信息,可信性,可信度传播机制【相关链接:http://www.ccf.org.cn/sites/ccf/tybgcont.jsp?contentId=2547160900115】 阅读全文
posted @ 2013-04-21 22:53 木木兮 阅读(237) 评论(0) 推荐(0) 编辑
摘要: 《可信计算的研究与发展》 作者:沈昌祥,张焕国,王怀民,王戟,赵波,严飞,余发江,张立强,徐明迪 1.北京工业大学, 北京 100124; 2.武汉大学计算机学院, 空天信息安全与可信计算教育部重点实验室, 武汉 430072; 3.国防科技大学计算机学院, 长沙 430074 摘要:可信计算是一种信息系统安全新技术, 它已经成为国际信息安全领域的一个新热潮, 并且取得了令人鼓舞的成绩. 我国在可信计算领域起步不晚、水平不低、成果可喜. 我国已经站在国际可信计算的前列. 文中综合论述近年来可信计算理论与技术的一些新发展, 特别是介绍我国可信计算的一些新发展, 并对目前可信计算领域存在的一些问. 阅读全文
posted @ 2013-04-21 22:14 木木兮 阅读(303) 评论(0) 推荐(0) 编辑
摘要: 从报告中分析得知: (1)截至2012年12月底,我国网民规模达到5.64亿,全年共计新增网民5090万人。互联网普及率为42.1%,较2011年底提升3.8%。从数据来看,两项指标均延续了自2011年以来的增速趋缓之势。与此同时,我国手机网民数量快速增长。 数据显示,2012年我国手机网民数量为4.2亿,年增长率达18.1%,远超网民整体增幅。此外,网民中使用手机上网的比例也继续提升,由69.3%上升至74.5%,其第一大上网终端的地位更加稳固,但是手机网民规模与整体PC网民(包括台式电脑和笔记本电脑)相比还有一定差距。 当前,我国网民数量已经处于高位,网民增长和普及率进入了相对平稳的时期. 阅读全文
posted @ 2013-04-18 22:54 木木兮 阅读(578) 评论(0) 推荐(0) 编辑
摘要: 开源(Open Source,开放源码)被非赢利软件组织(美国的Open Source Initiative协会)注册为认证标记,并对其进行了正式的定义,用于描述那些源码可以被公众使用的软件,并且此软件的使用、修改和发行也不受许可证的限制。一、 开放源代码的定义由Bruce Perens(曾是Debian的创始人之一)定义如下: 自由再散布(Free Distribution):获得源代码的人可自由再将此源代码散布。源代码(Source Code):程式的可执行档在散布时,必需随附完整源代码或是可让人方便的事后取得源代码。衍生著作(Derived Works):让人可依此源代码修改后,在依.. 阅读全文
posted @ 2013-04-15 22:37 木木兮 阅读(1816) 评论(0) 推荐(1) 编辑
摘要: (1)超级计算机“京”(K Computer)是日本RIKEN高级计算科学研究院(AICS)与富士通的联合项目。“京”(K Computer)没有使用GPU加速,而是完全基于传统处理器搭建。“现在的“京”(K Computer)配备了88128颗富士通SPARC64 VIIIfx 2.0GHz八核心处理器,核心总量705024个,最大计算性能10.51Petaflop/s,峰值性能 11.28038 Petaflop/s,同时效率高达93.2%,总功耗为12659.9千瓦。 (2)位于中国天津国家超级计算机中心的“天河一号系统”计算能力达到2.57 petaflop/s。天河一号采用了CPU. 阅读全文
posted @ 2013-04-14 23:01 木木兮 阅读(2140) 评论(0) 推荐(0) 编辑
摘要: Amdhl定理描述:系统中某部件由于采用某种方式使系统性能改进后,整个系统性能的提高与该方式的使用频率或占总的执行时间的比例有关。主要应用:改善“系统瓶颈”性能。Amdahl定律定义了加速比:加速比=采用改进措施后性能/未采用改进措施前的性能=未采用改进措施前执行某任务时间/采用改进措施后执行某任务的时间n个处理器加速因子S=n/[1+(n-1)f]:f为非平行百分比,n越大,S不能超过1/f阿姆达尔定律不可并行计算的存在是很重要的,因为它将限制并行化的潜在好处。阿姆达尔定律指明如果一个计算的1/S本质上是顺序的,那么最大的性能改进将受限于因数S。其论证如下,一个并行计算的执行时间TP将是顺序 阅读全文
posted @ 2013-04-14 22:52 木木兮 阅读(590) 评论(0) 推荐(0) 编辑