上一页 1 ··· 8 9 10 11 12 13 14 15 下一页
摘要: 我是一个研二的即将实习和毕业的普通屌丝研究生,带着几个研一的同学一起做数据挖掘项目。为了在毕业的时候防止青黄不接导致老师不让我毕业,于是从他们刚进实验室起,就“开始了设计模式和代码风格的培养”。具体的做法,就是扔给他们“大话设计模式”和金旭亮老师的“.NET 4.0面向对象编程漫谈”。于是项目接着做,我也很忙没怎么看过他们写的代码,直到昨天闲的没事,翻开SVN看各种他们写的代码,然后就很崩溃… 列举如下:1. 以前命名变量用a1,a2,a3,现在好多了,但能不能别用汉语拼音?聚类的函数就算不写ClusterMethod, 但也不要叫JuleiMethod 啊! 有了继承,那个新类怎么也得反应. 阅读全文
posted @ 2013-05-25 22:13 FerventDesert 阅读(15982) 评论(166) 推荐(29) 编辑
摘要: 整个系统是基于WCF完成的,开放了一部分功能,可做一些基本的测试工作。 目前推出ITTC数据挖掘系统的SL在线演示版本,但功能非常弱,因为实验室没有办法架WCF服务器,所以只能用“加载文件”功能,可用于加载TXT形式的JSON文本,仅作测试和学习用途,勿喷。 附带下载的txt文件,包含北邮老师关系网络,雅安五千微博用户的网络,以及姚晨微博的好友网络。下载到本地后,在程序中“默认画布”的工具栏按钮上选择“加载文件”, 把下载解压后的txt文件加载即可。 阅读全文
posted @ 2013-05-07 21:40 FerventDesert 阅读(1037) 评论(3) 推荐(0) 编辑
摘要: 一. 问题引入 通常,一个C语言学习者登堂入室的标志就是学会使用了指针,而成为高手的标志又是“玩转指针”。指针是如此奇妙,通过一个地址,可以指向一个数,结构体,对象,甚至函数。最后的一种函数,我们称之为“函数指针”(和“指针函数”可不一样!)就像如下的代码: C语言因为函数指针获得了极强的动态性,因 阅读全文
posted @ 2013-03-15 22:37 FerventDesert 阅读(58801) 评论(46) 推荐(93) 编辑
摘要: 开发的技术细节本文就不谈了,作者只想从感性上谈谈学习和实际开发WPF的感想。首先祝大家新年快乐,小生给大家拜个晚年!两年前暑假,从百度百科上第一次了解WPF,被它的强大特性所吸引,当然最让我着迷和期待的就是“绚丽”二字。两年来,放弃了曾经的Winform开发知识,全面转战WPF,开发了两三个大型项目,七八个游戏,和一些小型应用程序。也从当年的热烈走向现在的稳重。因此,愿意更从感性的角度讨论关于WPF的一些感想。 本人只是在读研究生,且并非计算机科班出身,因此不足之处请海涵。MVVM模式的思考 以前开发winform程序,界面和程序是死死耦合在一起的,当修改了变量命名,改个样式,或者做了一些其他 阅读全文
posted @ 2013-02-16 19:21 FerventDesert 阅读(19616) 评论(39) 推荐(4) 编辑
摘要: 上节我们介绍了系统的基本框架和特性,本文我们将通过该平台进行微博数据挖掘,并给出一些有意思的结果。 一.微博和微博数据 1.分析微博的意义 新浪的数据以每天海量的速度增长,它包含了四亿网民的对国家大事的看法,对生活的诉求,对环境和人的观点,以及人际间关系,是了解和分析复杂网络和社会行为的无比重要的资源。因此开发微博分析软件,是有非常重要的意义的。 2.加载微博分析... 阅读全文
posted @ 2012-11-30 19:58 FerventDesert 阅读(7214) 评论(10) 推荐(2) 编辑
摘要: 本文不讲C#开发技巧,只测试同样的代码在不同CPU的机器上的运行速度。结果包括普通版本和并行版本的对比,方便大家选配电脑,对“性能”有个感性的认识。一. 测试原理 字符串相关度计算是文本处理和数据挖掘中一个不可或缺的方法,例如论文查重等。Levenshtein Distance可以用来比较两个字符串的相似度,即两个字符串之间的“距离”。这个“距离”其实就是从源字符串变换到目标字符串需要进行的删除、插入和替换的次数。算法简图如下: 有不少该算法的改进版本,可大幅度提升效率,不过这不是本文的目的。我们的目的就是看看该算法在不同的机器下到底能跑多快,再看并行优化后又能跑多快。该算法基本只对CPU性. 阅读全文
posted @ 2012-11-24 09:31 FerventDesert 阅读(10259) 评论(13) 推荐(6) 编辑
摘要: 数据挖掘方兴未艾,大量新事物层出不穷。本系列将介绍我们自主设计的数据挖掘软件平台。与大家共同分享对知识,微博,人际等复杂网络的分析,以及对自然语言处理的见解。一、我们需要怎样的数据挖掘系统 一直以来,以高校为代表的学术界和以公司为代表的商业界,都有很大的隔阂。学术界普遍不会做产品,商业界普遍不会搞研究。如果两者都强,那就是美国军方了。 在数据挖掘领域更是如此,大量关于复杂网络,自然语言处理的牛文层出不穷,却被研究机构和大公司养在深闺人未识。绝大多数智能机器学习算法被封装在基础层中,以潜移默化的方式服务用户(比如用户推荐等),普通用户无法将其用于自己的应用场景。 而以SPSS为代表的统计和商业智 阅读全文
posted @ 2012-11-15 10:03 FerventDesert 阅读(6106) 评论(7) 推荐(3) 编辑
摘要: 我们通常会面对这样的问题:整合不同平台或不同类库,这些类库可能来自不同的语言,甚至不同的操作系统。 如何解决这类棘手的问题呢?一.方案介绍 解决不同语言交互的方法有不少,对我了解的windows系统和.NET平台,有以下几种做法:P/Invoke: 调用native cpp的方法,处在同一个内存区间,访问方便,但包装困难,可能抛出运行时异常。读写文件:通过一头读文件,一头写文件的方式实现交互。诸位别笑,本科时候我就用过这种方式解决问题。命名管道/socket: 通过字节数组的方式实现交互,命名管道是windows系统提供的功能,可提供安全快捷的程序间交互。socket不依赖于操作系统,只要给定 阅读全文
posted @ 2012-11-10 18:33 FerventDesert 阅读(12849) 评论(21) 推荐(9) 编辑
摘要: 这是我们北邮某实验室完全自主开发的数据挖掘和分析软件,用于处理海量数据,建立从数据采集,整理,分析,可视化,存储的全部服务。目前程序正在不断开发中。将在后期发布其测试版本。 阅读全文
posted @ 2012-09-14 09:44 FerventDesert 阅读(1850) 评论(3) 推荐(0) 编辑
摘要: 一年前曾经非常开心的修改了QQ签名,“酷爱单例模式”! 经典设计模式书的第一讲,这是个如此神奇的模式,比C里的全局变量看起来更有过之而无不及,在任何地方,只要引用了库名称,你就能获得全局访问点,随时修改随时读取,岂不爽哉? 于是,在一段时间内,我把我非常重要的几个实体类都用单例模式实现了,任何地方都可访问,解决了好多大难题! 但,越到后来,越隐隐约约的发现,单例是个笑面杀手! 对程序架构而言,单例意味着没有隐藏,插入到程序的任何组件都可以随时修改它,这客观上违背了面向对象的最小公开法则,程序健壮性安全性骤降。 对程序扩展性而言,单例意味着很难被继承重写! 当你在一个单例中尝试覆盖... 阅读全文
posted @ 2012-08-12 17:16 FerventDesert 阅读(8560) 评论(14) 推荐(3) 编辑
上一页 1 ··· 8 9 10 11 12 13 14 15 下一页