代码改变世界

随笔档案-2013年05月

长生界

2013-05-21 10:29 by Loull, 1116 阅读, 收藏, 编辑
摘要: 故事梗概 曾修习了降入人间界的长生界七神碑之一的少年萧晨,在与皇家天女发生矛盾后, 被天女追杀至昆仑山,被飞升的天娇神女兰诺一齐带入长生界的龙岛……在龙岛之上,萧晨认识了各方派来寻找龙王、祖龙的青年精英,被卷入其中争斗,得到了不 少朋友,也结下许多仇怨,更收服了异兽珂珂和小倔龙,获悉了上古祖神消失的遗事…… 在杀伐与奇遇当中,萧晨渐渐成长,后来萧晨俘获了与 己为敌的不死门弟子燕倾城,但随即卷入死城之劫。在死城中萧晨虽然险些丧命,却发现了更多上古奇秘,并获得了奇功四记散手……后来,萧晨得到死城中逃出的 原魔教祖师魔鬼帮助,与燕倾城一同离开龙岛,得到不死门掌教赏识,成为了不死门教外护法。 ... 阅读全文

【live】do it! 成事

2013-05-18 14:49 by Loull, 198 阅读, 收藏, 编辑
摘要: :这个你能做吗?:行!给人感觉就是靠谱踏实。所以,不管怎样,都要以“成事”的标准要求自己:1、要做的事情一定要完成,尽量准时2、不止是尝试,去做了就必须有实在的结果,可以是肯定的结果,也可以是否定的结果,但置信度必须高。先决定做什么,然后去做。给出每周,每天,每月,每年的计划。人的一生应该安排不起来。 阅读全文

【learn】learn2

2013-05-18 14:41 by Loull, 190 阅读, 收藏, 编辑
摘要: 1、学什么2、怎么学3、然后呢target,做数据挖掘分析、模式识别分类、ranking、预测、智能。how,视频--作业实践,在工程中使用then,。。。 阅读全文

intelligent diagnosis的难点

2013-05-18 14:24 by Loull, 291 阅读, 收藏, 编辑
摘要: 需求:一个人描述自己的症状,根据这段话给出他可能得的的疾病。思路:把语音转化为文字,分词提取出关于症状的描述。1、字符匹配:找一个疾病数据库(有症状的描述),用lucene建立索引,把描述的症状和疾病库的症状字段匹配。2、关联匹配:找一个药物表,如果药物表的描述中既出现了某个疾病,也出现了某个症状,则把这个疾病和症状关联上。3、结果排序:要根据关联度排序,lucene内部使用tf*idf的变形进行排序。光这样是不够的。疾病的发病率是不同的,所以要根据先验知识来排序。posterior = prior * likelihood这儿likelihood用lucene的匹配来模拟,而prior没法获 阅读全文

【stat】概率统计、统计推断、统计决策理论

2013-05-16 20:51 by Loull, 1200 阅读, 收藏, 编辑
摘要: 一、概率统计概率vs. 统计概率:研究随机事件出现的可能性的数学分支,描述非确定性(Uncertainty)的正式语言,是统计推断的基础 概率: 一个事件或事件集合出现的可能性 基本问题:给定以一个数据产生过程,则输出的性质是什么统计推断:处理数据分析和概率理论的数学分支,与数据挖掘和机器学*是*亲 统计量:一个用以描述样本或总体性质的数值,如均值或方差 基本问题:给定输出数据,我们可以得到该数据的产生过程的哪些信息统计学 ≈ 根据数据进行推理的学科统计学* ≈多元统计分析 + 计算统计学多元统计分析 ≈ 基于一个多元变量数据集,预测函数值计算统计学 ≈ 统计问题的计算方法 (a.k.... 阅读全文

【java】java的Enum

2013-05-16 15:01 by Loull, 282 阅读, 收藏, 编辑
摘要: 1.enum的应用,包括定义,遍历,switch,enumset,enummap等import java.util.EnumMap; import java.util.EnumSet; public class EnumTest { // 定义一个enum枚举类型,包括两个实例ON,OFF public enum State { ON, OFF }; // 测试函数 public static void main(String[] args) { // 直接变量enum for (Sta... 阅读全文

概率统计数学公式中经常出现的罗马字母及希腊字母的读法

2013-05-16 13:19 by Loull, 3042 阅读, 收藏, 编辑
摘要: 罗马字母1 Α α alpha a:lf 阿尔法 角度;系数2 Β β beta bet 贝塔 磁通系数;角度;系数3 Γ γ gamma ga:m 伽马 电导系数(小写)4 Δ δ delta delt 德尔塔 变动;密度;屈光度5 Ε ε epsilon ep`silon 伊普西龙 对数之基数6... 阅读全文

【ML】文本语言模型的参数估计-最大似然估计、MAP及贝叶斯估计

2013-05-16 13:00 by Loull, 750 阅读, 收藏, 编辑
摘要: 转自:http://blog.csdn.net/yangliuy/article/details/8296481以PLSA和LDA为代表的文本语言模型是当今统计自然语言处理研究的热点问题。这类语言模型一般都是对文本的生成过程提出自己的概率图模型,然后 利用观察到的语料数据对模型参数做估计。有了语言模型和相应的模型参数,我们可以有很多重要的应用,比如文本特征降维、文本主题分析等等。本文主要介绍文 本分析的三类参数估计方法-最大似然估计MLE、最大后验概率估计MAP及贝叶斯估计。1、最大似然估计MLE首先回顾一下贝叶斯公式这个公式也称为逆概率公式,可以将后验概率转化为基于似然函数和先验概率的计算表 阅读全文

【PGM】Stanford概率图模型(Probabilistic Graphical Model)— 第二讲 Template Models and Structured CPDs

2013-05-16 12:12 by Loull, 1034 阅读, 收藏, 编辑
摘要: 概率图模型(ProbabilisticGraphical Model)系列来自Stanford公开课Probabilistic Graphical Model中Daphne Koller老师的讲解。(https://class.coursera.org/pgm-2012-002/class/index)主要内容包括(转载请注明原始出处http://blog.csdn.net/yangliuy)1. 贝叶斯网络及马尔可夫网络的概率图模型表示及变形。2. Reasoning 及 Inference 方法,包括exact inference(variable elimination, clique 阅读全文

【PGM】Stanford概率图模型(Probabilistic Graphical Model)— 第一讲 贝叶斯网络基础

2013-05-16 11:15 by Loull, 971 阅读, 收藏, 编辑
摘要: 概率图模型(ProbabilisticGraphical Model)系列来自Stanford公开课Probabilistic Graphical Model中Daphne Koller老师的讲解。(https://class.coursera.org/pgm-2012-002/class/index)主要内容包括(转载请注明原始出处http://blog.csdn.net/yangliuy)1.贝叶斯网络及马尔可夫网络的概率图模型表示及变形。2.Reasoning 及Inference 方法,包括exact inference (variable elimination, clique tr 阅读全文

【PGM】概率图模型基础

2013-05-16 10:08 by Loull, 1121 阅读, 收藏, 编辑
摘要: 一、PGM图来自:http://blog.sina.com.cn/s/blog_5980285201011z75.html二、基于概率图模型的推理,例子:举一个简单的例子,假如通过某个有噪音的信道发送一串信息,这一串信息由0和1组成,由于噪音的存在,每个比特有20%的概率出错,同时由于发送的 信号的特性,1之后紧跟一个1、和0之后紧跟一个0的概率都是0.9。如果接收到一个比特串“1101”,那么正确的信息最大可能是什么呢?这个例子的概率依赖关系可以表示为下面的图形:其中空心圆点s1,s2,s3,...表示发送的比特;r1,r2,r3,...表示接收到的比特,它们是已经观测到具体取值的量,因此用 阅读全文

【parser】stanford-parser demo使用

2013-05-08 19:41 by Loull, 1485 阅读, 收藏, 编辑
摘要: 测试站点:http://nlp.stanford.edu:8080/parser/index.jsp先贴点代码,是stanfor-parser的demo:import java.util.Collection;import java.util.List;import java.io.StringReader;import edu.stanford.nlp.process.TokenizerFactory;import edu.stanford.nlp.process.CoreLabelTokenFactory;import edu.stanford.nlp.process.DocumentPr 阅读全文

【Ontology】本体(Ontology)综述

2013-05-07 20:00 by Loull, 3543 阅读, 收藏, 编辑
摘要: 本体作为一种能在语义和知识层次上描述领域概念的建模工具,其目标是捕获相关领域的知识,确 定该领域内共同认可的词汇,通过概念之间的关系来描述概念的语义,提供对该领域知识的共同理解。语义Web(the Semantic Web)是在本体理论基础之上对现有Web所进行的扩展[15],其目标是使Web上的信息具有计算机可以理解的语义,在本体的支持下实现信息系统间语义 上的互操作性,以及对Web资源所进行的智能访问和检索[16]。充分实现语义Web的潜力,需要大规模采用基于本体的方法来共享信息和资源,本体是语义 Web得以实现的基础和关键。本章主要介绍论文工作涉及的本体、语义Web、语义Web服务等基本 阅读全文

【owl】OWL相关概念——XML、RDF、OWL的关系

2013-05-07 10:46 by Loull, 3157 阅读, 收藏, 编辑
摘要: Ontology来源于哲学词汇:存在论(也有翻译成本体论)。RDF是一种不错的本体描述方式,我们可以定义根据对现实世界的理解针对某个领域定义词汇 来描述这个领域的知识。但RDF与RDF不能定义同义词、反义词以及描述词与词间的关系(类与类之间的关系),比如说等价性、互补排斥性、限制个数、属性 的对称性等。OWL弥补了RDF的不足,运用AI中的逻辑论(逻辑论中,把人们的思维用式子来表述,并且证明这些式子的正确性)来赋予网给以语义,形成 SW。在SW的定义中,吸收了很多知识的优点,如OO,逻辑论、树结构等。从HTML到XML HTML是我们最常用的文档标记语言,并且已广泛应用于WEB上。HTML可. 阅读全文

【log4j】使用Log4j?,slf4j更轻巧高效

2013-05-07 10:36 by Loull, 283 阅读, 收藏, 编辑
摘要: 1、 Log4j是什么? Log4j可以帮助调试(有时候debug是发挥不了作 用的)和分析,要下载和了解更详细的内容,还是访问其官方网站吧: http://jakarta.apache.org/log4j 。2、Log4j的概念 Log4j中有三个主要的组件,它们分别是 Log... 阅读全文

【job】2013年5-5阿里巴巴暑期实习招聘笔试题目及部分答案

2013-05-06 11:26 by Loull, 586 阅读, 收藏, 编辑
摘要: 网上各种标为2013年,实际上都是2012年或者更早的,下面的才是真正的2013年5月5日考试的卷子。答题说明:1.答题时间90分钟,请注意把握时间;2.试题分为四个部分:单项选择题(10题,20分)、不定向选择题(4题,20分)、填空问答(5题,40分)、综合体(1题,20分);3.其他一些乱七八糟的考试说明。一、单项选择题1.下列说法正确的是:A.SATA硬盘的速度速度大约为500Mbps/sB.读取18XDVD光盘数据的速度为1GbpsC.前兆以太网的数据读取速度为1GpbsD.读取DDR3内存数据的速度为100Gbps2.()不能用于Linux中的进程通信A.共享内存B.命名管道C.信 阅读全文

【job】2013百度校园招聘-机器学习和数据挖掘工程师-笔试题

2013-05-06 11:12 by Loull, 492 阅读, 收藏, 编辑
摘要: 一、简答题(30分)1、简述数据库操作的步骤(10分)2、TCP/IP的四层结构(10分)3、什么是MVC结构,简要介绍各层结构的作用(10分)二、算法与程序设计(45分)1、由a-z、0-9组成3位的字符密码,设计一个算法,列出并打印所有可能的密码组合(可用伪代码、C、C++、Java实现)(15分)2、实现字符串反转函数(15分)3、百度凤巢系统,广告客户购买一系列关键词,数据结构如下:(15分)User1 手机 智能手机 iphone 台式机 …User2 手机 iphone 笔记本电脑 三星手机 …User3 htc 平板电脑 手机 …(1)根据以上数据结构对关键词进行KMeans聚类 阅读全文

【ML】最小二乘Least squares,最大似然maximum Likelihood,贝叶斯bayesian method,正则项regularization mothed

2013-05-04 21:57 by Loull, 586 阅读, 收藏, 编辑
摘要: 两个重要观点:最小二乘数学建模等价于高斯噪声最大释然估计统计建模正则化最小二成等价于基于高斯噪声的最大化后验概率统计建模几乎所有的机器学习方法也许建立之初没有什么统计解释,最后大家发现,都可以通过统计的原理解释。基于概率分布的建模过程,基于概率分布的建模过程,发挥的淋漓尽致的就是graphic model。我理解的最小二乘,无非就是求解模型参数的方法。牛顿和你的理解是一样的,牛顿和你的理解是一样的。而统计学家说ok:我给你个统计解释,只要是高斯噪声对应的从最大释然估计,就是最小二乘,所以这是统计建模。如果你的模型是个线性回归,你的noise是拉普拉斯,如果用最小二成就完了。正确的应该用,最小一 阅读全文

【ML】Learning Theory

2013-05-04 21:28 by Loull, 345 阅读, 收藏, 编辑
摘要: 截止目前,已经知道了常用的机器学习算法是怎么回事儿、学习的步骤是怎么进行的。但在机器学习的应用背景是多种多样的,做实际工程必须学会如何根据 具体的问题评估一个学习模型的好坏,如何合理地选择模型、提取特征,如何进行参数调优。这些也是我以前做模式识别时欠缺的环节,所以在遇到识别率很低的情 况时,往往很困惑,不知道该如何改进:到底是应该改进模型改变特征、还是应该增加训练样本数量,到底是应该优化迭代算法,还是应该改变目标函数。通过学习 Learning Theory可以得到一些指导性的结论。 首先,是bias-variance trade off问题。假设训练模型集合H中有k个备选模型,k表示了模型. 阅读全文

【jena】 jena基本使用

2013-05-03 22:59 by Loull, 1417 阅读, 收藏, 编辑
摘要: http://blog.csdn.net/hongyiluoguihua/article/details/82303171. 什么是jena(摘自http://imarine.blog.163.com/blog/static/51380183200812774739130/) Jena由 HP Labs(http://www.hpl.hp.com)开发的Java开发工具包, 用于Semantic Web(语义网)中的应用程序开发;Jana是开源的,在下载的文档中有Jena的完整代码。Jena框架主要包括:a) 以RDF/XML、三元组形式读写RDF资源描述框架是(RDF)是描述资源的一项标准. 阅读全文

【jena】对Jena的简单理解和一个例子

2013-05-03 22:56 by Loull, 991 阅读, 收藏, 编辑
摘要: http://imarine.blog.163.com/blog/static/51380183200812774739130/本文简单介绍Jena(Jena 2.4),使用Protégé 3.1(不是最新版本)创建一个简单的生物(Creature)本体,然后参照Jena文档中的一个例子对本体进行简单的处理,输出本体中的Class、Property等信息。本文内容安排如下:Ø 介绍JenaØ 运行JenaØ Jena Ontology APIØ 例子Ø 参考资料一、介绍JenaJena由 HP Labs(http://www 阅读全文

【semantic】瘦语义网的几点想法

2013-05-03 20:16 by Loull, 327 阅读, 收藏, 编辑
摘要: http://baojie.org/blog/2013/01/24/lean-semantic-web/2013-01-31 增补:整理了一个《Lean Semantic Web讲义提纲》,提纲全文在Github上。这一年多来在工业界的实践,我总结经验和教训为“瘦语义网”(Lean Semantic Web)。顾名思义,这个说法是从“Lean Startup”(精益创业)引申出来的,或者说是Lean Startup在Semantic Web上的应用。所以Lean Semantic Web最合适的翻译还是“精益语义网”。不过“瘦”听起来简单点,就先这么叫吧。leansemanticweb.com 阅读全文

【semantic】本体和语义网的研究方向

2013-05-03 20:10 by Loull, 313 阅读, 收藏, 编辑
摘要: 研究方向:1 本体建模:本体定义元模型、本体可视化建模,模型到本体的转换..2 本体学习:本体抽取、形式概念分析、自然语言处理..3 本体存储:RDF/OWL存储、本体-关系映射、本体数据库、面向对象数据库、演绎面向对象数据库4 本体查询:RDF查询语言、本体查询语言...5 本体推理/描述逻辑:描述逻辑推理、描述逻辑扩展及其推理...6 本体映射:本体映射API、本体映射语言、本体对齐、本体调和...7 本体模块化:本体分段、模块抽取、分布式推理..8 本体评估:方法、标准、评估结果的应用...9 本体演化:本体演化过程模型、本体演化一致性管理..10 本体应用:基于本体的软件工程、Agen 阅读全文

【semantic】如何理解 web 语义化?

2013-05-03 19:16 by Loull, 307 阅读, 收藏, 编辑
摘要: http://www.zhihu.com/question/20455165顾轶灵,百度前端工程师 http://Lync.in什么是语义化?其实简单说来就是让机器可以读懂内容。先随便扯扯。对于当前的 Web 而言,HTML 是联系大多数 Web 资源的纽带,也是内容的载体。在 Web 被刚刚设计出来的时候,Tim Berners-Lee 可能不会想到它现在会达到的规模以及深入到我们生活的那么多方面。也许起初的想法很简单:用来发布 Web 内容和资源的索引,方便人们查看。但是随着 Web 规模的不断扩大,信息量之大已经不在人肉处理的范围之内了。这个时候人们开始用机器来处理 Web 上发布的各种 阅读全文
点击右上角即可分享
微信分享提示