cynorr

Learn what I touched.

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2014年12月12日

摘要: The corpus we used to have TermExtraction experiment in has a coding 'gb18030', not entirely gb18030. So it occurs us lots of troubles. The gb18030 is... 阅读全文
posted @ 2014-12-12 22:49 cynorr 阅读(237) 评论(0) 推荐(0) 编辑

2014年12月11日

摘要: 五个输出文件:---* model-final.towords每个topic下面的words和words分布,并按分布排序:```1Topic 0th: bill 0.005843543826578699 lai 0.003958529688972668 seventh 0.002073515551... 阅读全文
posted @ 2014-12-11 21:13 cynorr 阅读(309) 评论(0) 推荐(0) 编辑

2014年12月10日

摘要: ##二项分布和Beta分布---###二项分布在概率论和统计学中,二项分布是n个独立的[是/非]试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。举两个例子就很容易理解二项分布的含义了:* 抛一次硬币出现正面的概率是0.5(p),抛10(n)次硬币,出现k次正面的概率。* 掷一次骰子出现六... 阅读全文
posted @ 2014-12-10 15:50 cynorr 阅读(4476) 评论(0) 推荐(0) 编辑

2014年12月7日

摘要: ##java做工程总结,以lda为例---声明:本篇博客只是对java做工程的总结,目的是加深java语言的学习和模块化编程的应用。以lda为例,并不涉及lda的理论部分。*LDA代码版本:http://jgibblda.sourceforge.net/*###数据的结构* 1.数据:建模就是把问题... 阅读全文
posted @ 2014-12-07 19:29 cynorr 阅读(552) 评论(0) 推荐(0) 编辑

2014年11月26日

摘要: ###items* lib: some file end by .jar* sources: *.java * executable file: *.class###run the executable fileIf the source files have been executed, jus... 阅读全文
posted @ 2014-11-26 21:12 cynorr 阅读(138) 评论(0) 推荐(0) 编辑

2014年11月17日

摘要: #工作记录保留---由于本周期中考试,所以试验暂停。为了下周能完美对接上本周的工作,在此做一个完整细致的工作记录。#Hiero##代码###eval-06中文件含义源端到目标端翻译,对目标端(target)各项打分,各项所占的比重称为权重。然后算总分。参考理论部分。刚开始各项权值均为1.0,各项权值... 阅读全文
posted @ 2014-11-17 20:17 cynorr 阅读(158) 评论(0) 推荐(0) 编辑

2014年11月12日

摘要: ##Why to split my screen to two workspaceMy desktop computer has a big 16:9 screen, and I'm finding it hard to fully utilize it during the 95% of the ... 阅读全文
posted @ 2014-11-12 21:16 cynorr 阅读(230) 评论(0) 推荐(0) 编辑

2014年11月9日

摘要: #EM---##Structloop : (precision condition)* **zero_inilialize_ss ( ss, model)** :set every item of *class_word* and * class_total* to 0* **e_step**:``... 阅读全文
posted @ 2014-11-09 21:28 cynorr 阅读(121) 评论(0) 推荐(0) 编辑

2014年11月7日

摘要: #The basic structure of lda-c---##corpus* **docs[]*** **num_terms** :The range or pages of words* **num_docs** :The amount of documents ... 阅读全文
posted @ 2014-11-07 22:46 cynorr 阅读(157) 评论(0) 推荐(0) 编辑

摘要: #makefile的高级应用---##事件王星学长要在翻译系统中加入肖欣岩写的神经网络系统。神经网络系统由C++写成,%.a标准库,makefile自动编译。翻译系统有C++和python写成,boost库,非自动编译,罗列了详细的逻辑关系。##矛盾翻译系统中的文件留出了空函数,作为丰富翻译系统的接... 阅读全文
posted @ 2014-11-07 22:39 cynorr 阅读(112) 评论(0) 推荐(0) 编辑