摘要:
找对工具真的很重要,周末和学霸折腾了一天才装了几个包,问了同事找了一个方便的包,装起来不要太快啊。二十分钟全部搞定。 一、Anaconda 真是大杀器,牛到飞起来,一键部署,所有常用的机器学习包全部包括了,安装也很方便。下载地址:https://www.continuum.io/downloads 阅读全文
摘要:
省掉废话,一个快速提示符真的能快速地提高编程效率。 下面介绍如何设置eclipse的快速提示符。 步骤如下: Windows --> preferences --> java --> Editor --> Content Assist 然后选择其中的Auto activation triggers 阅读全文
摘要:
一、压缩解压命令 Linux最基本的就算是对文件的压缩和解压操作了吧,现简单整理下常用命令: 1.tar命令(涉及后缀.tar .tar.gz .tgz) 压缩单文件夹:tar czvf FileName.tar DirName 压缩多文件夹:tar zcvf FileName.tar.gz Dir 阅读全文
摘要:
一、word2vec调参 ./word2vec -train resultbig.txt -output vectors.bin -cbow 0 -size 200 -window 5 -negative 0 -hs 1 -sample 1e-3 -threads 12 -binary 1 一般来说 阅读全文
摘要:
常用算法 一、HMM及CRF相关 1.区别总概:https://www.zhihu.com/question/35866596 2.【论文】https://www.zhihu.com/question/20078729 二、特征工程 1.总概的一篇文章:http://weibo.com/p/1001 阅读全文
摘要:
由于python的灵活性,赋值前无需强调变量的数据类型,并且变量的数据类型在后期的操作过程中还可以改变,故不介绍关键字,直接定义方法及可以调用的方法。 I 基本数据类型 一、字符串 1.使用单引号或者双引号表示,两者没有明显的区别。 2.使用三引号(''')表示,中间的字符串可以换行。 二、布尔类型 阅读全文
摘要:
文本分类算是自然语言处理领域最最常见的问题了,开源的工具也很好用,但是苦于训练速度缓慢,需要引进多核的版本,开源提供的多核支持参数有限,而同事提供的又有语言障碍,觉得自己探索下多分类器。 分类算法有很多,但是效果较好的基本就是LR和SVM,而这两个算法业内著名的开源代码应该就是liblinea... 阅读全文
摘要:
经常会有文件过大,给文件的传输和增添了很多的麻烦,早先得知apach有个base64貌似可以用来压缩文件,但是测试没有什么效果,反而增大了文件的大小。今天了解了java自带的gzip包,如获至宝,超级好用又方便,记录下。一、文件压缩 public static void compress(Str... 阅读全文
摘要:
待补充……AP算法,即Affinity propagation,是Brendan J. Frey* 和Delbert Dueck于2007年在science上提出的一种算法(文章链接,维基百科)现在只是初步研究了一下官网上提供的MATLAB源码:apcluster.m%APCLUSTER Affin... 阅读全文
摘要:
近期由于一些莫名其妙的原因开始学c++,我觉得我哪天要是挂了也是被自己给折腾死的,算了,反正不是折腾死就是被淘汰,当是没事打发时间了,废话不多说,开始今天的主题。 之前接触的注释就是注释,条件语句就是条件语句,前两天突然遇见一个很高级的术语叫做条件编译,把我理解的前因后果详细地说说清楚吧。一、... 阅读全文