摘要: 直接上代码吧,word2vec 各种参数详解: https://www.cnblogs.com/pinard/p/7278324.html 模型的一些其他使用: https://blog.csdn.net/qq_19707521/article/details/79169826 自己在使用中: 需要 阅读全文
posted @ 2019-07-01 17:40 不著人间风雨门 阅读(747) 评论(0) 推荐(0) 编辑
摘要: 1、ctrl+shift+a:有时候在做nlp任务嘛…一个文本中有100多w条数据,想要选中一批连续的数据的时候,键盘上同时按住ctrl+shift+a,然后鼠标点击一下开始的地方,再拉到结束的地方点击一下,这个区间就被选出来了,win10的文件系统也可以用这种方式选择多个连续的文件。 2、按行打乱 阅读全文
posted @ 2019-07-01 14:47 不著人间风雨门 阅读(213) 评论(0) 推荐(0) 编辑
摘要: 有些算法题是这样要求的,一行输入一行数据,然后没有规定我要输入多少行,你要自行判断文件结束EOF,否则是会runtime error的,因为oj内部都是用文件来进行读写的。 例如a+b,每一行输入a b,计算a+b的结果。 一般这种嘛,c/c++很简单了,就是scanf判断一下!=EOF就完事了,但 阅读全文
posted @ 2019-07-01 14:42 不著人间风雨门 阅读(10642) 评论(0) 推荐(1) 编辑
摘要: netstat -tnl 查看网络相关的端口情况 ps -A 查看所有进程的情况 cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l 查看物理CPU个数 cat /proc/cpuinfo| grep "cpu cores"| uniq 阅读全文
posted @ 2019-07-01 14:41 不著人间风雨门 阅读(181) 评论(0) 推荐(0) 编辑
摘要: 在机器学习多分类任务中有时候需要针对类别进行分层采样,比如说类别不均衡的数据,这时候随机采样会造成训练集、验证集、测试集中不同类别的数据比例不一样,这是会在一定程度上影响分类器的性能的,这时候就需要进行分层采样保证训练集、验证集、测试集中每一个类别的数据比例差不多持平。 下面python代码。 # 阅读全文
posted @ 2019-07-01 14:40 不著人间风雨门 阅读(2818) 评论(0) 推荐(0) 编辑
摘要: 网上乱七八糟有的都是别人怎么写自己也怎么写,其实很简单。 首先是anaconda3的安装: 直接上官网:https://www.anaconda.com/download/ 下载下来之后进入文件所在目录,复制一下那个文件的名字,然后: bash xxxxxxxxxxx.sh 文件名字一定不能打错了! 阅读全文
posted @ 2019-07-01 14:16 不著人间风雨门 阅读(932) 评论(0) 推荐(0) 编辑
摘要: 有时候呢我们有一台本地的台式机或者云服务器,我们想要搭个ftp服务器好让我们在内网/外网中方便的传输、保存文件,这样别的任何电脑啊,设备啊,只要访问这个ftp的地址,就可以进行文件传输啦!由于我现在台式机子是实验室里的,网络是学院的网划分的虚拟子网,对外公网ip只有一个,所有实验室内连接不同网线的电 阅读全文
posted @ 2019-07-01 14:15 不著人间风雨门 阅读(2702) 评论(0) 推荐(0) 编辑