上一页 1 2 3 4 5 6 7 ··· 21 下一页
摘要: file_names = fnmatch.filter(os.listdir(folder), '*.jpeg') # take care of folder sequence, 1.jpeg, 2.jpeg, 3.jpeg coll.sort(key=lambda x:int(x[:-5])) o 阅读全文
posted @ 2019-06-18 16:13 andy_0212 阅读(378) 评论(0) 推荐(0) 编辑
摘要: 最近在研究sample之间的similarity,以便更好地进行clustering,一下是相关资料 TF-IDF与余弦相似性的应用(一):自动提取关键词 TF-IDF与余弦相似性的应用(二):找出相似文章 相似度(距离计算)汇总 常用的相似度计算方法原理及实现 机器学习中的相似性度量 大量短文本聚 阅读全文
posted @ 2019-06-11 10:38 andy_0212 阅读(793) 评论(0) 推荐(0) 编辑
摘要: What is the fastest way to upload a big csv file in notebook to work with python pandas? 阅读全文
posted @ 2019-06-05 15:38 andy_0212 阅读(521) 评论(0) 推荐(0) 编辑
摘要: du -sh file_path Explanation du (disc usage) command estimates file_path space usage The options -sh are (from man du): -s, --summarize display only a 阅读全文
posted @ 2019-05-10 09:03 andy_0212 阅读(110) 评论(0) 推荐(0) 编辑
摘要: 三种常用的方式如果在运行python脚本时需要传入一些参数,例如gpus与batch_size,可以使用如下三种方式。 python script.py 0,1,2 10python script.py -gpus=0,1,2 --batch-size=10python script.py -gpu 阅读全文
posted @ 2019-05-08 17:04 andy_0212 阅读(993) 评论(0) 推荐(0) 编辑
摘要: 那么,如果在~/.bashrc中修改文件的话,即加入export PATH="/home/myname/anaconda2/bin:$PATH",则输入python命令就会直接出来Anaconda环境下的python,当然,用TensorFlow是好的,用caffe就。。。。。。。因此,用caffe 阅读全文
posted @ 2019-05-08 15:55 andy_0212 阅读(3197) 评论(0) 推荐(0) 编辑
摘要: 对于linux运维,我们都是使用ssh登录到服务器,如果我们运行的任务需要很长时间或不间断运行,在我们直接关闭终端窗口或网络不稳定的情况下,任务就会中断,当然这只对于普通程序,不包括如mysqld,httpd这样的守护进程。 解决思路:1.让进程运行在新的session(会话)里即不属于此终端的子进 阅读全文
posted @ 2019-05-08 15:50 andy_0212 阅读(2126) 评论(0) 推荐(0) 编辑
摘要: 线段树在一些acm题目中经常见到,这种数据结构主要应用在计算几何和地理信息系统中。下图就为一个线段树: (PS:可能你见过线段树的不同表示方式,但是都大同小异,根据自己的需要来建就行。) 1.线段树基本性质和操作 线段树是一棵二叉树,记为T(a, b),参数a,b表示区间[a,b],其中b-a称为区 阅读全文
posted @ 2019-04-13 09:41 andy_0212 阅读(255) 评论(0) 推荐(0) 编辑
摘要: 什么是外排序? 外排序(External sorting)是指能够处理极大量数据的排序算法。通常来说,外排序处理的数据不能一次装入内存。(摘自百度) 再简单点来说。比如我们要对10亿个数进行排序。如果用int[]来存储这10亿个数的话,我们需要3*1000000000/8/1024/1024/102 阅读全文
posted @ 2019-04-10 09:38 andy_0212 阅读(1118) 评论(0) 推荐(0) 编辑
摘要: 学习方面的问题 Q1:计算机专业本科生,非ACMER。算法达到什么程度才算是合格,有什么量化手段吗? Answer:传统算法和数据结构功底扎实。比如LintCode上的题目简单和中等难度毫无压力做出,Hard难度在给了一定时间和一定提示时可以独立完成。 微积分,统计学,离散数学 Q2:成为数据挖掘工 阅读全文
posted @ 2019-04-09 15:41 andy_0212 阅读(204) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 21 下一页