摘要:
F12启动调试 1.右键加载按钮可以清空缓存并重新加载,有时候浏览器有缓存,代码更新不会及时反映出来。 2.performance mointer实时查看performance 点击三个竖着的小点,选择more tools->performance mointer performance monit 阅读全文
摘要:
Git撤销&回滚操作(git reset 和 get revert) 工作区:即自己当前分支所修改的代码,git add xx 之前的!不包括 git add xx 和 git commit xxx 之后的。 暂存区:已经 git add xxx 进去,且未 git commit xxx 的。 本地 阅读全文
摘要:
在写pom的时候,我们写的一个依赖往往会依赖于其他的包,而这些包可能是过时的不安全的,因此需要排除并重新引用安全的版本,先在依赖这个项目的pom中去除想排除的依赖,再添加指定版本的依赖。 pom的依赖关系可以在idea查看,打开pom.xml。右键点击Diagram,即可显示完整的依赖关系图,包括p 阅读全文
摘要:
本文大多内容来自Joshua Taylor的回答 https://stackoverflow.com/users/1281433/joshua-taylor 查询子类或等价关系 https://stackoverflow.com/questions/21092246/sparql-query-sub 阅读全文
摘要:
1.对于要处理的文件集合会根据设定大小将文件分块,每个文件分成多块,不是把所有文件合并再根据大小分块,每个文件的最后一块都可能比设定的大小要小 块大小128m a.txt 120m 1个块 b.txt 500m 4个块 reducetask的并行度 1.reducetask并行度就是将原来的一个大任 阅读全文
摘要:
1、将hdfs客户端开发所需的jar导入工程(jar包可在hadoop安装包中找到common/hdfs) 2、写代码 要对hdfs中的文件进行操作,代码中首先需要获得一个hdfs的客户端对象 Configuration conf = new Configuration(); FileSystem 阅读全文
摘要:
hdfs的工作机制: 1、客户把一个文件存入hdfs,其实hdfs会把这个文件切块后,分散存储在N台linux机器系统中(负责存储文件块的角色:data node)<准确来说:切块的行为是由客户端决定的> 2、一旦文件被切块存储,那么,hdfs中就必须有一个机制,来记录用户的每一个文件的切块信息,及 阅读全文
摘要:
在不能上网的服务器上把nltk_data关联到python3,已经安装anaconda3所以不需要安装nltk,环境是linux 首先没有nltk_data在使用nltk会报错 1.下载nltk_data https://github.com/nltk/nltk_data 里面的Packages就是 阅读全文
摘要:
今天在读取一个超大csv文件的时候,遇到困难:首先使用office打不开然后在python中使用基本的pandas.read_csv打开文件时:MemoryError 最后查阅read_csv文档发现可以分块读取。 read_csv中有个参数chunksize,通过指定一个chunksize分块大小 阅读全文
摘要:
在函数中修改: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame.Try using .loc[row_indexer,col_indexer] = value inst 阅读全文