08 2018 档案
更新数据
摘要:POST zeppelin/examples/AV6nU7M9HTZ4wJwaOOJj/_update { "name": "新闻主题分布", "url": "notebook/2CTNKD25S" } PUT test/type1/1{ "counter" : 1, "tags" : ["red" 阅读全文
posted @ 2018-08-21 11:07 笨拙的忍者 阅读(139) 评论(0) 推荐(0)
删除数据
摘要:根据id删除某条记录 DELETE database/table/AV63VMPCDFvmw9AORKyi 删除数据库 DELETE database 清空数据表 DELETE database/table/_query { "query": { "match_all": {} } } 根据条件删除 阅读全文
posted @ 2018-08-21 11:03 笨拙的忍者 阅读(128) 评论(0) 推荐(0)
zeppelin开启多个
摘要:conf/zeppelin-env.sh 添加行: 阅读全文
posted @ 2018-08-20 17:04 笨拙的忍者 阅读(125) 评论(0) 推荐(0)
处理搜狐新闻语料
摘要:数据集来源:http://www.sogou.com/labs/resource/cs.php 目的:得到title集合文本,content集合文本 代码: 解码编码上花了点时间:原本用chardet.detect可以得到文本编码是gb2312,但是decode的时候会报错: UnicodeDeco 阅读全文
posted @ 2018-08-17 12:21 笨拙的忍者 阅读(237) 评论(0) 推荐(0)
学习项目
摘要:1.百度图像识别 文章链接 初赛数据集——链接:https://pan.baidu.com/s/1cT4cjK3Qc3C6Fc_t2uAGEA 密码:ftzk 初赛和决赛代码 2.多标签文本分类 6th博客,1th知乎 阅读全文
posted @ 2018-08-10 17:54 笨拙的忍者 阅读(115) 评论(0) 推荐(0)
学习书籍
摘要:1.tensorflow机器学习实战指南 2017.9 曾益强译 源码:地址1,地址2 2.python神经网络编程 2018.4 林赐译 讲的很通俗易懂,围绕主干流程讲述神经网络的计算过程和需要某些参数的理由,然后以MNIST数字识别为例子,简单代码实现(代码是自己写的,不是调别人的库,印象会比较 阅读全文
posted @ 2018-08-10 17:54 笨拙的忍者 阅读(126) 评论(0) 推荐(0)