07 2017 档案
摘要:index.html style.css 邮箱登录、邮箱验证、密码填写,登录。 【转自】:http://www.imooc.com/code/2341 by慕课网教程
阅读全文
摘要:+ + +| data_length | index_length |+ + +| 15993798656 | 8825700352 |+ + +1 row in set (0.00 sec) + + +| data_length_MB | index_length_MB |+ + +| 15252
阅读全文
摘要:以上代码有些问题: 例如,爬取会循环,不再继续往下爬。 问题查找中。。。 未完待续。。。
阅读全文
摘要:JavaScript处理MongoDB,更新数据: 替换的源格式为: 程序执行完后: 待续。。。
阅读全文
摘要:我们使用的 shell 终端是 bash,它的默认键绑定方式是 emacs 模式。比如键入 Ctrl+a 光标会停在行首,Ctrl+e 光标会停在行尾等等。 如果希望在终端输入时使用 vi 的模式,比如键入 h,光标左移;键入 l,光标右移等等。方法如下: 打开终端输入: sudo cp /etc/
阅读全文
摘要:数据来源:Python爬取新浪微博评论数据,写入csv文件中 本文等同:筛选出一段文字中的中文
阅读全文
摘要:因为新浪微博网页版爬虫比较困难,故采取用手机网页端爬取的方式 操作步骤如下: 1. 网页版登陆新浪微博 2.打开m.weibo.cn 3.查找自己感兴趣的话题,获取对应的数据接口链接 4.获取cookies和headers 至于爬出来的数据有非中文的数据,要提取中文请参考:筛选出一段文字中的中文 未
阅读全文
摘要:偶然了解到 Python 里的 itchat 包,它已经完成了 wechat 的个人账号 API 接口,使爬取个人微信信息更加方便。 于是乎玩心一起,打算爬一下自己的微信。 步骤核心: 网页启动notebook pip安装itchat包 登录微信,扫描二维码 获取好友信息 有了上面的friends数
阅读全文
摘要:当需要对表进行ddl操作如加索引、增删列时,数据量小时直接在线修改表结构影响不大当表达到百万、千万数据就不能直接在线修改表结构下面是具体的过程:1、备份数据select * from ih_order into outfile '/bak/order.txt';mysql> select * fro
阅读全文
摘要:使用命令:JPS #jps 报错了 df -h发现某一个满的分区 清理一些无关数据,恢复正常 【转自】:http://blog.csdn.net/u012965373/article/details/51984806
阅读全文
摘要:修改kafka的partition分区 bin/kafka-topics.sh --zookeeper datacollect-2:2181 --alter --partitions 3 --topic client-agent-1 修改kafka副本数 官网解释如下: 准备json文件: 开始执行
阅读全文
摘要:Skill简介: 来源:好奇心、探索欲、趣味性; 资源:百度百科; 方式:实时获取,自动更新; 技能玩法: 想要进入历史上的今天这个skill,则对若琪说:若琪,打开历史上的今天。 想要了解某天的历史,则对若琪说:若琪,我想了解6月8号,若琪便会回复历史上6月8号的历史。 由于每天的历史相对较长,如
阅读全文
摘要:1. DEL 直接加键名称 DEL key1 key2 key3 127.0.0.1:6379> DEL site_msg_99973 false site_msg_99974 false site_msg_99979false 2. 批量删除key 可用keys ‘str*’ 列出要删除的key,
阅读全文
摘要:日志滚动,每分钟统计一次对应的数据。 待续
阅读全文
摘要:搞了无数次的filebeat-->logstash今天栽了跟头 filebeat在读取如下文件的时候,openchgw.log 软连接speechgw.log.20170703183729文件 如果filebeat中配置 则不会收取日志,必须配置如下成实体文件,才能够成功。 感觉ELK是不是应该修复
阅读全文
摘要:【转自】:http://dockone.io/article/783 待续
阅读全文
摘要:排查原因1: 1. 【不是】由于代码中checkpoint目录为本地导致,搭建了hdfs,将checkpoint移到hdfs,发现还是运行一天左右就挂掉,报错如上。 2. 待续 请大虾们指点。
阅读全文