摘要: 1. 导出并清洗qq聊天记录 将qq聊天记录从电脑版qq导出 去掉聊天中的图片表情以及时间戳 具体代码如下: 2. 准备其他素材 准备要生成图云的照片 准备生成词云的字体(没有的话,会造成中文字体不显示的问题) 3. 准备使用到的python库 numpy : 处理图片文件 jieba : 聊天记录 阅读全文
posted @ 2018-08-19 21:01 freyun 阅读(796) 评论(0) 推荐(0) 编辑
摘要: 0. 问题描述 抓取到的评论数据非常滴脏,其中有一些无用信息,所以目标就是只提取其中的中文文字内容 评论中会存在很多表情,如下所示 实际上展现出的内容则是: 不是很快就撤了吗? 这一种类型的表情是微博特有的表情,还有一种是Emoji 表情,前者会在评论内容嵌入html代码,后者则是会已编码的方式呈现 阅读全文
posted @ 2018-08-16 11:28 freyun 阅读(1352) 评论(0) 推荐(0) 编辑
摘要: 0.基本概念 AOP(Aspect oriented programming) In computing, aspect oriented programming (AOP) is a programming paradigm that aims to increase modularity by 阅读全文
posted @ 2018-08-09 13:51 freyun 阅读(4924) 评论(0) 推荐(0) 编辑
摘要: 0.项目打包 利用maven中lifecycle的package功能进行打包 生成的jar在target目录下 1.上传项目 将 文件/文件夹 从本地拷至远程 Ubuntu 机(scp) (1)在本地的终端下,而不是在服务器上。在本地的终端上才能将本地的文件拷入服务器。 (2) scp r 从本地要 阅读全文
posted @ 2018-08-09 13:50 freyun 阅读(631) 评论(0) 推荐(0) 编辑
摘要: 0.使用场景 搭建个人博客时存储博客内容 在线商城系统中对商品的描述 1.如何创建 需要用到的注解 1. @Lob @Lob标注表示将属性映射成数据库支持的大对象类型,Clob或者Blog。其中: Clob(Character Large Ojects)类型是长字符串类型,java.sql.Clob 阅读全文
posted @ 2018-08-09 13:47 freyun 阅读(5504) 评论(0) 推荐(0) 编辑
摘要: 0.java web端 1.微信小程序端 wxml js 阅读全文
posted @ 2018-08-09 13:46 freyun 阅读(1721) 评论(0) 推荐(0) 编辑
摘要: 0. 错误状态 1. 问题分析 本机已经使用了80端口,与nginx默认端口冲突 2. 解决方法 修改nginx配置文件 打开 /etc/nginx/sites available 的 default文件 修改default文件 将其中的80换成不冲突的端口 重启nginx服务 阅读全文
posted @ 2018-08-09 13:45 freyun 阅读(447) 评论(0) 推荐(0) 编辑
摘要: 1. 修改settings.py,启用item pipelines组件 将 改为 当然,我们不能只改而不去研究其中的意义. 根据官方注释我们顺利找到了官方文档对此的解释说明: 为了启用一个Item Pipeline组件,你必须将它的类添加到 " " 配置,就像下面这个例子: 分配给每个类的整型值,确 阅读全文
posted @ 2018-08-09 13:43 freyun 阅读(2255) 评论(0) 推荐(0) 编辑
摘要: 0.问题描述 需要定时爬取一个页面,从中取得不同时间段的数据 1.解决方案 使用CrawlerRunner通过链接延迟顺序运行爬虫 代码如下: 其中inlineCallbacks 是一个修饰符,它总是修饰生成器函数,如那些使用 yield 语句的函数. inlineCallbacks 的全部目的是将 阅读全文
posted @ 2018-08-09 13:42 freyun 阅读(389) 评论(0) 推荐(0) 编辑
摘要: 1. 打开 /etc/nginx/sites available 的 default文件 2. 修改default文件添加要匹配的url路径 格式: laction Syntax: location [ = | ~ | ~ | ^~ ] uri { ... } location @name { .. 阅读全文
posted @ 2018-06-11 19:41 freyun 阅读(276) 评论(0) 推荐(0) 编辑