生活依旧 - 博客园

2020年3月1日

摘要：对于使用kettle把csv文件导入数据库出现中文乱码问题，首先排查数据库属性中的字符集是否为utf8，其次数据库自断的字符集是否utf8，如果都没问题，那么问题就是出在kettle上，首先是kettle连接数据库的db连接处要添加一个属性，添加characterEncoding属性，值为UTF-8 阅读全文

posted @ 2020-03-01 11:54 生活依旧阅读(1279) 评论(0) 推荐(0) 编辑

2020年2月23日

2020年春第一周学习进度

摘要：本周主要新学习了一个可视化的应用，地图下钻功能的可视化，更加熟悉了json数组的使用，以及python使用xpath和正则爬取数据的一些问题。阅读全文

posted @ 2020-02-23 19:27 生活依旧阅读(82) 评论(0) 推荐(0) 编辑

以学习通为例质量属性的六个常见属性场景

摘要： 1.可用性场景设想：全体高校老师布置网课，所有高校学生同时登录平台观看课程，导致超星学习通系统崩溃刺激源：用户刺激：很多用户同时进行登录、签到、观看课程、答题操作环境：用户正常操作制品：系统服务器响应：系统响应人数过多，系统检测到事件，记录故障，通知系统响应度量：一定时间后，排除故障、阅读全文

posted @ 2020-02-23 18:21 生活依旧阅读(497) 评论(0) 推荐(0) 编辑

2020年2月21日

2020年新冠状病毒可视化实战

摘要：一，爬取数据：爬取网站：https://ncov.dxy.cn/ncovh5/view/pneumonia?mibrowser_back=0&share=0&source=xiaomi03 爬取代码（含省级市级数据） import requests import re import time fr 阅读全文

posted @ 2020-02-21 08:08 生活依旧阅读(534) 评论(0) 推荐(0) 编辑

2020年2月19日

架构漫谈--读后感

摘要：下面对漫谈架构的每一章进行一个总结一）第一篇：讲的是到底什么是架构，在我看来：就是把一整体划分为不同角色，各自完成自己的部分，最后有机的融合在一起。然后通过一个早期的例子来笼统地概括他的出现。在最早期，每个人都完全独立生活，衣、食、住、行等等全部都自己搞定，整个人类都是独立的个体，不相往来。为了阅读全文

posted @ 2020-02-19 17:51 生活依旧阅读(113) 评论(0) 推荐(0) 编辑

2020年2月15日

2020年寒假学习进度第十五天

摘要： python使用正则抓取数据今天主要学习了python使用正则抓取网页数据。首先这是正则的几个步骤： 1、用import re 导入正则表达式模块； 2、用re.compile()函数创建一个Regex对象； 3、用Regex对象的search()或findall()方法，传入想要查找的字符串，阅读全文

posted @ 2020-02-15 17:53 生活依旧阅读(175) 评论(0) 推荐(0) 编辑

2020年2月14日

2020年寒假学习进度第十四天

摘要：今天主要学习了python爬虫抓取网页文本，首先用到的是一个xpath的方法，当然他需要python库的支持，需要导入下图这三个库： from lxml import etreeimport reimport requests同时记录一下踩到的坑：一:re.sub(r'\u3000','',text 阅读全文

posted @ 2020-02-14 17:24 生活依旧阅读(140) 评论(0) 推荐(0) 编辑

2020年2月13日

2020年寒假学习进度第十三天

摘要：河北省疫情数据爬取今天主要完成了河北省疫情数据的爬取，从2月8号开始爬取（附python详细代码） from lxml import etree import re import requests #导入requests包 import SQL as SQL #url = 'http://www. 阅读全文

posted @ 2020-02-13 16:52 生活依旧阅读(108) 评论(0) 推荐(0) 编辑

2020年2月12日

2020年寒假学习进度第十二天

摘要： window10中eclipse连接Linux中的spark环境昨天成功实现在windows中的eclipse调用linux中的hadoop环境，今天解决调用spark环境问题一：将spark的安装包在Windows环境中解压，比如我的解压目录就是D:\hadoop\spark-2.1.0-b 阅读全文

posted @ 2020-02-12 19:00 生活依旧阅读(153) 评论(0) 推荐(0) 编辑

2020年2月11日

2020年寒假学习进度第十一天

摘要：如何在windows中使用eclipse访问虚拟机linux中的hadoop环境由于虚拟机配置不高，使用eclipse比较吃力，所以决定在外部eclipse调用Hadoop环境，具体做法参考博客园 https://www.cnblogs.com/lzq666/p/9955718.html 调用过程阅读全文

posted @ 2020-02-11 19:17 生活依旧阅读(128) 评论(0) 推荐(0) 编辑

公告