03 2020 档案

摘要:本周是开学第六周。这周作业很少,基本都是实验。 所花时间(包括上课) 十五个小时左右 代码量(行) 400行左右 博客量(篇) 0篇 了解到的知识点 安装了tensorflow库,解决了示例脚本不能运行的问题。我安的tensorflow是2点多版本的,示例程序还停留在1点多版本,两个版本的函数不一样 阅读全文
posted @ 2020-03-29 07:43 星辰° 阅读(130) 评论(0) 推荐(0) 编辑
摘要:本周是开学第五周。这周任务不算重,但是比较难。 所花时间(包括上课) 二十四个小时左右 代码量(行) 600行左右 博客量(篇) 1篇 了解到的知识点 学习了TF-IDF算法,知道了计算中文关键词权重的方法。这次学习完TF-IDF算法后,重写了上周文本分类的脚本,根据现有行业分类的关键词和未知行业的 阅读全文
posted @ 2020-03-22 17:39 星辰° 阅读(119) 评论(0) 推荐(0) 编辑
摘要:大型网站核心架构 关于什么是架构,一种比较通俗的说法是:“最高层次的规划,难以改变的决定”,这种规划和决定奠定了事物未来发展的方向和最终的蓝图。 具体到软件架构,维基百科这样定义:“有关软件整体结构与组件的抽象描述,用于指导大型软件系统各个方面的设计”。 一般说来,除了当前的系统功能需求外,软件架构 阅读全文
posted @ 2020-03-20 16:09 星辰° 阅读(92) 评论(0) 推荐(0) 编辑
摘要:本周是开学第四周,也是在家学习的第四周。这周比较繁忙,周日补了三门课:python、JavaEE、移动应用开发,还有老师布置的一个比较难的实验。 所花时间(包括上课) 二十个小时 代码量(行) 1500行左右 博客量(篇) 4篇 了解到的知识点 学习了python的一些基础知识点,之前做实验使用py 阅读全文
posted @ 2020-03-15 17:33 星辰° 阅读(191) 评论(0) 推荐(0) 编辑
摘要:今天完成了根据项目名称和关键词进行行业分类的任务,还进行了数据可视化的展示。 今天为了完成行业分类一直在搜文本分类、机器学习、文本聚类这些,后来发现实在是读不懂,也许是因为我急着完成任务没能静下心来理解的原因。我用了最简单也最不靠谱的方法——文本相似度,我把行业名称与代码存进了python的列表里, 阅读全文
posted @ 2020-03-15 12:41 星辰° 阅读(137) 评论(0) 推荐(0) 编辑
摘要:今天使用python的jieba库完成了提取关键词的任务,并且完善了查找地域的算法,除此之外,还完成了数据可视化的第一步,根据省市县展示项目数量。 昨天查找地域的算法中模拟百度地图搜索请求,传递的参数本来有十几个,后来我为了省事一个个尝试精简,简化到只需要两个参数:qt和wd。前者表示调用查询接口, 阅读全文
posted @ 2020-03-14 21:52 星辰° 阅读(140) 评论(0) 推荐(0) 编辑
摘要:今天在昨天的基础上进一步规范了地域列的取值,以及使用高德地图的api将昨天模拟百度地图搜索请求未找到的500多条数据重新进行查询。除此之外,还看了一些关于python提取关键字的博客。 昨天虽然找到了3500多条数据的地域和行政区划代码,但是由于未考虑到完成单位在其他省份的情况,导致某些地域值只有X 阅读全文
posted @ 2020-03-13 21:41 星辰° 阅读(229) 评论(0) 推荐(0) 编辑
摘要:今天的实验是在上次清洗数据的基础上进行数据分析。根据单位的名称判断所在省市县,需要使用百度地图或者高德地图的接口。 我是使用python模拟百度地图搜索请求来判断所在位置的,但是卡在模拟请求这一步很长时间,每次response返回的都是html页面,并不是真正的json数据。后来才发现是因为网址写的 阅读全文
posted @ 2020-03-12 20:02 星辰° 阅读(118) 评论(0) 推荐(0) 编辑
摘要:今天读了《大型网站技术架构:核心原理与案例分析》的第一篇第一章和第二章,第一章主要讲的是大型网站架构的演化,第二章主要讲了大型网站的架构模式。感觉这本书有点偏理论性。 1 大型网站架构演化 1.1 大型网站特点 高并发 高可用 海量数据 用户分布广泛,网络情况复杂 安全环境恶劣 需求快速变更,发布频 阅读全文
posted @ 2020-03-08 10:27 星辰° 阅读(80) 评论(0) 推荐(0) 编辑
摘要:本周是第三周,本来以为这一周返校,结果又延长了。仔细想想也很正常,毕竟大学学生来自全国各地,不等疫情真正结束,学校肯定不会让我们返校。 所花时间(包括上课) 二十个小时 代码量(行) 500行左右 博客量(篇) 无 了解到的知识点 在德拓公开课上学习了大数据的相关技术,比如大数据同步技术DataX, 阅读全文
posted @ 2020-03-07 17:23 星辰° 阅读(107) 评论(0) 推荐(0) 编辑
摘要:这一周是在家里学习的第二周,感觉在家学习没有在学校学习效率高。本周看了《软件架构实践_第二版》的部分内容,详细了解了系统的六个质量属性。 所花时间(包括上课) 二十个小时 代码量(行) 1000行左右 博客量(篇) 1篇 了解到的知识点 系统的六个质量属性 阅读全文
posted @ 2020-03-01 18:58 星辰° 阅读(160) 评论(0) 推荐(0) 编辑
摘要:安全性战术有三个方面:抵抗攻击、检测攻击和从攻击中恢复。 抵抗攻击 对用户进行身份验证、对用户进行授权这两个方面暂时未涉及到。 维护数据的机密性是保证用户接收到的数据和发送方发送的数据一致。目前还不知道怎么重构信息化领域热词分析系统来实现这方面的要求。 维护完整性这一方面没怎么搞明白书上到底什么意思 阅读全文
posted @ 2020-03-01 17:45 星辰° 阅读(193) 评论(0) 推荐(0) 编辑