随笔档案「2018年3月」 - 154彭佛生

中文词频统计

摘要：下载一长篇中文文章。从文件读取待分析文本。 news = open('gzccnews.txt','r',encoding = 'utf-8') 安装与使用jieba进行中文分词。 pip install jieba import jieba list(jieba.lcut(news)) 生成词频阅读全文

posted @ 2018-03-28 14:08 154彭佛生阅读(190) 评论(0) 推荐(0)

英语词频统计

摘要：代码：阅读全文

posted @ 2018-03-23 10:59 154彭佛生阅读(216) 评论(0) 推荐(0)

字符串练习

摘要：字符串练习： http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html 取得校园新闻的编号 https://docs.python.org/3/library/turtle.html 产生python文档的网址 http://news.g 阅读全文

posted @ 2018-03-21 08:39 154彭佛生阅读(103) 评论(0) 推荐(0)

大数据概述

摘要：1.大数据对思维方式的影响第一个思维变化：不是随机样本，而是全体数据。大数据较之以往的统计样本就是全数据，大数据有几个特征：规模大、种类繁多、处理速度高。第二个思维变化：不是精确性，而是混杂性。大数据的简单算法是一种统计学的逻辑，只有真正理解了大数据基于统计学的思维方式，才能理解它的独特优势和局阅读全文

posted @ 2018-03-07 15:37 154彭佛生阅读(336) 评论(0) 推荐(0)

VersonPENG

导航

公告

03 2018 档案

中文词频统计

英语词频统计

字符串练习

大数据概述