VersonPENG

导航

03 2018 档案

中文词频统计
摘要:下载一长篇中文文章。 从文件读取待分析文本。 news = open('gzccnews.txt','r',encoding = 'utf-8') 安装与使用jieba进行中文分词。 pip install jieba import jieba list(jieba.lcut(news)) 生成词频 阅读全文

posted @ 2018-03-28 14:08 154彭佛生 阅读(190) 评论(0) 推荐(0)

英语词频统计
摘要:代码: 阅读全文

posted @ 2018-03-23 10:59 154彭佛生 阅读(216) 评论(0) 推荐(0)

字符串练习
摘要:字符串练习: http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html 取得校园新闻的编号 https://docs.python.org/3/library/turtle.html 产生python文档的网址 http://news.g 阅读全文

posted @ 2018-03-21 08:39 154彭佛生 阅读(103) 评论(0) 推荐(0)

大数据概述
摘要:1.大数据对思维方式的影响 第一个思维变化:不是随机样本,而是全体数据。大数据较之以往的统计样本就是全数据,大数据有几个特征:规模大、种类繁多、处理速度高。 第二个思维变化:不是精确性,而是混杂性。大数据的简单算法是一种统计学的逻辑,只有真正理解了大数据基于统计学的思维方式,才能理解它的独特优势和局 阅读全文

posted @ 2018-03-07 15:37 154彭佛生 阅读(336) 评论(0) 推荐(0)