• 博客园logo
  • 会员
  • 周边
  • 新闻
  • 博问
  • 闪存
  • 众包
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






邓发强

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

03 2018 档案

 
网络爬虫基础练习
摘要:练习: 这是练习的HTML文件:net.html 取出h1标签的文本 取出a标签的链接取出所有li标签的所有内容取出第2个li标签的a标签的第3个div标签的属性 取出一条新闻的标题、链接、发布时间、来源 问题:每次requests获取新建的HTML文件时,都要重新用浏览器打开net.html来更新 阅读全文
posted @ 2018-03-29 20:28 141_邓发强 阅读(162) 评论(0) 推荐(0)
中文词频统计
摘要:下载一长篇中文文章。从文件读取待分析文本。news = open('gzccnews.txt','r',encoding = 'utf-8')安装与使用jieba进行中文分词。pip install jiebaimport jiebalist(jieba.lcut(news))生成词频统计排序排除语 阅读全文
posted @ 2018-03-28 21:55 141_邓发强 阅读(103) 评论(0) 推荐(0)
综合练习:英文词频统计
摘要:# -*- coding:UTF-8 -*-# -*- author:deng -*-news = '''The only problem unconsciously assumed by all Chinese philosophers to be ofany importance is:How 阅读全文
posted @ 2018-03-27 01:00 141_邓发强 阅读(91) 评论(0) 推荐(0)
字符串、组合练习
摘要:1.字符串练习: http://news.gzcc.cn/html/2017/xiaoyuanxinwen_1027/8443.html 取得校园新闻的编号 https://docs.python.org/3/library/turtle.html 产生python文档的网址 http://news 阅读全文
posted @ 2018-03-21 20:27 141_邓发强 阅读(244) 评论(0) 推荐(0)
national flag
摘要:# -*- coding:UTF-8 -*- # -*- author:deng -*- import turtle import math window = turtle.Screen() def draw_polygon(aTurtle, size=50, n=3): # 绘制正多边形 for i in xrange(n): aTurtle.forward(... 阅读全文
posted @ 2018-03-15 21:52 141_邓发强 阅读(156) 评论(0) 推荐(0)
常用的Linux操作
摘要:熟悉常用的Linux操作 cd命令:切换目录 (1) 切换到目录 /usr/local cd/usr/local (2) 去到目前的上层目录 cd.. (3) 回到自己的主文件夹 cd ls命令:查看文件与目录 (4) 查看目录/usr下所有的文件 ls/usr mkdir命令:新建新目录 (5) 阅读全文
posted @ 2018-03-14 12:01 141_邓发强 阅读(145) 评论(0) 推荐(0)
大数据概述
摘要:1.试述大数据对思维方式的重要影响。 随着自然科学的快速发展和高新技术的广泛应用,人们的生活方式和思维方式都受到比较大的冲击。大数据技术的普及,对人类生活中的各个领域都产生着极大的影响。思维方式是一定时代人们的理性认识方式,是按一定结构、方法和程序把思维诸要素结合起来的相对稳定的思维运行样式。人类历 阅读全文
posted @ 2018-03-07 16:14 141_邓发强 阅读(171) 评论(0) 推荐(0)