上一页 1 2 3 4 5 6 7 ··· 12 下一页
  2022年3月25日
摘要: Ajax https://edu.aliyun.com/course/1747 局部 异步 刷新。Asynchronous Javascript And XML(异步JavaScript和XML),是一种在无需重新加载整个网页的情况下,能够更新部分网页的技术。 传统的网页(不使用Ajax)如果需要更 阅读全文
posted @ 2022-03-25 15:45 cookie的笔记簿 阅读(24) 评论(0) 推荐(0) 编辑
摘要: from wordcloud import WordCloud import matplotlib.pyplot as pit myfile = open("*.txt", encoding='utf-8') mytext = myfile.read() mycloud = WordCloud(). 阅读全文
posted @ 2022-03-25 14:09 cookie的笔记簿 阅读(126) 评论(0) 推荐(0) 编辑
  2022年3月23日
摘要: Python自然语言处理 标注、分类、信息提取 句子、识别句法结构和构建表示句意的方法 nltk库 简单的统计 计数 词类型 频率分布 文本中每一个词项的概率,查找高频词 使用本地编码 # -*- coding: utf-8 -*- 分词 分类和标注词汇 标注语料库 名词 动词 形容词和副词 从文本 阅读全文
posted @ 2022-03-23 15:12 cookie的笔记簿 阅读(73) 评论(0) 推荐(0) 编辑
  2022年3月22日
摘要: 合并一个文件夹下面的excel文件,适用于只有1个sheet的情况 遍历一个文件夹下的所有excel的文件名称 新建一个df格式的文件,带columns 采用append进行逐个添加 存储为excel格式 import xlrd import xlsxwriter import os import 阅读全文
posted @ 2022-03-22 14:55 cookie的笔记簿 阅读(347) 评论(0) 推荐(0) 编辑
摘要: import xlrd import numpy as np import matplotlib.pyplot as plt import pandas as pd ''' # 设定行名称,第11行为字段名称 data = pd.read_excel("D:/01研/研二/20220115/不同学科 阅读全文
posted @ 2022-03-22 13:21 cookie的笔记簿 阅读(84) 评论(0) 推荐(0) 编辑
  2022年3月20日
摘要: 正则表达式 https://www.runoob.com/python/python-reg-expressions.html import re line = "Cats are smarter than dogs" pattern = r'(.*) than (.*)' re.match函数 r 阅读全文
posted @ 2022-03-20 14:31 cookie的笔记簿 阅读(17) 评论(0) 推荐(0) 编辑
  2022年3月19日
摘要: beautifulsoup4 https://beautifulsoup.cn/#id28 功能:从HTML或者XML文件中提取数据,将一段文档传入BeautifulSoup 的构造方法,就能得到一个文档的对象, 可以传入一段字符串或一个文件句柄。 文档会被转换编码; soup选择最适合的解析器来解 阅读全文
posted @ 2022-03-19 11:12 cookie的笔记簿 阅读(34) 评论(0) 推荐(0) 编辑
摘要: 正则表达式 https://www.runoob.com/python/python-reg-expressions.html import re line = "Cats are smarter than dogs" pattern = r'(.*) than (.*)' re.match函数 r 阅读全文
posted @ 2022-03-19 11:10 cookie的笔记簿 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 在 Tag 或 BeautifulSoup 对象的 .select() 方法中传入字符串参数, 即可使用CSS选择器的语法找到tag: CSS选择器 soup.select("title") # [<title>The Dormouse's story</title>] soup.select("p 阅读全文
posted @ 2022-03-19 11:00 cookie的笔记簿 阅读(188) 评论(0) 推荐(0) 编辑
  2022年3月17日
摘要: 知识点补充 user-agent chrome://version/ 简单爬取b站排行榜 import requests #获取页面数据 import pandas as pd #用于数据清洗 from bs4 import BeautifulSoup #解析页面 import numpy as n 阅读全文
posted @ 2022-03-17 21:48 cookie的笔记簿 阅读(82) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 12 下一页