上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 36 下一页

日报3.10

摘要: 今天主要筛查数据的准确性,在分析中医药大辞典过程中,由于有的药品没有异名,以及在药品名称是根据字数进行划分的,所以导致药品所对应的并不是真实的情况,需要人工进行核对 阅读全文
posted @ 2021-03-10 23:48 一往无前! 阅读(18) 评论(0) 推荐(0) 编辑

日报3.9

摘要: 今天采用算法对本草纲目进行了分析,主要是以症状为主键进行分析,包括症状、治疗方法、所用药物、药物别名、药物的气味属性 阅读全文
posted @ 2021-03-09 22:15 一往无前! 阅读(30) 评论(0) 推荐(0) 编辑

日报3.8

摘要: 由于爬取药智网被限制导致数据不够,所以分析了之前下载的一本中药大辞典,词典的格式是一个txt文档,需要根据需要获取到不同的属性 原文: 爬取结果: 阅读全文
posted @ 2021-03-08 22:09 一往无前! 阅读(24) 评论(0) 推荐(0) 编辑

日报3.7

摘要: 今天学习并使用ajax制作了一个区域分布的弹窗显示该地区药品的功能,然后又对查询框进行了改进,增加了输入框的联想功能,对于药物来说增加了按照归经以及味道进行了分类 准备明天就药品信息界面做一个分页显示的效果,提高界面的简洁度。 阅读全文
posted @ 2021-03-07 22:43 一往无前! 阅读(26) 评论(0) 推荐(0) 编辑

日报3.6

摘要: 今天对已经爬取到的信息进行展示,主要是对数据的集中展示,查询,以及用地图来显示中药材的地域分布 今日遗留问题:现在地图上可以显示药材的数量,并设置点击事件,可以获取到所点击的省份,明天首要解决的就是将省份传入后台,并查询出该地域所包含的中药材名称。 阅读全文
posted @ 2021-03-06 23:29 一往无前! 阅读(32) 评论(0) 推荐(0) 编辑

日报3.5

摘要: 今天学习了代理ip的使用。爬取了快代理中的免费ip,可是昨天的问题还是无法解决,即便是开设新的账户进行登录还是被限制,应该还是网络ip的原因,更换网络就可以正常爬取,所有被限制的网络还是提示被限制,爬取内容为空。明天准备就现有数据进行展示,处理,之后逐步的添加数据 阅读全文
posted @ 2021-03-05 21:40 一往无前! 阅读(29) 评论(0) 推荐(0) 编辑

日报3.4

摘要: 今天继续爬取中药信息中的详细信息 由于信息中都是使用}进行分割的所以使用正则对数据进行切分选取即可 另外由于每味药中的信息都不同,所以只能通过一项一项的去爬取 #只爬取药材名称for tr in trs: for td in tr: #print(td.string) #print (td) if 阅读全文
posted @ 2021-03-04 18:32 一往无前! 阅读(22) 评论(0) 推荐(0) 编辑

日报3.3

摘要: 今天爬取详细信息准备从详细信息中提取地址信息,药品的详细信息就存放在一个table表格中当爬取整个表格的时候只爬取第一个td中的标题信息,而第二列中td还包含一个span标签,其中的内容没有爬取到 直接爬取 for tr in trs: ui = [] for td in tr: ui.append 阅读全文
posted @ 2021-03-03 19:18 一往无前! 阅读(30) 评论(0) 推荐(0) 编辑

日报3.2

摘要: 今天成功爬取药智库中的中药材基本信息库共收集中药2251种 阅读全文
posted @ 2021-03-02 21:24 一往无前! 阅读(20) 评论(0) 推荐(0) 编辑

Python的模拟登陆

摘要: 在进行网页爬取的过程中很多网站都会有账户密码,信息只对注册的用户开放,所以在爬取过程中必须的模拟浏览器进行登录 就以我今天爬取的药智库为例,如果没有登录,显示的信息会是这样的,会找不到详细信息, 所以在爬取过程中需要用到模拟登录 首先要审查网页的元素,查看他的network 然后进行登录,点击上方的 阅读全文
posted @ 2021-03-02 21:21 一往无前! 阅读(443) 评论(0) 推荐(0) 编辑
上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 36 下一页