上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 35 下一页

日报3.15

摘要: 今天停电,导致长时间没干活,今天就爬取了一点中药材的来源书籍信息 阅读全文
posted @ 2021-03-15 21:02 一往无前! 阅读(12) 评论(0) 推荐(0) 编辑

日报3.14

摘要: 今天从药智网进行方剂的爬取,主要爬取方名、出处、功能大类、功能小类、处方、炮制、功能、主治、附方等相关属性 阅读全文
posted @ 2021-03-14 19:54 一往无前! 阅读(17) 评论(0) 推荐(0) 编辑

爬取药智网中的方剂信息

摘要: 为了防止爬虫过程过快,被限制ip所以每次爬取完一个页面,就休眠6秒 初学爬虫,写的有点简单 # -*- coding: utf-8 -*- from bs4 import BeautifulSoup import requests import csv import time ExcelName = 阅读全文
posted @ 2021-03-14 19:52 一往无前! 阅读(419) 评论(2) 推荐(0) 编辑

日报3.13

摘要: 今天对主治功能进行了细化,以主治功能为主线,对应相关药品,与本草纲目中分析出的数据进行了融合,并且将从药智网爬取的中药信息与从中药大辞典中分析出来的数据进行了融合。 功能表 阅读全文
posted @ 2021-03-13 19:45 一往无前! 阅读(25) 评论(0) 推荐(0) 编辑

数据库添加出错

摘要: 在使用Navicat导入csv文件时总是导入不全出现,Cannot create table [Sheet]: 1166 - Incorrect column name 错误 这个的原因就是这一字段中存在空格,把空格去除后即可 出现[Err] [Row1] [Imp] 1406 - Data too 阅读全文
posted @ 2021-03-12 22:10 一往无前! 阅读(170) 评论(0) 推荐(0) 编辑

日报3.12

摘要: 今天将所有数据进行整合,并全部添加入数据库中,现在主要存在的还有三个库,其中一个是来自药智网中的数据(2250条),另一个是分析中药大辞典(1873条)中的数据,这两个具有共同的属性,需要整合为一个,待明天将所有的主治功能细化归入到与本草纲目类似的病症->对应中药以及治疗方法库中,然后再将两个药品库 阅读全文
posted @ 2021-03-12 22:06 一往无前! 阅读(26) 评论(0) 推荐(0) 编辑

日报3.11

摘要: 今天继续进行数据的筛查工作,数据中心还是有狠多存在问题的项,进行了比对,成功构建了csv文件,成功之后,在导入数据库时由于格式的问题还是无法完全导入,存在大量的错误项,还得进行格式的修改 阅读全文
posted @ 2021-03-11 21:16 一往无前! 阅读(18) 评论(0) 推荐(0) 编辑

日报3.10

摘要: 今天主要筛查数据的准确性,在分析中医药大辞典过程中,由于有的药品没有异名,以及在药品名称是根据字数进行划分的,所以导致药品所对应的并不是真实的情况,需要人工进行核对 阅读全文
posted @ 2021-03-10 23:48 一往无前! 阅读(16) 评论(0) 推荐(0) 编辑

日报3.9

摘要: 今天采用算法对本草纲目进行了分析,主要是以症状为主键进行分析,包括症状、治疗方法、所用药物、药物别名、药物的气味属性 阅读全文
posted @ 2021-03-09 22:15 一往无前! 阅读(28) 评论(0) 推荐(0) 编辑

日报3.8

摘要: 由于爬取药智网被限制导致数据不够,所以分析了之前下载的一本中药大辞典,词典的格式是一个txt文档,需要根据需要获取到不同的属性 原文: 爬取结果: 阅读全文
posted @ 2021-03-08 22:09 一往无前! 阅读(23) 评论(0) 推荐(0) 编辑
上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 35 下一页