摘要:
字节流: 所有的字节输入输出都继承自InputStream和OutputStream,通常用于读取二进制数据,最基本单位为单个字节,如图像和声音。默认不使用缓冲区。 FileInputStream和FileOutputStream:用于对磁盘文件涉及的数据流进行输入输出处理,即向一个文件对象中写入数 阅读全文
摘要:
JDBC的基本概念: JDBC就是java database connectivity,即java数据库连接。 JDBC主要完成的几个任务分别为 JDBC的作用: 将java程序语言编写出来的程序,与数据库相连接 JDBC的总体结构: 1.应用程序 2.驱动程序管理器 3.驱动程序 4.数据源 关于 阅读全文
摘要:
由于之前存在的难以辨别市本级,全市相关数据的原因,经过考虑采用 把含有关键词的字段全部提取进行人工辨别的方法 在其余部分不改变的情况下,更改test部分 尚未解决的功能性问题: 1.自动爬取网址链接的问题尚未解决 2.希望能使用java写出界面,进行直接的选择写入excel! 尚未解决的算法性问题: 阅读全文
摘要:
能够实现基于给出的网页连接爬取html后 进行正文内容的提取(测试网页反应情况良好) 通过正则表达式匹配左右给定的字符串,可以获取对应的数字。 通过设定左右字符串分别为”地区生产总值“和”亿元“,可以爬取出地区生产总值为1576.69 目前存在的问题: 1. 设想通过excel直接生成搜索关键词,并 阅读全文
摘要:
正则表达式简介: 简洁表示一组字符串的特征或者模式,在文本处理中十分常用,主要应用于字符串匹配中 1. 通用的字符串表达框架 2. 简洁表达一组字符串的表达式 3. 针对字符串表达简洁和特征思想的工具 4. 判断某字符串的特征归属 正则表达式的语法: 由字符和操作符构成·了解正则表达式的常用操作符 阅读全文
摘要:
!只用于学习用途! plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"',html) :获得商品价格和view_price字段,并保存在plt中 tlt = re.findall(r'\"raw_title\"\:\".*?\"',html) :获得商品名称 阅读全文
摘要:
import requests import random import string def randomString(length): return ''.join(random.choice(string.ascii_letters + string.digits) for i in range(length)) XCSRF2Cookie = 'csrf2_token_%s' %... 阅读全文
摘要:
以管理员权限打开 C盘 -> Windows-> System32 -> drives -> etc -> hosts文件 在hosts文件最后写入 52.84.246.72 d3c33hcgiwev3.cloudfront.net 阅读全文
摘要:
LINGO 中建立的优化模型可以由5个部分组成,或称为 5 段(section): (1)集合段(SETS):这部分要以“SETS:”开始,以“ENDSETS”结束,作用在于定义必要的集合变量(SET)及其元素(member,含义类似于数组的下标)和属性(attribute, 含义类似于数组)。 ( 阅读全文
摘要:
使用格式:DataFrame.describe(percentile_width=None, percentiles=None, include=None, exclude=None) 作用:生成各种汇总统计信息,不包括代表非数字值的特殊值。 参数: 1.percentile_width:Float 阅读全文