摘要:
“正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。 许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强 阅读全文
摘要:
Python 爬虫包含两个重要的部分:正则表达式和Scrapy框架的运用, 正则表达式对于所有语言都是通用的,网络上可以找到各种资源。 如下是手绘Scrapy框架原理图,帮助理解 如下是一段运用Scrapy创建的spider:使用了内置的crawl模板,以利用Scrapy库的CrawlSpider。 阅读全文
摘要:
一个重要的闭环: 机器学习-数据挖掘的流程(CRISP-DM):围绕数据进行如下6个活动进行闭环式地探索活动 商业理解 数据理解 数据准备 建立模型 模型评估 方案实施 一个重要的概念: 特征工程:最大限度地从原始数据中提取特征以供算法和模型使用,包括如下几个主要部分: 数据预处理:标准化、缩放、缺 阅读全文
摘要:
图表类型和使用场景: 比较(对比各个值之间的差异):柱状图、雷达图、漏斗图、极坐标、旋风漏斗、词云 占比(部分占整体的百分比):饼图、漏斗、仪表盘、矩阵树图 相关(显示各个值之间的关系):散点、矩阵树图、指标看板、树图、来源去向图 趋势(数值随维度的变化情况):线图、柱状图 地理图(数值和地理信息映 阅读全文
摘要:
图表的数据要素以及图例展示 主要图表类型包括: 线图:包括类别轴和值轴,类别轴上最少1个维度;值轴上最少1个度量 柱状图:包括类别轴和值轴,类别轴上最少1个维度;值轴上最少1个度量 饼图:包括扇区标签和扇区角度,扇区标签上有且仅有1个维度,并且维度值小于等于12;扇区角度上有且仅有1个度量 气泡地图 阅读全文
摘要:
一、HTTP状态码 如果某项请求发送到您的服务器要求显示您网站上的某个网页(例如,用户通过浏览器访问您的网页或 Googlebot 抓取网页时),服务器将会返回 HTTP 状态代码以响应请求。 此状态代码提供关于请求状态的信息, 告诉 Googlebot 关于您的网站和请求的网页的信息。 一些常见的 阅读全文
摘要:
net use //ip/ipc$ " " /user:" " - 建立IPC空链接 net use //ip/ipc$ "密码" /user:"用户名" - 建立IPC非空链接 net use h: //ip/c$ "密码" /user:"用户名" - 直接登陆后映射对方C:到本地为H: net 阅读全文
摘要:
1 package com.jiucool.www.struts.action; 2 3 import java.io.BufferedReader; 4 import java.io.DataOutputStream; 5 import java.io.File; 6 import java.io 阅读全文
摘要:
一、模拟浏览器步骤: 1、创建Socket服务,并且指定IP地址与端口。 2、从Socket套接字中获取输出流,并且根据获取到的输出流创建打印流。 3、打印IE浏览器发送给服务端的打印前缀信息。 4、从Socket套接字中获取输入流,并且根据获取到的输入流创建BufferedReader。 5、循环 阅读全文
摘要:
介绍三个方面的内容: 1)Http协议的基本知识; 2)java.net.Socket类; 3)java.net.ServerSocket类。 读完后你可以把这个服务器用多线程的技术重新编写一个更好的服务器。 由于Web服务器使用Http协议通信的因此也把它叫做Http服务器,Http使用可靠的TC 阅读全文