会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
sfzyk
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
上一页
1
···
8
9
10
11
12
2017年3月7日
PYTHON网络爬虫与信息提取[信息的组织与提取](单元五)
摘要: 1 三种信息类型的简介 xml : extensible markup language 与html非常相似 现有html后有xml xml是html发展来的 扩展 通用 json 类型 javascript object notation 有类型的键值对 表达的方式 一个key对应多个值 "key
阅读全文
posted @ 2017-03-07 21:15 sfzyk
阅读(351)
评论(0)
推荐(0)
编辑
PYTHON网络爬虫与信息提取[BeautifulSoup](单元四)
摘要: 1 简介 from bs4 import BeautifulSoup soup=BeautifulSoup(<p>data</p>,'html.parser') 2 基本元素 解析,遍历,维护,标签树的库 <p class="title"> ...</p> tag对 名称 (属性 attribute
阅读全文
posted @ 2017-03-07 20:34 sfzyk
阅读(357)
评论(0)
推荐(0)
编辑
PYTHON网络爬虫与信息提取[网络爬虫协议](单元二)
摘要: robots.txt在网站的根目录下 遵守 自动或人工识别robots.txt再进行内容爬取 约束性:建议性,不遵守协议,存在法律风险。 基本语法: User-agent: * Disallow: / #注释 *所有 /代表根目录
阅读全文
posted @ 2017-03-07 08:38 sfzyk
阅读(253)
评论(0)
推荐(0)
编辑
Python网络爬虫与信息提取[request库的应用](单元一)
摘要: 恢复内容开始 注:学习中国大学mooc 嵩天课程 的学习笔记 request的七个主要方法 request.request() 构造一个请求用以支撑其他基本方法 request.get(url,params=None,**kwarg) 12个参数 获取html的主要方法,对应于http的GET re
阅读全文
posted @ 2017-03-07 08:26 sfzyk
阅读(2801)
评论(0)
推荐(0)
编辑
2016年12月24日
scikit-learn实现ebay数据分析 的随笔
摘要: 注:只是随笔 import pandas as pd train = pd.read_csv() 读入scv格式的文件 train = train_set.drop(['EbayID','QuantitySold','SellerName'], axis=1) 去掉无用的features; trai
阅读全文
posted @ 2016-12-24 17:27 sfzyk
阅读(201)
评论(0)
推荐(0)
编辑
2016年12月22日
machine leanring 笔记 vectorization
摘要: the summation of the product of two terms can be expressed as the product of two vectors ps. surf :plot 3-d mesh surf(a,b,c) c's coloum=a's length and
阅读全文
posted @ 2016-12-22 19:23 sfzyk
阅读(113)
评论(0)
推荐(0)
编辑
2016年12月21日
machine learning 笔记 normal equation
摘要: theta=(Xt*X)^-1 Xt*y x is feature matrix y is expectation
阅读全文
posted @ 2016-12-21 16:26 sfzyk
阅读(136)
评论(0)
推荐(0)
编辑
machine leanring 笔记 octave命令笔记
摘要: 来源于coursea 的公开课 A*B 一般意义的矩阵相乘 A.*B矩阵各位相乘 A.^2 A矩阵的每个数平方 1./A 对A矩阵的各位取倒 .表示对每一项都如此操作 log (A) exp(A) abs(A) -A th v+ones(length(v),1) add vector of all
阅读全文
posted @ 2016-12-21 13:13 sfzyk
阅读(182)
评论(0)
推荐(0)
编辑
2016年11月1日
UVa 1354 天平难题 Mobile Computing
摘要: 整个题考虑起来 最主要要计算的状态 是树的状态 于是要计算出所有可能挂坠可能组成的树的所有形态 tree 用于保存这些状态 考虑不要重复计算,有一个vis 数组 预处理可以先计算出一棵树的重量,简化计算#include<stdio.h> #include<iostream> #include<vec
阅读全文
posted @ 2016-11-01 20:14 sfzyk
阅读(144)
评论(0)
推荐(0)
编辑
上一页
1
···
8
9
10
11
12