摘要: 一.搜索引擎介绍(来自维基百科) 搜索引擎指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。 (一)工作原理 搜索引擎的工作原理大致可以分为: 1.搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛的自动搜索机器人程序来连上每一个网页上的超链接。机器人程序根据网页 阅读全文
posted @ 2016-04-22 20:07 小星星☆ 阅读(487) 评论(0) 推荐(0) 编辑
摘要: 远程操控电脑的时候&爬虫的时候所需2333 win+R输入cmd,进入cmd。 输入shutdown 然后输入shutdown -s -t 3600 设置3600秒(1小时)后关机,大家可以根据需要的时间设置关机时间哈~ 阅读全文
posted @ 2016-04-19 22:43 小星星☆ 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 本章将研究如何在数据集并未明确标识结果的前提下,从中提取出重要的潜在特征来。 和聚类一样,这些方法的目的不是为了预测,而是要尝试最数据进行特征识别,并且告诉我们值得关注的重要信息。 “ 鸡尾酒会问题”(cocktail party problem)是在计算机语音识别领域的一个问题,当前语音识别技术已 阅读全文
posted @ 2016-04-17 10:08 小星星☆ 阅读(659) 评论(0) 推荐(1) 编辑
摘要: 导入模块: from selenium import webdriver from selenium.common.exceptions import NoSuchElementException 选择浏览器: driver = webdriver.Firefox() 打开url: driver.g 阅读全文
posted @ 2016-04-12 11:19 小星星☆ 阅读(579) 评论(0) 推荐(0) 编辑
摘要: 待完善 一.简介 PhantomJS是一个基于webkit的JavaScript API。它使用QtWebKit作为它核心浏览器的功能,使用webkit来编译解释执行JavaScript代码。任何你可以在基于webkit浏览器 做的事情,它都能做到。它不仅是个隐形的浏览器,提供了诸如CSS选择器、支 阅读全文
posted @ 2016-04-12 10:18 小星星☆ 阅读(28500) 评论(0) 推荐(1) 编辑
摘要: 待完善 pyv8是个js解析引擎, PyV8 是 V8 引擎的 Python 语言封装,这是 Python 和 JavaScript 对象之间的桥,支持在 Python 脚本中调用 V8 引擎。 阅读全文
posted @ 2016-04-11 21:55 小星星☆ 阅读(3042) 评论(1) 推荐(0) 编辑
摘要: 待完善 阅读全文
posted @ 2016-04-11 21:26 小星星☆ 阅读(926) 评论(0) 推荐(0) 编辑
摘要: import urllib2 urllib2.quote("呵呵哒") #输出 '%BA%C7%BA%C7%DF%D5' 阅读全文
posted @ 2016-04-11 17:15 小星星☆ 阅读(1561) 评论(0) 推荐(0) 编辑
摘要: 《机器学习系统设计》第11章 降维 学习笔记 针对书上的内容和网络上的资料记录下来的笔记,大家一起学习交流。 一.为什么需要降维 (一) 多余的特征会影响或误导学习器 (二) 更多特征意味着更多参数需要调整,过拟合风险也越大 (三) 数据的维度可能只是虚高,真实维度可能比较小 (四) 维度越少意味着 阅读全文
posted @ 2016-04-10 11:26 小星星☆ 阅读(3613) 评论(0) 推荐(4) 编辑
摘要: 一.写在前面的话~ 刚吃饭的时候同学问我,你为什么要用R做文本分析,你不是应该用R建模么,在我和她解释了一会儿后,她嘱咐我好好写这篇博文,嗯为了娟儿同学,细细说一会儿文本分析。 文本数据挖掘(Text Mining)是指从文本数据中抽取有价值的信息和知识的计算机处理技术。顾名思义,文本数据挖掘是从文 阅读全文
posted @ 2016-03-21 20:12 小星星☆ 阅读(25368) 评论(2) 推荐(6) 编辑