该文被密码保护。 阅读全文
posted @ 2016-07-26 22:53 启铭星 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 关于爬虫内容的分享,我会分成两篇,六个部分来分享,分别是: 一、我们的目的是什么 一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值,内容一般分为两部分,非结构化的文本,或结构化的文本。 1. 关于非结构化的数据 1.1 HTML文本(包含JavaScript代码) HTML 阅读全文
posted @ 2016-07-26 01:27 启铭星 阅读(205) 评论(0) 推荐(0) 编辑
摘要: 前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信 阅读全文
posted @ 2016-07-26 01:22 启铭星 阅读(961) 评论(0) 推荐(0) 编辑
摘要: 摘要:R语言的知识体系并非语法这么简单,如果都不了R的全貌,何谈学好R语言呢。本文将展示介绍R语言的知识体系结构,并告诉读者如何才能高效地学习R语言。 最近遇到很多的程序员都想转行到数据分析,于是就开始学习R语言。总以为有了其他语言的编程背景,学习R语言就是一件很简单的事情,一味地追求速度,但不求甚 阅读全文
posted @ 2016-07-26 01:18 启铭星 阅读(432) 评论(0) 推荐(0) 编辑
摘要: 要说清楚 HTTPS 协议的实现原理,至少需要如下几个背景知识。1. 大致了解几个基本术语(HTTPS、SSL、TLS)的含义2. 大致了解 HTTP 和 TCP 的关系(尤其是“短连接”VS“长连接”)3. 大致了解加密算法的概念(尤其是“对称加密与非对称加密”的区别)4. 大致了解 CA 证书的 阅读全文
posted @ 2016-07-26 01:13 启铭星 阅读(201) 评论(0) 推荐(0) 编辑
摘要: 今天电话面了百度,感觉不太对口,自己的表现也很差劲。 【经验】方向不对口,应该及时让面试官帮忙转到对口方向。 答:32位操作系统中,int,long占用4字节,short占用2字节。不同的编译器根据不同的 64 位模型有所不同,比如 Visual C++,从第一个支持 64 位的版本起,一直就是使用 阅读全文
posted @ 2016-07-26 00:34 启铭星 阅读(344) 评论(0) 推荐(0) 编辑