05 2015 档案

摘要:搜索引擎索引基础前几天我阅读了搜索引擎索引这一章,发现倒排索引这一方法确实很巧妙和迷人,它包含的原理和设计方法很独到。所以接下来,我想把我学习到的索引方面的知识给大家讲解一下,总共分为三篇:索引基础、索引建立和更新、索引查询。我们首先认识倒排索引基本概念文档:一般搜索引擎的处理对象是互联网网页,而文... 阅读全文
posted @ 2015-05-31 14:04 天才白痴梦 阅读(1002) 评论(1) 推荐(0) 编辑
摘要:前言考虑到上次的网络爬虫总结一文对基础的知识还没有介绍完整,所以今天花一点时间来补充上次的网络爬虫基础知识。这次给大家总结了两个方面的内容:暗网抓取和分布式爬虫。希望对阅读本文的博友们有所收获。暗网抓取物理学研究表明,在目前宇宙所有物质的总体质量中,星系等可见物质占其中的20%,不可探测的暗物质占据... 阅读全文
posted @ 2015-05-29 18:12 天才白痴梦 阅读(1015) 评论(0) 推荐(0) 编辑
摘要:函数式编程最近对Python的学习有些怠慢,最近的学习态度和学习效率确实很不好,目前这种病况正在好转。今天,我把之前学过的Python中函数式编程简单总结一下,分享给大家,也欢迎并感谢大家提出意见。首先,我们学习函数式编程时,需要知道一个概念:高阶函数。那么到底什么是高阶函数呢?把函数作为参数传入,... 阅读全文
posted @ 2015-05-28 23:54 天才白痴梦 阅读(1999) 评论(0) 推荐(3) 编辑
摘要:网络爬虫基础前言通用搜索引擎的处理对象就是互联网网页,目前网页数量以百亿计,所以搜索引擎首先面临的问题就是:如何能够设计出高效的下载系统,以将如此海量的网页数据传送到本地,在本地形成互联网网页的镜像备份。网络爬虫即起此作用,它是搜索引擎系统中很关键也很基础的构建。本次总结以及接下来的几次总结主要给大... 阅读全文
posted @ 2015-05-28 17:15 天才白痴梦 阅读(1163) 评论(4) 推荐(0) 编辑
摘要:这就是搜索引擎 -- 读书笔记一相信搜索引擎对于每一个爱好算法甚至爱好技术的IT人员都具有强烈的好奇心吧,因为搜索引擎在互联网中的地位实在是不可撼动。想象如果互联网没有了搜索引擎,那么我们平常技术上出现瓶颈了怎么办?甚至连普通的生活都离不开搜索,大学生的你订餐了吗?搜索引擎已经发展为每个人上网都离不... 阅读全文
posted @ 2015-05-25 11:12 天才白痴梦 阅读(1858) 评论(2) 推荐(5) 编辑
摘要:字典原来是这么回事儿Python学习到现在,我们已经知道,如果想将值分组到结构中,并且通过编号对其进行引用,列表就可以派上用场。不过,今天,我们将学到一种通过名字引用值的数据结构,应该知道这种数据类型叫做映射。字典则是Python中唯一内建的映射类型,那么我们就来学习字典。认识字典字典是可变的,并且... 阅读全文
posted @ 2015-05-21 01:23 天才白痴梦 阅读(1634) 评论(3) 推荐(1) 编辑
摘要:优雅的字符串前言记得我在Python学习总结第一篇中有提到字符串,那个可以算是先打个招呼吧,因为没有提到任何关于字符串的处理方法。今天,给大家详细讲解一下Python中字符串的使用方法,如有不当或不足之处,还请大家指出及补充,先谢过。基本字符串操作对于序列的操作,我们马上可以想到的都有什么?索引?分... 阅读全文
posted @ 2015-05-16 23:45 天才白痴梦 阅读(2399) 评论(2) 推荐(0) 编辑
摘要:带你走进数据类型一:整数、浮点数Python中整数和浮点数的定义以及运算和C++都是一样的,我在这里就不需多说了,我就说明一点:Python相对于C/C++而言,定义整数没有int 和 long long 这些区分的,直接赋值即可。这就体现出了Python简洁的功能。二:布尔值、空值首先我们先谈谈P... 阅读全文
posted @ 2015-05-13 00:17 天才白痴梦 阅读(1217) 评论(0) 推荐(3) 编辑
摘要:Python学习第一篇一:写在前面啊,最近我的新博客一直都没有更新学习内容了,只是最近一直都在忙着寻找实习机会(或许这只是一个借口,真实原因是我太懒惰了,改改改!)。终于今天又投递了几个新的实习职位之后幡然醒悟,我的执行力还是太弱了,我得更加有自律性更加坚持才行。所以今天,我把之前学习的Python... 阅读全文
posted @ 2015-05-10 16:31 天才白痴梦 阅读(3215) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示