摘要: 生日的时候女票送了一副新耳机,还挺帅气。 装逼界的人都知道,新耳机是有“煲”这个步骤的 至于有没有效果?怎么煲?煲多久?这些问题都是耳机界常年争执的问题,各路高手分成各种门派常年杀伐不休,一不注意就可能引发圣战…… 这都是背景 我一直以来都觉得自己是个“木耳”,也就是传说中的分不清音质好坏的家伙,属 阅读全文
posted @ 2017-03-01 15:23 木白的菜园 阅读(508) 评论(0) 推荐(0) 编辑
摘要: 有一天女票跟我说,你给我讲几个笑话吧,我一时语塞。 我虽然平时很喜欢看段子,有时候在知乎上看到牛逼的段子还会收藏一下,每天打开知乎日报必看的就是关于段子的“瞎扯”栏目,但是吧,我却从来都是没心没肺地呵呵乐一乐就完事儿,从来记不住一个两个段子。 气氛顿时有点尴尬,连笑话都不会讲,对于把妹来说,这简直是硬伤啊! 于是我痛定思痛,得想个办法。 恰好,最近在学习爬虫,刚好学到这个例子:利用pyth... 阅读全文
posted @ 2017-03-01 15:16 木白的菜园 阅读(597) 评论(1) 推荐(0) 编辑
摘要: 使用Python连接数据库首先需要安装Python的数据库驱动。 我的本地只装了Python,并没有装MySQL,当我使用命令: 安装驱动(也就是MySQLdb模块)的时候出现如下错误: 查 "资料" 知道是因为没有安装下面两开发包: libmysqld dev libmysqlclient dev 阅读全文
posted @ 2017-03-01 15:06 木白的菜园 阅读(17013) 评论(0) 推荐(0) 编辑
摘要: 爬虫以前听上去好厉害好神秘的样子,用好了可以成就像Google、百度这样的索索引擎,用不好可以凭借不恰当的高并发分分钟崩掉一个小型网站。写到这里想到12306每年扛住的并发请求量,觉得好牛逼。 爬虫和反爬虫从一直以来都是一个道高一尺魔高一丈的架势。反爬虫技术增加了爬取的难度,各路crawler的爬取过程可以说是一个和各种网站站长斗智斗勇的过程,各种解决方式可谓层出不穷,但是这里说是“简单”解决方... 阅读全文
posted @ 2017-03-01 15:03 木白的菜园 阅读(17204) 评论(1) 推荐(2) 编辑
摘要: 最近准备重新研究一下推荐系统的东西,用到的数据集是Audioscrobbler音乐数据集。我用python处理数据集中artist_data.txt这个文件的时候,先读取每一行然后进行处理: with open('artist_data.txt','r')as f: for line in f: p 阅读全文
posted @ 2017-03-01 14:58 木白的菜园 阅读(3958) 评论(0) 推荐(0) 编辑