摘要: Hawk: Advanced Crawler& ETL tool written in C /WPF 1.软件介绍 Hawk3已经发布,本文的很多信息已经不完整或过期,所有更新信息和下载地址都可参考下面的链接: https://github.com/ferventdesert/Hawk HAWK是一 阅读全文
posted @ 2016-05-03 12:48 FerventDesert 阅读(49119) 评论(53) 推荐(29) 编辑
摘要: 进博客园四年多,从第一篇讨论地图显示的文章到现在,已经有80多篇文章了。此处总结一下写过的文章并作分类,方便大家查看。革命尚未成功,同志仍需努力!个人邮箱 buptzym@qq.com数据分析,编译和模式用数据说话:北京房价数据背后的数据《编程语言实现模式》笔记(一)词法和句法分析数据挖掘工具分析北... 阅读全文
posted @ 2013-07-16 09:55 FerventDesert 阅读(4256) 评论(3) 推荐(2) 编辑
摘要: 今年我司的晋升面试,目睹了有些候选人因为一些细小的失误,导致没有通过,感觉十分可惜。所以写一篇文章记录一下我看到的几个特别常见的问题,希望对身在互联网大厂内卷的算法同学能有帮助。 阅读全文
posted @ 2022-08-18 21:49 FerventDesert 阅读(645) 评论(0) 推荐(2) 编辑
摘要: (博客园也不是只能发技术对吧,只要不发到首页,自娱自乐有何不可?) 如果晚上只身一人呆在寂静的森林,也许不会觉得害怕;但若是空无人烟的残破城市,杂草丛生,墙壁斑驳,夜色中却看不到一点灯光和人烟,那才是真的惊悚。而位于乌克兰的普里皮亚季,如今就是被世界遗忘的无人区。 神作《权利的游戏》最后一季,因剧透 阅读全文
posted @ 2022-03-29 22:11 FerventDesert 阅读(260) 评论(0) 推荐(1) 编辑
摘要: 沙漠君在闭关4个月后,终于把开源数据神器Hawk(详细介绍在这里)的文档和教学视频基本录制完毕, 并同步更新在有爱无广告二次元的B站! 教程总时间超过3个小时,覆盖了网页采集器,数据清洗,文件读写等方方面面。内容蜜汁丰富,有原理,有如何填坑的tip,更有完整的操作步骤,让你一看就能明白。 教程更是增 阅读全文
posted @ 2019-06-07 22:10 FerventDesert 阅读(1556) 评论(2) 推荐(2) 编辑
摘要: 从即日起,Hawk将停止升级工作,其版本号将停留在5。 https://github.com/ferventdesert/Hawk Hawk已经开发和维护6年时间了,它曾经承载了开发者很多的期待。背后也有不少故事和为它付出过的朋友。6年间Hawk拥有了上万的用户,并获得了很多好评。 在这6年间,我为 阅读全文
posted @ 2019-02-13 20:10 FerventDesert 阅读(4667) 评论(7) 推荐(2) 编辑
摘要: 最近又要租房了,哪里的性价比更高?买房却不知道全国市场的趋势如何?程序员自有办法,抓取网络的房产交易和租房数据来分析啊! 用Python写起来麻烦,用商业软件速度慢还收费,开源的图形化爬虫Hawk,已经在其任务市场里内置了全国链家和我爱我家的工程任务。一键即可加载市场任务,一键在全国几十个城市之间切 阅读全文
posted @ 2019-01-16 08:05 FerventDesert 阅读(4430) 评论(9) 推荐(3) 编辑
摘要: https://ferventdesert.github.io/Hawk/ Hawk是一款由沙漠之鹰历时五年个人业余时间开发的,开源图形化爬虫和数据清洗工具,GitHub Star超过2k+,前几代版本介绍如下: Hawk3: "终于等到你: 图形化开源爬虫Hawk 3发布!" Hawk2: "12 阅读全文
posted @ 2019-01-14 09:33 FerventDesert 阅读(2774) 评论(12) 推荐(4) 编辑
摘要: 天通苑窗外萧瑟的大街上,到处都是骑电动车的中介小哥,今年北京的冬天格外寒冷。 “战争远没有结束。”沙县小吃的老板叼着一根烟,厚厚的黑框眼镜透出他忧郁的眼神,一口烟从他口中爬出来。 时间回到两天前,我公众号弹出了神秘留言:“ 12月31号,下午五点,天通苑地铁B口沙县小吃见。 ”我仿佛摊上了大事。 下 阅读全文
posted @ 2019-01-10 12:13 FerventDesert 阅读(6795) 评论(2) 推荐(0) 编辑
摘要: 本文为原创作品,首发《阿里技术》和《阿里巴巴机器学习》,已经过蚂蚁金服文章外发授权,并进行了脱敏处理 0.综述 本文作者为蚂蚁金服人工智能部认知计算组的基础算法团队。文章提出一整套创新算法与架构,通过对TensorFlow底层的弹性改造,解决了在线学习的弹性特征伸缩和稳定性问题,并以GroupLas 阅读全文
posted @ 2019-01-06 09:56 FerventDesert 阅读(12878) 评论(7) 推荐(18) 编辑
摘要: 9月20号讯飞AI同传语音造假的新闻刷爆科技圈,科大讯飞股价应声下跌3.89%(不是65.3%,标题党文章害死人)。 吃瓜群众纷纷感慨,有多少人工,就有多少智能。 AI概念在2015年起就红得发紫,不论是送外卖,搞团购,卖车,或是推荐莆田医院的,是个公司都会标榜自己是搞人工智能的。在21世纪的第二个 阅读全文
posted @ 2018-10-15 14:37 FerventDesert 阅读(11679) 评论(9) 推荐(22) 编辑
摘要: 《罗辑思维》大概是所有音频节目里做的最好的,在清醒的10分钟干货满满,后面的时间睡得很香甜。每隔20秒从罗胖嘴里说出来的“人类社会”,"人格道德"这样的大词,都会让瞌睡虫进一步占领大脑,治好了不少人多年的失眠症。 网上有篇文章《罗振宇的骗局》火了一把,文章内容按下不表。罗振宇为此专门开了一次内部 阅读全文
posted @ 2018-06-22 07:38 FerventDesert 阅读(1018) 评论(3) 推荐(7) 编辑