上一页 1 ··· 29 30 31 32 33 34 35 36 37 ··· 50 下一页

2019年8月22日

基于Scrapy爬取前程无忧招聘信息

摘要: 1.项目介绍 本项目用于爬取前程无忧招聘网站发布的招聘信息,包括岗位名称、岗位要求、公司名称、经验要求等近30个字段,可用于对目前不同地区、行业招聘市场的数据分析中。 所用工具(技术): IDE:pycharm Database:MySQL 抓包工具:Fiddler 爬虫框架:scrapy 信息抓取 阅读全文

posted @ 2019-08-22 15:14 农夫三拳有點疼 阅读(2023) 评论(0) 推荐(0) 编辑

2019年8月21日

kaggel-产品搜索相关性

摘要: 1.描述: 购物者依靠Home Depot的产品权威来寻找和购买最新产品,并及时获得满足其家居装修需求的解决方案。从安装新的吊扇到改造整个厨房,只需点击鼠标或点击屏幕,客户就可以快速获得正确的查询结果。速度,准确性和无摩擦的客户体验至关重要。 Home Depot要求Kagglers通过开发能够准确 阅读全文

posted @ 2019-08-21 15:06 农夫三拳有點疼 阅读(278) 评论(0) 推荐(0) 编辑

2019年8月20日

关于axis=0,axis=1理解

摘要: 根据官方的说法,1表示横轴,方向从左到右;0表示纵轴,方向从上到下。当axis=1时,数组的变化是横向的,而体现出来的是列的增加或者减少。 axis=0代表跨行(down),而axis=1代表跨列(across)。 轴用来为超过一维的数组定义的属性,二维数据拥有两个轴:第0轴沿着行的垂直往下,第1轴 阅读全文

posted @ 2019-08-20 11:08 农夫三拳有點疼 阅读(1816) 评论(0) 推荐(0) 编辑

2019年8月12日

搜狐新闻推荐算法原理(转)

摘要: 1.新闻推荐算法架构 新闻算法的核心主要分为两个阶段:召回阶段(retrieval)和排序阶段(ranking)。之所以分为两个阶段,主要是从性能考虑。召回阶段面临的是百万级别甚至千万级别的文章,单篇文章的性能开销必须要小;而排序阶段的算法则非常消耗资源,不可能对所有文章都算一遍,也没有必要这样做, 阅读全文

posted @ 2019-08-12 11:10 农夫三拳有點疼 阅读(783) 评论(0) 推荐(0) 编辑

ALS的Spark实现

摘要: 1.ALS算法流程: 初始化数据集和Spark环境 >切分测试机和检验集 >训练ALS模型 >验证结果 >检验满足结果 >直接推荐商品,否则继续训练ALS模型 2.数据集的含义 Rating是固定的ALS输入格式,要求是一个元组类型的数据,其中数值分别是如下的[Int,Int,Double],在建立 阅读全文

posted @ 2019-08-12 10:41 农夫三拳有點疼 阅读(143) 评论(0) 推荐(0) 编辑

上一页 1 ··· 29 30 31 32 33 34 35 36 37 ··· 50 下一页

导航