09 2017 档案

摘要:https://www.v2ex.com/t/393681#; 阅读全文
posted @ 2017-09-27 08:59 杉枫 阅读(326) 评论(0) 推荐(0) 编辑
摘要:产品、技术、运营、营销 产品:原型、交互、文案、运营、推广。。。 技术:架构、中间件、高可用、高性能、搜索、个性化推荐、大数据。。。 运营:内容、渠道、活动。。。 体验比较深就是对每个点不断优化,最终产生合力价值。 阅读全文
posted @ 2017-09-26 11:26 杉枫 阅读(175) 评论(0) 推荐(0) 编辑
摘要:大数据、大数据已被喊烂,数据有很多、数据背后意义与价值是什么,给我们 带来什么价值。 通过数据分析沃尔玛来确认选址、电商中的库存预测模型、星巴克选址、各种 小店选址,通过数据来提供决策依据、减少拍脑袋。 通过数据分析预测大佬们能得出来移动互联网即将都来,从而掉头转向移动互联 网。这是数据对于趋势的价 阅读全文
posted @ 2017-09-26 10:48 杉枫 阅读(622) 评论(0) 推荐(0) 编辑
摘要:美团 https://tech.meituan.com/machinelearning-data-feature-process.html 维数灾难 待续... 阅读全文
posted @ 2017-09-22 09:01 杉枫 阅读(272) 评论(0) 推荐(0) 编辑
摘要:昨天夜里线上服务线程飙到8000,系统可用率下降,通过回想线上业务逻辑, 当前是不存在多个线程池的,也就是微服务的线程池以及redis的线程池。 通过监控jvm工具查到线程数,是redis线程数导致,查看redis当时正在进行 大规模数据写入,资源使用过高,将写入停掉,服务线程数回落,数据变平稳。 阅读全文
posted @ 2017-09-21 11:27 杉枫 阅读(274) 评论(0) 推荐(0) 编辑
摘要:http://www.cnblogs.com/jycboy/p/jsoupdoc.html http://www.cnblogs.com/mokafamily/p/3558620.html 阅读全文
posted @ 2017-09-20 18:29 杉枫 阅读(112) 评论(0) 推荐(0) 编辑
摘要:从事任何方向的技术研究,不知道该干什么的时候,就问自己四个问题:•这个方向上最新进展是什么? 都知道吗?•这个方向上最著名的专家有哪些?他们的研究都看过吗?•这个方向上最著名的技术社区有哪些?精华帖都看过一遍吗?•这个方向上最重要的文章、工具有哪些?文章都看过吗?工具都分析过吗? 作者:tombke 阅读全文
posted @ 2017-09-18 09:14 杉枫 阅读(134) 评论(0) 推荐(0) 编辑
摘要:推荐系统包含推荐算法、推荐架构、推荐模型、推荐引擎。 待续。。。 饿了么推荐系统的从0到1 推荐系统好文章 https://mp.weixin.qq.com/s/s1urS57SLZpJoZYH6-wQlA https://zhuanlan.zhihu.com/p/24989701 http://w 阅读全文
posted @ 2017-09-15 12:49 杉枫 阅读(251) 评论(0) 推荐(0) 编辑
摘要:v2ex关于问题讨论 https://www.v2ex.com/t/348196 微博反垃圾论文 http://xwxt.sict.ac.cn/CN/abstract/abstract2487.shtml https://ruby-china.org/topics/23718 阅读全文
posted @ 2017-09-14 08:37 杉枫 阅读(232) 评论(0) 推荐(0) 编辑
摘要:公司最近换了logo,每个人桌面都进行了替换,有些同事不是很喜欢,觉得太鲜艳了,略过 这个问题不谈,通过这件事能够看到,公司对于品牌推广是不遗余力的。 从“这件”小事看到公司虽然规模很大依然保持不放弃每一个推广的小点,这应该是公司不断 增长从小处看的一个佐证,扩展来看我们平时做事的时候,应该不以小点 阅读全文
posted @ 2017-09-12 08:40 杉枫 阅读(152) 评论(0) 推荐(0) 编辑
摘要:http://www.gaofi.cn/ 阅读全文
posted @ 2017-09-11 08:54 杉枫 阅读(103) 评论(0) 推荐(0) 编辑
摘要:怎样量化评价搜索引擎的结果质量 http://www.infoq.com/cn/articles/cyw-evaluate-seachengine-result-quality http://www.infoq.com/cn/articles/recommendation-and-searcheng 阅读全文
posted @ 2017-09-08 09:04 杉枫 阅读(486) 评论(0) 推荐(0) 编辑
摘要:转载自星巴克 选址于搜索优化有异曲同工之妙 公司楼下竟然没有星巴克,你想过为什么吗? 编者按:本文来自微信公众号「DT 财经(id:DTcaijing)」,编译:唐也钦;36 氪经授权发布。 据说星巴克周边的房子会更贵,这是什么选址大法 当肯德基、麦当劳都在出售中国业务时,星巴克却在今年 7 月豪掷 阅读全文
posted @ 2017-09-08 08:46 杉枫 阅读(137) 评论(0) 推荐(0) 编辑
摘要:大学时使用csdn下载软件资源,最终csdn成为一个it中很重要站点,csdn的运营方式值得思考。 阅读全文
posted @ 2017-09-06 17:11 杉枫 阅读(147) 评论(0) 推荐(0) 编辑
摘要:百度站点平台,提交站点信息。 阅读全文
posted @ 2017-09-06 16:32 杉枫 阅读(138) 评论(0) 推荐(0) 编辑
摘要:http://www.code123.cc 阅读全文
posted @ 2017-09-06 16:05 杉枫 阅读(229) 评论(0) 推荐(0) 编辑
摘要:好问题 1、比如我要索引的条目为“33分钟侦探”,我想在用户输入“3”、“33”、“三三”、“三十三”、“三十三分钟”等的情况下都命中该条目,请问有没有什么好的方式实现? PS:使用的是ansj分词器 https://elasticsearch.cn/question/1812 2、elastics 阅读全文
posted @ 2017-09-06 11:37 杉枫 阅读(314) 评论(0) 推荐(0) 编辑
摘要:不要浪费时间去关注房子、车子、股票等事情,这些事情不仅不会为你带来收益反而浪费你的 很多时间,不会得到任何东西,只是一些口水上的谈资。 不要浪费过多时间去关注新闻媒体,新闻媒体报道的各种事件过多的去关注,也仅仅是关注而已 不能帮到当事人,满屏的BAT对我们意义是什么?除了一些谈资没有任何意义。适度的 阅读全文
posted @ 2017-09-06 09:01 杉枫 阅读(193) 评论(0) 推荐(0) 编辑
摘要:1、 计算提供两种模式,一种是jar包本地计算、一种是JSF服务。 2、 第一步是引入spark,因与netty、JDQ均有冲突,解决netty冲突后,隔离计算为单独服务。已在线上,因storm也与spark存 在运行时冲突,storm也在用服务。 3、 第二步是召回集扩量,发现当召回集由200扩到 阅读全文
posted @ 2017-09-05 08:53 杉枫 阅读(886) 评论(0) 推荐(0) 编辑
摘要:服务端使用训练出来的模型,spark模型计算第一步是实现spark模型加载。 线上服务对用户体验影响极大,故需要对模型使用进行优化。 1、多线程并发进行计算,线上两个服务。优化cpu 2、在扩召回集,io是性能瓶颈,特征服务内进行计算。优化io 3、在扩大召回集,多个计算节点,请求节点只发送请求,多 阅读全文
posted @ 2017-09-04 20:01 杉枫 阅读(471) 评论(0) 推荐(0) 编辑
摘要:技术团队,首先是完成业务的任务,还要对新技术保持一定的跟进,并且要规划团队的未来发展 在公司发展的同时,团队成员要不断进步提高。 在完成业务的同时,我们要考虑当前做的事有没有更好的实现方式,能不能工具化、平台化、抽象 化以及新的技术方式,更好的解决现有问题。 团队要因人而已的进行不同管理,有能力的要 阅读全文
posted @ 2017-09-04 16:22 杉枫 阅读(970) 评论(0) 推荐(0) 编辑
摘要:jcseg分词器 https://github.com/hankcs/HanLP https://github.com/NLPchina/ansj_seg https://github.com/wks/ik-analyzer 阅读全文
posted @ 2017-09-04 09:15 杉枫 阅读(273) 评论(0) 推荐(0) 编辑
摘要:专访今日头条张一鸣:推荐引擎没有让信息变窄 http://www.chinaz.com/visit/2014/1119/374633.shtml 阅读全文
posted @ 2017-09-03 18:45 杉枫 阅读(459) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示