08 2017 档案

摘要:创业应该是做对大家对行业有价值的事情,而不是做重复的事情,应该就是类似于做技术 做些有新意的,不能重复造轮子。 选择需要花时间思索、思考,是一件有挑战,并且能够提升自己的事情。 我们应该不断的提高对自己的要求,而非不断对别人提高要求,要敢于面对自己,像自己 求,而非外在。 阅读全文
posted @ 2017-08-31 14:36 杉枫 阅读(471) 评论(2) 推荐(0) 编辑
摘要:对于新的技术要不断的跟进,对于产品、运营、流量要不断地增加认知。 对于搜索引擎、推荐系统要不断学习。 对于管理要注重理论与实战结合,要更多的给予同事提升的机会,做一些有挑战的 任务,对于自己的定位配合大家把事情向前推进。 对于事情要不断地从更大的角度去思考,扩大视野,多和同事沟通,提高分享技能。 对 阅读全文
posted @ 2017-08-30 12:45 杉枫 阅读(243) 评论(0) 推荐(0) 编辑
摘要:1、单机榨到极限,集群也就到了极限,性能优化。 2、单机性能由单机压测工具将性能压测出来,尽量将机器达到最大化。 阅读全文
posted @ 2017-08-29 19:39 杉枫 阅读(165) 评论(0) 推荐(0) 编辑
摘要:关键词: caoz 搜索引擎、搜索引擎 caoz admin5等几个论坛社区。 对于搜索引擎各个方面,包含但不限于长尾词、行业词、点击提权等。搜索权值的 影响关系,和更新频次等等,比如前面说到的,身价几十亿的那个80后创业者。 百度的强大还来自于两大块,第一是内容护城河,第二是入口把控。 前者是百度 阅读全文
posted @ 2017-08-29 13:01 杉枫 阅读(202) 评论(0) 推荐(0) 编辑
摘要:1、Stanford CoreNLP maven依赖,jdk依赖1.8 2、Stanford CoreNLP分词、分句、词性标注、命名实体识别、语法分析本身支持很多,但是全部 使用会导致性能很差,比如我们实际使用中需要使用ner, parse, mention, coref可以先不适用。 连接 ht 阅读全文
posted @ 2017-08-29 09:28 杉枫 阅读(2834) 评论(0) 推荐(0) 编辑
摘要:去年6月27日来到新单位,到今天已一年有余,复盘一下,取得进步的是技术以及 一些为人处事之道,做的不好是对于情绪的把握,以及业余时间状态,以及家庭沟通, 要更加理性。 平时要多交朋友,各种各样的朋友了解各种各样的行业为以后做准备。 对于技术做一些总结对哪些有了更深的认识,对于新技术要保持持续的学习以 阅读全文
posted @ 2017-08-28 10:11 杉枫 阅读(170) 评论(0) 推荐(0) 编辑
摘要:jd 觅me名字改回发现了入口uv也在上涨 阅读全文
posted @ 2017-08-28 09:13 杉枫 阅读(212) 评论(0) 推荐(0) 编辑
摘要:1、libCRFPP.so放在idea项目 resources下,打jar包时打在jar中。 jar包工具类 2、需要安装CRF相关信息 网上找到两种方式: 出现这种情况的原因是找不到libcrfpp.so.0等库文件,解决方案一为(貌似此方法对root用户不管用): 解决方案二为建立以下符号链接: 阅读全文
posted @ 2017-08-28 09:06 杉枫 阅读(1174) 评论(0) 推荐(0) 编辑
摘要:1、前期做好调研,确定做不做。 2、确认做后全力以赴。 3、每天早晨跟进计划,晚上跟进进度。 4、一定程度的自由,让大家有收获。 阅读全文
posted @ 2017-08-24 08:28 杉枫 阅读(139) 评论(0) 推荐(0) 编辑
摘要:1、通过上传到redis,程序通过redis拉取模型,解决问题。 2、问题原因初步思考为windows下模型文件上传到 linux导致,待继续跟进查找。 阅读全文
posted @ 2017-08-23 19:45 杉枫 阅读(151) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/suipingsp/article/details/41822313 阅读全文
posted @ 2017-08-23 11:15 杉枫 阅读(129) 评论(0) 推荐(0) 编辑
摘要:ugc会使互联网繁荣,但依赖大众用户创造的内容质量上会存在参差不齐,这是ugc本身存在的问题。 就拿技术论坛或社区来说,好的内容不少,但质量不好的内容也很多。社区在引导用户发言的同时,也应 对用户创造内容的质量进行引导,说来容易做起来难呀。 一些可用的引导方式: 尽量多曝光好的文章内容,良币驱除劣币 阅读全文
posted @ 2017-08-22 23:40 杉枫 阅读(301) 评论(0) 推荐(0) 编辑
摘要:http://mt.dbanotes.net/review/bi_story.html 阅读全文
posted @ 2017-08-22 22:17 杉枫 阅读(117) 评论(0) 推荐(0) 编辑
摘要:架构问题长期被低估,短期被高估。 改编自Fenng 没有小程序只有小程序员。 杉枫 阅读全文
posted @ 2017-08-22 20:18 杉枫 阅读(122) 评论(0) 推荐(0) 编辑
摘要:http://www.cnblogs.com/zuoxiaolong/p/alg2.html 阅读全文
posted @ 2017-08-22 20:17 杉枫 阅读(297) 评论(0) 推荐(0) 编辑
摘要:1、官网https://stanfordnlp.github.io/CoreNLP/ 2、 待续... 阅读全文
posted @ 2017-08-21 10:41 杉枫 阅读(360) 评论(0) 推荐(0) 编辑
摘要:1、做事情应该讲究谋定而后动,越是紧急重要的事情越要想清楚事情步骤。 2、做事情要花时间思考,不然就是一个执行者,对于团队意义不大。 3、几天的工作要花半天一天规划思考,一天的工作要花一个小时思考。 4、学而不思则罔,思而不学则殆。 5、不要憎恨你的敌人,那样会影响你的判断。 6、好的产品就在手边, 阅读全文
posted @ 2017-08-21 09:22 杉枫 阅读(307) 评论(0) 推荐(0) 编辑
摘要:http://www.ruanyifeng.com/blog/2013/03/tf-idf.html 阅读全文
posted @ 2017-08-19 10:23 杉枫 阅读(128) 评论(0) 推荐(0) 编辑
摘要:<beans xmlns="http://www.springframework.org/schema/beans" xmlns:context="http://www.springframework.org/schema/context" xmlns:xsi="http://www.w3.org/ 阅读全文
posted @ 2017-08-17 17:56 杉枫 阅读(589) 评论(0) 推荐(0) 编辑
摘要:google花费30亿美元像apple购买流量作为iphone默认搜索引擎。 阅读全文
posted @ 2017-08-17 10:50 杉枫 阅读(121) 评论(0) 推荐(0) 编辑
摘要:Exception in thread "main" org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: file [D:\code\voi 阅读全文
posted @ 2017-08-17 09:39 杉枫 阅读(1393) 评论(0) 推荐(0) 编辑
摘要:丁香园CTO冯大辉谈技术团队管理 http://www.infoq.com/cn/interviews/fdh-team-manager http://www.geekpark.net/topics/216589 持续收集... 阅读全文
posted @ 2017-08-16 09:11 杉枫 阅读(184) 评论(0) 推荐(0) 编辑
摘要:1、lucene4.5源码分析系列:lucene概述 http://blog.csdn.net/liweisnake/article/details/10348969 http://www.cnblogs.com/forfuture1978/archive/2010/06/13/1757479.ht 阅读全文
posted @ 2017-08-13 12:07 杉枫 阅读(186) 评论(0) 推荐(0) 编辑
摘要:1、beta版本到production上线,production要发到预发布测试一下避免配置问题导致发布异常。 阅读全文
posted @ 2017-08-11 18:48 杉枫 阅读(241) 评论(0) 推荐(0) 编辑
摘要:1、第一种方式写到公共区域,节点定时拉新,完成需求,缺点不够实时。 2、第二种通过消息队列topic模式来进行更新。 3、第三种通过zk通知更新机制来进行节点数据更新。 阅读全文
posted @ 2017-08-10 11:43 杉枫 阅读(348) 评论(0) 推荐(0) 编辑
摘要:1、逻辑回归LR进行实时离线三级品类训练。 2、通过用户对于实时、离线三级品类的偏好进行召回。 3、通过人的特征、sku特征、人sku交互特征、以及位置手机特征通过gbdt模型进行点击量预估。 阅读全文
posted @ 2017-08-04 16:58 杉枫 阅读(472) 评论(0) 推荐(0) 编辑
摘要:1、tf-idf对文本关键词进行提取作为文章标签。 2、lda模型对文本进行主题聚类。 3、通过用户对于实时、离线历史标签的偏好进行召回。 4、通过人的特征、素材特征、交互特征、以及位置手机特征通过gbdt模型进行点击量预估。 其中分词、特征工程都是其中很重要环节。 阅读全文
posted @ 2017-08-04 16:54 杉枫 阅读(197) 评论(0) 推荐(0) 编辑
摘要:1、由于start.sh 逻辑存在问题。 2、由于预发布逻辑配置存在问题。 阅读全文
posted @ 2017-08-03 09:36 杉枫 阅读(115) 评论(0) 推荐(0) 编辑
摘要:《大规模分布式系统架构与设计实战》 https://github.com/stanzhai/fourinone 阅读全文
posted @ 2017-08-03 08:56 杉枫 阅读(121) 评论(0) 推荐(0) 编辑
摘要:服务端、实时、大数据、AI计算,各种各样的计算,计算机本质是什么,计算机的本质是 利用compute的计算速度为人提供更优的计算结果。 所以实时也好,准实时、离线、AI本质上是两个维度,实时准实时强调计算的速度,大数据 AI强调数据量以及速度。 1、实时计算,扩量的两个方式多线程多核计算,以及多个机 阅读全文
posted @ 2017-08-01 11:28 杉枫 阅读(288) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示