博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2013年10月14日

摘要: Ogg全称是OGG Vorbis, 是一种类似MP3的音乐格式,但相比mp3有更多优势,而且将越来越流行。MP3是有损压缩,相比标准cd有损失;ogg也是有损失的压缩,但采用的压缩技术让损失比率远比MP3压缩小;MP3格式是受专利保护的,但ogg是完全开放和免费的。ogg在和mp3相同音质的情况下,ogg文件大小比mp3文件小,所以ogg体积较小的情况却能和mp3皮媲美音质;ogg具有一个设计良好、灵活的注释,避免了象MP3文件的id3记那样烦琐的操作;Vorbis还具有位速率缩放,可以不用重新编码便可调节文件的位速;同样流行软件对ogg支持也很好。ogg按比特率分有各种等级,为q-2到q10 阅读全文

posted @ 2013-10-14 17:37 虾米服务器开发团队 阅读(2111) 评论(0) 推荐(0)

摘要: 最近一直在弄性能调优的事情,虽然效果不是很好也值得认真总结一下,条目很多以后会逐渐完善1.top通过top可以看到进程cpu,mem,load通过top -H -p pid还可以看到进程的每个线程资源使用情况,找到资源使用较多的线程,并找相应逻辑代码进行优化,或是增加该逻辑的线程数,这次优化的时候就用到了,本来io和逻辑线程数是随意设置的,但是通过该命令发现io线程cpu其实一直未吃满,可以适当减少(io本来应该暂用cpu不多),而逻辑线程的cpu使用非常较高,应该增加线程数和优化相关代码2.psps -mp pid-o THREAD,tid,time配合pstack pid得到效果可以gdb 阅读全文

posted @ 2013-10-14 16:05 虾米服务器开发团队 阅读(550) 评论(0) 推荐(0)

摘要: 现状及总结目前的推荐系统感觉已经到了一个瓶颈期。之前的推荐规则相对来说,还是比较粗放式的方式。如果想把推荐系统,再推上一个台阶,则需要更精细的数据挖掘(包括对音乐本身的数据挖掘和用户行为的数据挖掘)。1、 目前我们对用户行为的数据使用得太少。之前的推荐主要依赖的用户数据是用户的收藏行为。在音乐的产品中,收藏行为看作一种重要的行为是没问题的。但是如果只考虑收藏的话,是不对的,会存在很多问题。首先是用户的冷启动的问题,因为每个用户在刚来我们虾米网之后,用户的行为数据是零。现在的做法是前端用强制的方式放用户去收藏了几个艺人或者歌曲,这只能是治标不治本的做法,甚至有点流氓,因为用户有权不收藏任何东西。 阅读全文

posted @ 2013-10-14 13:51 虾米服务器开发团队 阅读(297) 评论(0) 推荐(0)

2013年10月13日

摘要: LDA是主题模型(Topic Model)中较简单的一种,由David Blei在2003年提出[1]。作为一种生成模型(Generative Model),它将文档视为多个Topic的混合,每个Topic可由语料库中词的分布来表示。与另一种类似模型pLSA,最大的不同是LDA假设Topic的分布存在有一个Dirichlet先验分布。作者在论文中提出LDA也遵从Bag-of-Words的假设,但也是可能推广至n-grams... 阅读全文

posted @ 2013-10-13 20:45 虾米服务器开发团队 阅读(730) 评论(0) 推荐(0)