2013-6 阿里技术沙龙:标签生成与推荐系统

倪江峰 伯隅@阿里的分享:标签、推荐、导购

0.27%的关键字占50%PV,以标签作为中间环节

标签为四种:品牌,品类,描述,属性

标签数据库:标题、结构化数据、详情

产品词挖掘:CRF模型

商品结构化属性:半开放式结构

描述词整理:LDA模型

不同类型的词之间的关系挖掘

机器标签---场景导购

标签市场化----买卖双方的标签消费

标签个性化

结合可视化做场景发现

目前这个标签系统仅做导购入口,与检索搜索无关----主要给商品更多的流量入口渠道

------------------------------------------

杨宇航@百度:推荐技术在UGC产品中的应用

领域业务主体可以考虑本体模型方式建模

豆瓣曾工程师的分享:NIP与豆瓣标签

标签是一种有意义的片段

用简化的方式描述对象

标签预测,用户画像,标签推荐

标签的提取

内部领域词库,使用n-gram生成候选词

词的内部独立性与外部独立性

词性标准---标签选择,词频特征

TF/IDF,TextRank,基于图的排序算法

主题模型:精度高但费时

DNN:WordZrec工具包

标签树有助于扩类别的推荐

Latent Factor:隐次特征

posted @   _朝晖  阅读(398)  评论(0编辑  收藏  举报
编辑推荐:
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
阅读排行:
· 单线程的Redis速度为什么快?
· 展开说说关于C#中ORM框架的用法!
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Pantheons:用 TypeScript 打造主流大模型对话的一站式集成库
· SQL Server 2025 AI相关能力初探
点击右上角即可分享
微信分享提示
主题色彩