1、tf-idf对文本关键词进行提取作为文章标签。
2、lda模型对文本进行主题聚类。
3、通过用户对于实时、离线历史标签的偏好进行召回。
4、通过人的特征、素材特征、交互特征、以及位置手机特征通过gbdt模型进行点击量预估。
其中分词、特征工程都是其中很重要环节。