7月4日 和楠铠,岚韬讨论热度趋势算法(17号交算法)。算法内容如下:
(1)热度趋势(热度值)分报社(40%)和社交媒体(60%)两方面计算。
其中,报社的热度值是根据报社权威度*新闻发布数量计算得出,社交媒体的热度值是根据使用话题动态*点赞量*权值+评论量*评论点赞量*权值计算得出。
    报道量分析(报社方面)
    关注量分析 (社交媒体方面)
    (2)国民评论排序(评论时间(权值最重)+关注人数+点赞量)

(7月23日)热度趋势算法格式如下:

   

先给定一个事件,该事件的所有新闻列表(按新闻里事件的发生时间(没有的话用发布时间)排序(时间越早越排在前面))里:

针对该事件:

         事件id(和mongodb里的事件id对应):

         针对同一天的所有新闻:

                            (事件的发生时间)发布时间(pub_time):  

                            针对每篇新闻:

               新闻id:{

              所属报社域名(domain):(我还想要一份报社和其域名的对应名单,.txt格式)

               报道量:

                                                }

         格式如下:

         {事件id:{(该事件发生时间)发布时间(日期形式):,”新闻”:{新闻id:{所属报社域名(domain):,报道量:}},{新闻id:{所属报社域名(domain):,报道量:}}},{},。。。,{}}   # {}里的为(该事件发生时间)发布时间为同一天里的所有新闻。

 

twitters:(按twitter动态里事件的发生时间(没有的话用twitters动态的发布时间排序(时间越早越排在前面))

针对该事件:

         事件id(和mongodb里的事件id对应):

         针对同一天的所有动态:

    (该事件发生时间)发布时间(日期形式):

    ”动态”:

               针对每条动态:

      id:{

                              点赞量:

        ”评论”:

         针对每条评论:

           id:{

              点赞量:

            }

                             }

         格式如下:

         {事件id:{(该事件发生时间)发布时间(日期形式):,”动态”:{动态id:{点赞量:,”评论”:{评论id:{点赞量:},{},。。。,{}} },{动态id:。。。},…,{}},{},。。。,{}  }   # {}里的为(该事件发生时间)发布时间为同一天里的所有twitters动态。

 

7月26日2:25 完成代码。