摘要: 1.取出第一行内容放入content[] 2.按类型提取数据 3. 提取关键词 4.将所提取的关键词输出为文件 5.存在的问题 que::textrank算法会先将输入的内容进行分词,在第一级将每条评论的文本提取出来后,第二级提取所有关键词的关键词时,词与词之间已经用空格分开了。这样是否合理? -- 阅读全文
posted @ 2019-09-22 23:30 Thinking-in-life 阅读(1205) 评论(0) 推荐(0) 编辑
摘要: 在创建词频矩阵时,由于数据量很大,在转化为矩阵的toarray()过程中出现了memory error。 开始以为是电脑内存太小,后来尝试了设置虚拟内存、借室友的大电脑、甚至从gpu上跑都不行。!!!哭了 后来看到了https://jingyan.baidu.com/article/a65957f4 阅读全文
posted @ 2019-09-10 11:00 Thinking-in-life 阅读(1007) 评论(0) 推荐(0) 编辑
摘要: 问题描述: 八皇后问题是一个以国际象棋为背景的问题:如何能够在 8×8 的国际象棋棋盘上放置八个皇后,使得任何一个皇后都无法直接吃掉其他的皇后?为了达到此目的,任两个皇后都不能处于同一条横行、纵行或斜线上。 回溯法: 回溯法又称试探法。回溯法的基本做法是深度优先搜索。即从一条路往前走,能进则进,不能 阅读全文
posted @ 2018-05-20 21:38 Thinking-in-life 阅读(14519) 评论(0) 推荐(1) 编辑
摘要: (一)单源最短路径算法 1. Dijksta算法 要求图G(V,E)的所有边的权重都为非负值。 运用了贪心算法的思想,但是较好地的是,其找到的解一定是最优解。 算法主要思想: 用数组d[]表示开始节点A到其余节点的路径长度;用w(u,v)表示节点u到v的权值,若两节点无直接路径,则该值为无穷大;矩阵 阅读全文
posted @ 2018-05-14 20:51 Thinking-in-life 阅读(2827) 评论(0) 推荐(0) 编辑