摘要: 题目:实现一个字典树 注: 使用字典结构来存储,每层都是一个字典,存储此层所有的元素(包括字典)。每个元素存储方式也为一个字典,key为字符和一个标记end_of_word,表示该字符是否为一个单词的结束。插入操作时,遍历要插入词的每个字符,如果在字典树中找不到,则将该字符插入字典树,默认值为{}, 阅读全文
posted @ 2019-08-19 22:01 尘世中一个迷途小书童 阅读(131) 评论(0) 推荐(0) 编辑
摘要: 题目:求整数n的平方根 注: 方法加了改进,参数增加了精确度。本题还有个小技巧,为了防止可能输入的整数过大的问题,在判读mid*mid与n的大小时,使用mid与n/mid进行判断。 阅读全文
posted @ 2019-08-19 21:20 尘世中一个迷途小书童 阅读(126) 评论(0) 推荐(0) 编辑
摘要: 题目:输入括号对数n,返回合法的括号形式 注: 使用递归来做,用left,right分别表示左右括号的使用数量。当两者使用数量为n时,表示已经找出一种情况。如果left小于n,则可以继续加入'(';右括号的情况不仅要小于n,还需要保证right<left,才能保证最终括号的合法性。 阅读全文
posted @ 2019-08-19 21:02 尘世中一个迷途小书童 阅读(122) 评论(0) 推荐(0) 编辑
摘要: 平衡二叉树(AVL树) 平衡二叉树具有以下性质:它是一棵空树或它的左右两个子树的高度差的绝对值不超过1,并且左右两个子树都是一棵平衡二叉树。 作用:当原序列有序时,提高搜索效率。 平衡因子:平衡二叉树中不存在平衡因子大于 1 的节点。在一棵平衡二叉树中,节点的平衡因子只能取 0 、1 或者 -1。 阅读全文
posted @ 2019-08-19 19:57 尘世中一个迷途小书童 阅读(1355) 评论(0) 推荐(0) 编辑
摘要: 主要实现批量文本中相关信息的提取。涉及手机号,姓名,相关日期,金额。 1、本项目是作为一个服务接口,使用Python开发,对方采用Java从MySQL数据库中读取批量文本信息,然后调用本接口服务,解析出相关的字段信息。跨语言平台间数据交互采用HTTP的方式。 服务端采用Flask框架,对方先将文本信 阅读全文
posted @ 2019-08-19 11:20 尘世中一个迷途小书童 阅读(535) 评论(0) 推荐(0) 编辑
摘要: 系统实现的功能:在线提取文本的关键词、短语、摘要、计算文本间的相似度 总结: 1、中文关键词、摘要的提取使用textrank4zh库中的TextRank4Keyword、TextRank4Sentence;英文使用NLTK 2、计算文本相似度,采用同义词词林和词向量结合使用。 3、关键词、摘要、相似 阅读全文
posted @ 2019-08-19 11:12 尘世中一个迷途小书童 阅读(248) 评论(0) 推荐(0) 编辑
摘要: 1、爬虫框架Scrapy比较好用,默认多线程,各模块分离。还可以用Requests+BeautifulSoup进行爬取。 2、反爬问题。添加header列表,IP地址池,每次爬取暂停一段时间。 3、Scrapy解析网页Xpath,比BeautifulSoup易读性强。 线程数量设置规则: 1. CP 阅读全文
posted @ 2019-08-19 11:00 尘世中一个迷途小书童 阅读(522) 评论(0) 推荐(0) 编辑