2011年6月5日

【IT面试题007】英语字符串的分词程序

摘要: /*给你一个没有间隔的字符串“thisisasentence”,如何将他分割成如下的句子:“this is a sentence”。提供一个函数用来检验一个字符串是不是单词:bool dic(char* w);完成下列的函数。要求效率尽可能快。bool Detect(char* str){}尽量写出完整思路,最好有伪代码。提示: 递归,回溯。这里使用最长单词优先匹配 + 深度优先搜索+回溯的方法解决此问题。其中数据来源为一篇普通的英文文字,测试时大概有几千个英文单词,先进行预处理,得到长字符串和单词词典。在实现时,由于使用的是stl的string,接口和题目中给出的有所处理,但不影响解决该问题 阅读全文

posted @ 2011-06-05 21:49 speedmancs 阅读(1060) 评论(0) 推荐(0) 编辑

导航