提取文本中的单词,单词简单排序
首先需要解决的是从文本中提取出每个单词,那么如何提取比较准确呢?
定义一个二维数组,用来存放提取出来的单词,每行存放一个单词;
从第一行开始,把第一个字符放入数组中,如果第一个字符不是字母,继续把第二个字符放入第一个字符位置,依次这样,直到第一个位置放的是字母字符为止,如果下一次放的是字母字符,则继续添加下一个,如果不是,说明从第一个位置到当前位置是一个单词,应该在当前位置加入 ‘\0’ (字符串结束标志)进行下一行;
然后就是字符串的简单比较,字符串的比较用 strcmp 函数 , 调用 qsort 函数即可 ;
#include<iostream> #include<string.h> #include<string> #include<stdio.h> #include<ctype.h> #include<algorithm> #include<iostream> using namespace std ; int cmp(const void *s1 , const void *s2) { char *_s1 = (char *)s1 ; char *_s2 = (char *)s2 ; return strcmp(_s1,_s2) ; } char word[510000][210]; int main() { int i = 0 , j = 0 ; char c ; while( (c = getchar()) != EOF ) { c = tolower(c) ; word[i][j] = c ; if(!isalpha(c) && isalpha(word[i][0])) { word[i][j] = '\0' ; j = 0 ; i++ ; continue ; } if(isalpha(c) && isalpha(word[i][0])) j++ ; } qsort(word,i,sizeof(word[0]),cmp) ; for(int k = 0 ; k < i ; k++) if(strcmp(word[k],word[k-1]) != 0 ) cout << word[k] << endl ; return 0 ; }