提取文本中的单词,单词简单排序

首先需要解决的是从文本中提取出每个单词,那么如何提取比较准确呢?

  定义一个二维数组,用来存放提取出来的单词,每行存放一个单词;

  从第一行开始,把第一个字符放入数组中,如果第一个字符不是字母,继续把第二个字符放入第一个字符位置,依次这样,直到第一个位置放的是字母字符为止,如果下一次放的是字母字符,则继续添加下一个,如果不是,说明从第一个位置到当前位置是一个单词,应该在当前位置加入 ‘\0’ (字符串结束标志)进行下一行;

然后就是字符串的简单比较,字符串的比较用 strcmp 函数 , 调用 qsort 函数即可 ;

#include<iostream>
#include<string.h>
#include<string>
#include<stdio.h>
#include<ctype.h>
#include<algorithm>
#include<iostream>
using namespace std ;

int cmp(const void *s1 , const void *s2)	{
	char *_s1 = (char *)s1 ;
	char *_s2 = (char *)s2 ; 
	return strcmp(_s1,_s2) ;
}

char word[510000][210];  

int main()	{
	int i = 0 , j = 0 ;
	char c ;
	while( (c = getchar()) != EOF )	{
		c = tolower(c) ;
		word[i][j] = c ;
		if(!isalpha(c) && isalpha(word[i][0]))	{
			word[i][j] = '\0' ;
			j = 0 ;
			i++ ;
			continue ;
		}
		if(isalpha(c) && isalpha(word[i][0]))
			j++ ;
	}
	qsort(word,i,sizeof(word[0]),cmp) ;
	for(int k = 0 ; k < i ; k++)
		if(strcmp(word[k],word[k-1]) != 0 )
			cout << word[k] << endl ;
	return 0 ;
}

 

posted @ 2014-04-10 17:18  NYNU_ACM  阅读(234)  评论(0编辑  收藏  举报