会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
苦苦挣扎的咸鱼
做人如果没有理想,跟咸鱼有什么区别
博客园
首页
新随笔
联系
订阅
管理
2010年12月2日
C#读取中文字符及清空缓冲区
摘要: 有一个txt的中英文语料库文件,内容是英文一句中文一句相间的,共3000行,需要把英文句和中文句分开,放在单独的txt文件中。开时始,得到的中文文件中的字符是乱码的,鸟符号看的头晕。于是就细究streamreader读取的编码格式,默认的编码是ascii,单字节的,就尝试utf8,乱码;尝试gb2312,OK!可另一个问题又出现了,得到的两个文件的行数都不到1500行,尝试N次还是不行,很郁闷。g...
阅读全文
posted @ 2010-12-02 17:28 清流鱼
阅读(2558)
评论(0)
推荐(0)
编辑
公告