摘要:
今天工作中碰到分词问题的分析。问题是“上海人”分词为“上海”和“人”两个最小单元,还是以“上海人”为最小单元?分词的原文如下:“3月23日,早餐后前往豪尔赫机场,搭乘9点15分的阿航AR1874次航班波音737客机,3个多小时后,中午12点25分到达了埃尔卡拉法特机场,今天我们将要游览心仪已久的莫雷诺大冰川。地接导游王强是个上海人,他将陪伴着我们走完在阿根廷境内的所有游程。”由此,引出一个话题,搜索是基于文本的搜索还是基于信息的搜索。基于文本的搜索就是,对众多文章进行文本的拆分,拆分后的文本建立索引,在用户进行搜索的时候,将用户输入的文本进行进行拆分,并将这些拆分后的文本在索引中匹配。基于文本 阅读全文
摘要:
工作环境:1、宿主机:win72、客户机:centos 版本64,32位(本人使用网上下载的iso镜像进行安装)3、virtualBox版本:4.1.22 r80657客户机必装软件1、centos随盘提供的安装包kernel-headers,kernel-devel和gcc2、virtualBox的“安装增强功能所”所提供的安装软件安装centos随盘提供的安装包步骤1:打开centos终端步骤2:运行命令yum install kernel-headers kernel-devel步骤3:运行命令yum install gcc安装virtualBox的“安装增强功能所”所提供的安装软件 1 阅读全文