PHP中文分词快速实现
使用php的中文分词的composer:https://packagist.org/packages/liliuwei/liliuwei-pscws4
如果电脑的镜像没有使用国内镜像,推荐使用最新的 Composer 版本。
阿里云composer镜像与 Packagist 官方实时同步,
所有项目都会使用该镜像地址:
composer config -g repo.packagist composer https://mirrors.aliyun.com/composer/
取消配置还原到默认的地址:
composer config -g --unset repos.packagist
然后使用命令拉取分词的composer包:
composer require liliuwei/liliuwei-pscws4
使用:先引入分词类,然后实例化对象并使用
use liliuwei\pscws4\PSCWS4API;//引入分词类
$text = 'wekyun博客是一个分享开发中一些应用技术的博客!';
$pscws = new PSCWS4API('utf8');
$pscws->PSCWS4($text); //获取所有分词
$res = $pscws->PSCWS4_TOP($text, 4); //返回分词结果的词语按权重统计的前个4词
var_dump($res);
对分词进行自定义的扩展请阅读:对php的pscws4中文分词进行分词和关键词扩展 - wekyun - 博客园 (cnblogs.com)
本文来自博客园,作者:wekyun,转载请注明原文链接:https://www.cnblogs.com/wekyun/articles/15671302.html