Live2D

PHP中文分词快速实现

使用php的中文分词的composer:https://packagist.org/packages/liliuwei/liliuwei-pscws4

如果电脑的镜像没有使用国内镜像,推荐使用最新的 Composer 版本。

阿里云composer镜像与 Packagist 官方实时同步,
所有项目都会使用该镜像地址:

composer config -g repo.packagist composer https://mirrors.aliyun.com/composer/

取消配置还原到默认的地址:

composer config -g --unset repos.packagist

 

然后使用命令拉取分词的composer包:

composer require liliuwei/liliuwei-pscws4

 

使用:先引入分词类,然后实例化对象并使用

use liliuwei\pscws4\PSCWS4API;//引入分词类

$text = 'wekyun博客是一个分享开发中一些应用技术的博客!';

$pscws = new PSCWS4API('utf8');
$pscws->PSCWS4($text); //获取所有分词
$res = $pscws->PSCWS4_TOP($text, 4); //返回分词结果的词语按权重统计的前个4词

var_dump($res);

对分词进行自定义的扩展请阅读:对php的pscws4中文分词进行分词和关键词扩展 - wekyun - 博客园 (cnblogs.com)

posted @ 2021-12-10 13:29  wekyun  阅读(1026)  评论(0编辑  收藏  举报