php 使用jieba-php分词库实现中文分词
jieba-php是一个基于jieba算法的PHP分词库,它是Python中非常流行的一个分词工具。以下是如何使用jieba-php进行分词的示例:
- 通过composer安装包:
composer require fukuball/jieba-php - php的使用方法如下:
<?php // 自动加载Composer的类 require_once "./vendor/autoload.php"; // 引入命名空间 use Fukuball\Jieba\Jieba; use Fukuball\Jieba\Finalseg; // 设置内存限制,因为分词可能需要较多内存 ini_set('memory_limit', '1024M'); $start_memory = memory_get_usage(); // 初始化jieba和Finalseg Jieba::init(); Finalseg::init(); // 待分词的字符串 $text = "资深PHP工程师"; // 进行分词,默认模式 $seg_list = Jieba::cut($text); print_r($seg_list); // 全模式分词,返回所有可能的词语 $seg_list_all = Jieba::cut($text, true); print_r($seg_list_all); // 搜索引擎模式分词,粒度更细 $seg_list_for_search = Jieba::cutForSearch($text); print_r($seg_list_for_search); $end_memory = memory_get_usage(); $use_mem = ($end_memory - $start_memory) / 1024 / 1024; var_dump($use_mem); die;
输出结果:
Array ( [0] => 资深 [1] => PHP [2] => 工程师 ) Array ( [0] => 资深 [1] => 工程 [2] => 工程师 ) Array ( [0] => 资深 [1] => PHP [2] => 工程 [3] => 工程师 ) float(279.49800872803)
本文来自博客园,作者:Carvers,转载请注明原文链接:https://www.cnblogs.com/carver/articles/18602789

浙公网安备 33010602011771号