Loading

php 使用jieba-php分词库实现中文分词

jieba-php是一个基于jieba算法的PHP分词库,它是Python中非常流行的一个分词工具。以下是如何使用jieba-php进行分词的示例:

  1. 通过composer安装包:
    composer require fukuball/jieba-php
  2. php的使用方法如下:
    <?php
    // 自动加载Composer的类
    require_once "./vendor/autoload.php";
    
    // 引入命名空间
    use Fukuball\Jieba\Jieba;
    use Fukuball\Jieba\Finalseg;
    
    // 设置内存限制,因为分词可能需要较多内存
        ini_set('memory_limit', '1024M');
        $start_memory = memory_get_usage();
        // 初始化jieba和Finalseg
        Jieba::init();
        Finalseg::init();
    
        // 待分词的字符串
        $text = "资深PHP工程师";
    
        // 进行分词,默认模式
        $seg_list = Jieba::cut($text);
        print_r($seg_list);
    
        // 全模式分词,返回所有可能的词语
        $seg_list_all = Jieba::cut($text, true);
        print_r($seg_list_all);
    
        // 搜索引擎模式分词,粒度更细
        $seg_list_for_search = Jieba::cutForSearch($text);
        print_r($seg_list_for_search);
    
        $end_memory = memory_get_usage();
        $use_mem    = ($end_memory - $start_memory) / 1024 / 1024;
        var_dump($use_mem);
        die;

     

    输出结果:
    Array
    (
        [0] => 资深
        [1] => PHP
        [2] => 工程师
    )
    Array
    (
        [0] => 资深
        [1] => 工程
        [2] => 工程师
    )
    Array
    (
        [0] => 资深
        [1] => PHP
        [2] => 工程
        [3] => 工程师
    )
    float(279.49800872803)
posted @ 2024-12-12 15:50  Carvers  阅读(140)  评论(0)    收藏  举报