Bookmark and Share

Lee's 程序人生

HTML CSS Javascript XML AJAX ATLAS C# C++ 数据结构 软件工程 设计模式 asp.net Java 数字图象处理 Sql 数据库
  博客园  :: 首页  :: 新随笔  :: 联系 :: 管理

转:分词?Dz提供免费Webservice?

Posted on 2009-10-12 19:16  analyzer  阅读(454)  评论(0编辑  收藏  举报
PHP代码
  1. <?php   
  2.   
  3. //强制使用字符集   
  4.   
  5. @header('Content-Type: text/html; charset=gbk');   
  6.   
  7. $subjectenc ='用“超级站长”安装Discuz!和UCHome,超级简单!';  //这是标题   
  8.   
  9.   
  10.   
  11. $messageenc = preg_replace("/\[.+?\]/U"'''用“超级站长”安装Discuz!和UCHome,超级简单!');  //这是内容   
  12.   
  13.   
  14.   
  15. //从内容中找标题中有TAG;   
  16.   
  17. $data = @implode('', file("http://keyword.discuz.com/related_kw.html?title=$subjectenc&content=$messageenc&ics=gbk&ocs=gbk"));//把标题和内容发送到dz官方去找   
  18.   
  19. if($data) {   
  20.   
  21. $parser = xml_parser_create();//建立一个 XML 解析器   
  22.   
  23. xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0);   
  24.   
  25. xml_parser_set_option($parser, XML_OPTION_SKIP_WHITE, 1);   
  26.   
  27. xml_parse_into_struct($parser$data$values$index);//将 XML 数据解析到数组中   
  28.   
  29. xml_parser_free($parser);   
  30.   
  31. $kws = array();   
  32.   
  33. foreach($values as $valuearray) {   
  34.   
  35.   if(in_array($valuearray['tag'],array('kw','ekw'))) {   //kw ekw是什么意思?   
  36.   
  37.     $kws[] = iconv('utf-8','gbk',$valuearray['value']);//编码转换   
  38.   
  39.    }   
  40.   
  41. }}   
  42.   
  43. //最后出来的是数组.   
  44.   
  45. print_r($kws);   
  46.   
  47. ?>   


我要啦免费统计