请你一定不要停下来成为你想成为的人
           --Please don't stop to be who you want to be

php 使用 phpword 操作 word 读取 word

思路 

1. 加载word文件。
2. 循环判断加载出来的数据。
( 数据下面有很多个节点 )
( 节点是按照数据的类型分类的 例如 无样式的文本是RunText,换行是TextBreak,表格是table.....等)
3. 循环判断他们的数据类型是什么进行读取。
4. 如果是文本的话就使用 节点->getText() 就直接可以获取到文本内容 表格的话有点麻烦。

关于操作word的一些东西
https://segmentfault.com/a/1190000019479817?utm_source=tag-newest
https://www.cnblogs.com/mengluo/p/10280381.html(本博源于这个博客)



代码
// 准备条件 下载 phpword 的拓展库

// 加载
$source     = IOFactory::load($filePath)->getSections();

foreach ($source as $S)
{
            $elements = $S->getElements();
            if (!empty($this->GetElement($elements)))
            {
                $arr = $this->GetElement($elements);
                $this->todoGo($arr,$tableCatId,$tableStageId,$filePath,$versionId);
            }
}

// 逐级读取/读取节点
function GetElement($elements)
{
        $arrx=[];
        foreach ($elements as $k=>$e1)
        {
            // 获取word对象中对应内容类型类的节点的类名
            $class = $this->getClass($e1);
            if ($class=='Table')
            {
                 // 获取最大行
                 $rows=count($e1->getRows());

                 // 获取最大列
                 $cells=$e1->countColumns();

                 $arrx[$k]['rows']=$rows;
                 $arrx[$k]['cells']=$cells;

                 // 循环获取对应行和列下的单元格的文本内容
                 for($i=0;$i<$rows;$i++)
                 {
                      // 获取对应行
                      $rows_a=$e1->getRows()[$i];
                      for($j = 0; $j < $cells; $j++)
                      {
                           // 获取对应列
                           $x=$rows_a->getCells()[$j];
                           $arrx[$k]['text'][$i+1][$j+1]=$this->getTextElement($x);
                      }
                 }
            }
      }    
}    

//获取文本的节点
function getTextElement($E)
{
        $elements = $E->getElements();
        $xas='';
        $result = [];
        $inResult=[];
        $text=[];

        foreach($elements as $inE)
        {
            $ns = get_class($inE);
            $elName = explode('\\', $ns)[3];

            if($elName == 'Text')
            {
                $result[] = $this->textarr($inE);
            }
            elseif (method_exists($inE, 'getElements'))
            {
                $inResult = $this->getTextElement($inE);
            }

            if(!is_null($inResult))
            {
                $result = array_merge($result, $inResult);
            }
        }
        return count($result) > 0 ? $result : null;
}      

//获取文本
function textarr($e)
{
      $textArr['text']=$e->getText();
     return $textArr;
}     

 

 

posted on 2019-08-09 13:51  刘宽宇  阅读(12658)  评论(1编辑  收藏  举报

导航