如何把一个TXT文本文件按行数分割成多个文本文件
网上有很多文本分割软件都是按字节大小来分割的,主要用于小说类的文本分割,对于比较有规则的内容按行数进行分割非常不方便,所以我写了一个按行数把文本文件分割成多个文本文件
主要作用:比如您获取上万个长尾关键词,你想通过随机的方式调用100条或者50条。假如是只有一个文本文件(上万行),你需要读取该文件所有行到数组,然后打乱数组,读取前50条,效率非常低。
而你把该文本文件用分割器分割成1.txt 2.txt…… 100.txt(随机打乱了行数),那么你只要先随机从1-100中产生一个随机数
然后读取该随机数文本(比如55对应 55.txt),是不是效率很高呀。
<?php
// txt按行无序分割器
$fileName = "1.txt"; //源TXT文件
$start=1; //分割TXT初始值
$num=10; //每个TXT多少行
$content = file_get_contents($fileName);
//$content =iconv("UTF-8", "gb2312//IGNORE",$content); //如果原TXT为UTF-8编码,请取消注释
$contents = explode("\r\n",$content);
shuffle($contents); //打乱顺序
$countcount = count($contents);
echo $count;
$newcontents='';
$j=0;
for($i=0;$i<$count;$i++){
$newcontents.=$contents[$i]."\r\n";
if ((($i % $num==0) && $i<>0) || ($i==$count-1) )
{
$handle=fopen("txt/".($start+$j).".txt",'w');
fwrite($handle,$newcontents);
fclose($handle);
$j++;
$newcontents='';
}
}
?>
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· 什么是nginx的强缓存和协商缓存
· 一文读懂知识蒸馏
· Manus爆火,是硬核还是营销?