php 正则匹配URL
Amazon Goods URL;
$url_array = [
'https://www.amazon.com/dp/B073CNGGWR?aaxitk=Wthh1MTV7dbwcbCGO506iw&pd_rd_i=B073CNGGWR&pf_rd_m=ATVPDKIKX0DER&pf_rd_p=3930100107420870094&pf_rd_s=desktop-sx-top-slot&pf_rd_t=301&pf_rd_i=tx&hsa_cr_id=8370788670301&sb-ci-n=asinImage&sb-ci-v=https%3A%2F%2Fimages-na.ssl-images-amazon.com%2Fimages%2FI%2F41pNbzhboEL.jpg&sb-ci-a=B073CNGGWR',
'https://www.amazon.com/Mysticbags-Waterproof-Backpack-Primary-Students/dp/B071D37XQD/ref=sr_1_1_sspa?s=apparel&ie=UTF8&qid=1534865412&sr=1-1-spons&nodeID=7141123011&psd=1&keywords=book&psc=1',
];
// 通过正则获取 https:// 至 /dp/ 到 / 之间的字符串;
通过以下代码实现:
$preg = '/https:\/\/www.[^\s*]*\/dp\/\w*(\/|\?)/i';
foreach ($url_array as $index => $v)
{
preg_match_all($preg, $v, $matche);
$url_result_data[] = $matche[0][0];
}
dd($url_result_data);
echo :
array:2 [▼
1 => "https://www.amazon.com/dp/B073CNGGWR?"
2 => "https://www.amazon.com/Mysticbags-Waterproof-Backpack-Primary-Students/dp/B071D37XQD/"
]
正则相关注意知识点:
\ 为转义
\S 除了空白字符以外的任何一个字符
* 匹配0~n 次其前面的原子,
\w 匹配任意一个数字、字母、下划线 等价于 [0-9A-Za-z_]
\W 匹配非 \w
| 匹配两个或多个分支选择
() 作为模式单元使用,将多个原子组成大的原子,被当做一个独立的单元使用。 eg: /(very)*good/ 可以匹配 good, very good, very very very good, 或者 very very ...... good,
. 匹配目标中的任何一个字符,包括不可打印字符,匹配除了换行符之外的任何一个字符。 eg: /a.b/ 匹配 a 到 b 之间有任意一个字符的字符串 例如: axb,atb,acb,azb等等
分类:
PHP
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~