source标签下的src属性中的url
$html = '<source src="http://live.aikan.miguvideo.com/envivo_w/2018/SD/imezone=UTC"></source>';
正则表达式
/<source\s+[^>]*?src="(.*?)"[^>]*>/i
<source\s+:匹配<source标签开头,后面跟着一个或多个空白字符。
[^>]*?:非贪婪地匹配任何不是>的字符,直到遇到src属性。
src="(.*?)":匹配src=",然后捕获双引号内的任何字符(非贪婪地),直到遇到下一个双引号。这里的(.*?)是一个捕获组,用于存储匹配到的src属性的值。
[^>]*>:非贪婪地匹配任何不是>的字符,直到遇到标签的结束>。
/i:修饰符,表示不区分大小写。
php使用
$html = '<source src="http://live.aikan.miguvideo.com/envivo_w/2018/SD/imezone=UTC"></source>';
if (preg_match('/<source\s+[^>]*?src="(.*?)"[^>]*>/i', $html, $matches)) {
echo $matches[1];
}
python实现
import re
html = '<source src="http://live.aikan.miguvideo.com/envivo_w/2018/SD/imezone=UTC"></source>';
matches = re.match('<source\s+[^>]*?src="(.*?)"[^>]*>', html);
print(matches.group(1));