发现一个时隐时现的bug!
在awk里可以这样使用正则:
#截取 a.cn?fr=1211 中的1211 if(match(url,/fr=[0-9]+/) > 1) { fr = substr(url,RSTRART + 3, RLENGTH - 3 ) } #截取 a.cn?ct=test 中的test if(match(url,/ct=[a-zA-Z]+/) > 1) { fr = substr(url,RSTRART + 3, RLENGTH - 3) }
这样就导致一个需求:复用这些相似的代码 (我终于也培养成了代码洁癖 T_T)那么最先想到的是写成函数,到处调用。首先是功能模块:
# 文件: logic/parser.awk # 功能: 从str里找到指定的标记,并返回这个整个或部分标记 # 参数: str 需要搜索的字符串 # flag 查找的字符串 # offset 偏离量,调用时不传递的话当作0来使用 # 返回值: 匹配上的字符串 function getflag(str, flag, offset, __ARGVEND__) { if(match(str, flag) > 1) { return substr(str, RSTART + offset, RLENGTH - offset) } else { return "" } }
然后是调用:
@include logic/parser.awk url = "a.cn?fr=1211" fr = getflag(url, "fr=[0-9]+", 3)
看起来很美妙,代码终于变得干净了,起初看起来也都能工作,但是很快会发现使用这个模块的程序会内存泄漏,我之前也知道awk低于3.17的版本会泄漏,但是这个泄漏,也不一定总是发生,某次特意去测的时候就没有发现,当我逐次注释代码时终于发现:当程序里只有一个getflag调用语句时没有泄漏(似乎倒是不在乎在循环里调用多次),但多于一个调用语句,就发生了内存泄漏了,因为这种问题比较难排查,所以记录一下,用作将来的参考
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· .NET周刊【3月第1期 2025-03-02】
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· [AI/GPT/综述] AI Agent的设计模式综述