摘要: ## Abstract 本文:Debin 任务: recovering symbol names, types and locations 方法:use scalable structured prediction algorithms in probabilistic graphical mode 阅读全文
posted @ 2023-06-22 15:29 雪溯 阅读(10) 评论(0) 推荐(0) 编辑
摘要: ## Abstract 本文: 工具:DIRE(Decompiled Identifier Renaming Engine) 任务:variable name recovery 方法:使用词法和结构信息计算概率 提出数据集:164632 unique x86-64 binaries C projs 阅读全文
posted @ 2023-06-22 15:28 雪溯 阅读(6) 评论(0) 推荐(0) 编辑
摘要: ## Abstract 背景: 挑战:unlike words in natural language, most function names occur only once. 本文: 1. XFL(extreme function labeling) - 任务:为binary functions 阅读全文
posted @ 2023-06-22 07:56 雪溯 阅读(33) 评论(0) 推荐(0) 编辑
摘要: ## Abstract 本文 工具: DOBF 任务:pretraining objective to recover the original version of obfuscated source code 方法:利用编程语言的结构信息 实验: 效果: 1. 在多个下游任务上显著好过已有成果 阅读全文
posted @ 2023-06-22 07:53 雪溯 阅读(21) 评论(0) 推荐(0) 编辑
摘要: ## Abstract 本文: 工具: punstrip 任务:恢复stripped binary的函数名称 方法:基于特征工程的probabilistic fingerprint with a probabilistic graphical model来学习函数名称于程序结构之间的关系 实验: 数 阅读全文
posted @ 2023-06-22 07:53 雪溯 阅读(10) 评论(0) 推荐(0) 编辑
摘要: ## Abstract 本文: 工具:DEGUARD 任务:reversing layout obfuscation(重命名class, package和method) 具体包括 1. reverse the layout obfuscation 2. 预测APKs引用的库 3. 重命名程序中的一些 阅读全文
posted @ 2023-06-22 07:52 雪溯 阅读(7) 评论(0) 推荐(0) 编辑
摘要: ## Abstract 背景: 逆向工程的挑战:stripped binary中语义信息很少,且不同的代码优化为assembly code patterns带来了很大差异 本文: 工具: Nero 方法:使用静态分析获取call sites的特征,结合control-flow graph中的call 阅读全文
posted @ 2023-06-22 07:51 雪溯 阅读(12) 评论(0) 推荐(0) 编辑
摘要: ## Abstract 本文:探索LLM在source code上pretrain时的subtokenization效果。 subtokenization: split long tokens into smaller subtokens, in order to ensure the relati 阅读全文
posted @ 2023-06-22 06:16 雪溯 阅读(4) 评论(0) 推荐(0) 编辑