AzkaBan  

2019年5月8日

摘要: 编译器 链接器 加载器 1. 编译器/汇编器 按条件编译,将汇编转为机器语 .o文件 gcc -o 可重定位文件: 静态加载共享文件: 可静态加载与动态加载可执行文件: 直接载入内存 静态库: 打包目标文件的集合动态库: 动态,共享加载 2. 链接器 使编译 使用分离。静态库搜索路径(由静态链接器负 阅读全文
posted @ 2019-05-08 15:26 AzkaBan 阅读(128) 评论(0) 推荐(0) 编辑
 
摘要: 强化学习 通过价值选行为: DEEP Q NETWORK 价值直接选行为: POLICY GRADIEND 概率想象环境并学习: MODEL BASED RL 以上都可以用于不理解环境与理解环境两种模式,区别在于, model-free依靠一步一步对环境的反馈学习, model-base预先模拟所有 阅读全文
posted @ 2019-05-08 15:24 AzkaBan 阅读(335) 评论(0) 推荐(0) 编辑