什么是 LLVM intrinsic

LLVM 支持 “intrinsic function” 的概念。这些函数具有众所周知的名称和语义,并且需要遵循某些限制。总的来说,这些 intrinsic 代表 LLVM 语言的扩展机制,在添加到语言 (或者位码读取器/写入器、解析器等) 时不需要更改 LLVM 中的所有转换。

Intrinsic 函数是编译器内建的函数,由编译器提供,类似于内联函数。但与内联函数不同的是,因为 Intrinsic 函数是编译器提供,而编译器与硬件架构联系紧密,因此编译器知道如何利用硬件能力以最优的方式实现这些功能。

命名格式

intrinsic 名必须全部以 “ llvm” 开头前缀。这个前缀在 LLVM 中保留用于 intrinsic 名称; 因此,函数名称不能以这个前缀开头。intrinsic 函数必须始终是外部函数: 你不能定义 intrinsic 函数体。intrinsic 函数只能用于调用或调用指令: 获取 intrinsic 函数的地址是非法的。此外,由于 intrinsic 函数是 LLVM 语言的一部分,如果添加了 intrinsic 函数,则需要对其更新文档。

重载

一些 intrinsic 函数可以被重载,例如,intrinsic 函数表示一组在不同数据类型上执行相同操作的函数。由于 LLVM 可以表示超过 800 万种不同的整数类型,因此通常使用重载来允许 intrinsic 函数对任何整数类型进行操作。可以重载一个或多个参数类型或结果类型以接受任何整数类型。也可以将参数类型定义为与前一个参数的类型或结果类型完全匹配。这允许一个 intrinsic 函数接受多个参数,但是需要所有参数都是同一类型的,只能对一个参数或结果进行重载

重载 intrinsic 将把它重载的参数类型的名称编码到它的函数名中,每个参数类型的前面都有一个.点符号。只有那些重载的类型才会生成名称后缀。其类型与另一个类型匹配的参数则不会。例如,llvm.ctpop 函数可以获取任意宽度的整数,并返回完全相同整数宽度的整数。这导致了一系列函数,如 _@_llvm.ctpop.i8(i8 %val) 和 i29 _@_llvm.ctpop.i29(i29 %val).只有一个类型 (返回类型) 被重载,并且只需要一个类型后缀。因为参数的类型与返回类型匹配,所以它不需要自己的名称后缀。

未命名类型被编码为 s_s。依赖于其重载参数类型中的未命名类型的重载 intrinsic 将获得一个额外的 .后缀。这允许将不同的未命名类型作为参数来区分 intrinsic。(例如: llvm.ssa.copy.p0s_s.2(%42*)), 这个数字在 LLVM 模块中被跟踪,并确保模块中的唯一名称。在将两个模块链接在一起时,仍然有可能出现名称冲突。在这种情况下,其中一个名称将通过获得一个新 numver 来区分。

对于为后端 codegen 定义 intrinsic 的目标开发人员,不应该依赖任何仅基于整数或浮点类型之间区别的内部重载来生成代码。在这种情况下,开发人员在定义 intrinsic 时, 推荐的方法是创建单独的整数和 浮点的 intrinsic,而不是依赖于重载

例如,如果 llvm.target.foo(<4 x i32>)) 和 llvm.target.foo(<4 x float>) 需要不同的 codegen,那么应该将它们分成不同的 intrinsic。

变量参数处理

在 LLVM 中定义了变量参数支持,包括 va_arg 指令和三个内在函数。这些函数与 头文件中定义的命名类似的宏相关。

所有这些函数都对使用特定于目标的值类型 “ va_list” 的参数进行操作。LLVM 汇编语言参考手册没有定义此类型是什么,因此无论使用何种类型,都应该准备好处理这些函数。

举个例子

这个例子展示了如何使用 va_arg 指令和 intrinsic 函数处理变量参数。

; 定义一个test 函数,第一个i32是返回值, 
; 后面括号里面的是操作数 i32 %X
define i32 @test(i32 %X, ...) {
  ; 分配一个地址空间给变量,初始化va_list
  %ap = alloca %struct.va_list
  %ap2 = bitcast %struct.va_list* %ap to i8*
  call void @llvm.va_start(i8* %ap2)

  ; va_arg= variable_argument 
  ; 这个指令用于访问传递的参数
  %tmp = va_arg i8* %ap2, i32

  ; 演示如何使用 llvm.va_copy 和 llvm.va_end
  %aq = alloca i8*
  %aq2 = bitcast i8** %aq to i8*
  call void @llvm.va_copy(i8* %aq2, i8* %ap2)
  call void @llvm.va_end(i8* %aq2)

  ; 停止参数的处理
  call void @llvm.va_end(i8* %ap2)
  ret i32 %tmp
}

; 声明方法,类似cpp里面的extern 
declare void @llvm.va_start(i8*)
declare void @llvm.va_copy(i8*, i8*)
declare void @llvm.va_end(i8*)

Read more

https://zhuanlan.zhihu.com/p/53659330

https://docs.microsoft.com/en-us/cpp/cpp/extern-cpp?view=msvc-170

https://llvm.org/docs/LangRef.html#intrinsic-functions

posted @ 2022-05-03 20:10 叉叉敌 阅读(393) 评论(0) 推荐(0) 编辑
摘要: 有什么说的不对的地方,还请多多支出, 谢谢~ 概述 LLVM : 全称是这个Low Level Virtual Machine,底层虚拟机,名字是带有虚拟机,但是现在早已和虚拟机没有任何关系了. 是整个LLVM项目,我目前了解的有5部分. LLVM 是一个用于构造、优化和生成中间和/或二进制机器码的 阅读全文
posted @ 2022-04-08 09:55 叉叉敌 阅读(442) 评论(0) 推荐(0) 编辑
摘要: 大家大概都知道美国制裁华为,制裁我们的高端芯片行业。 国家开始重视这个产业这个领域,其实我们大家都有很多机会投入到这个事业中去做有意义的事情。 真的是选择比努力重要,你选择一个好的行业有更好的事了,同时就能积累更多的财富。 我相信,大家也比我心里更清楚,我觉得进入芯片行业,基本上从国内GPU的都是从 阅读全文
posted @ 2022-03-22 14:17 叉叉敌 阅读(101) 评论(0) 推荐(0) 编辑
摘要: 从工厂到互联网大厂,最后转到基建行业。天道酬勤,仰望星空,脚踏实地,机会一定是留给有准备的人。 阅读全文
posted @ 2022-01-31 14:50 叉叉敌 阅读(596) 评论(9) 推荐(0) 编辑
摘要: 学习笔记: 极客时间 - 从O开始做增长:从0到1的增长实战方法论 https://time.geekbang.org/column/intro/165 学习,真的不是一件容易的事情。 开篇 我想要分享给你的是一套可以成功复制的增长思路和实践技巧。 增长小白如何“弯道超车” “最终为用户,简单却有效 阅读全文
posted @ 2021-02-28 23:00 叉叉敌 阅读(219) 评论(0) 推荐(0) 编辑
摘要: Coupon :优惠券 The coupon is not valid if detached. Tear off this coupon and use it to get 25p off your next jar of coffee. Offer 特价 Special offer - comp 阅读全文
posted @ 2021-02-21 21:55 叉叉敌 阅读(106) 评论(0) 推荐(0) 编辑
摘要: 准备数据 !wget --no-check-certificate \ https://storage.googleapis.com/laurencemoroney-blog.appspot.com/horse-or-human.zip \ -O /tmp/horse-or-human.zip 该目 阅读全文
posted @ 2021-02-19 22:46 叉叉敌 阅读(523) 评论(0) 推荐(0) 编辑
摘要: 卷积神经网络 抓住它的核心思路,即通过卷积操作缩小了图像的内容,将模型注意力集中在图像特定的、明显的特征上。 max pooling - 增强特征,减少数据 实现 在下面的代码中模型在训练数据上的精度可能上升到93%左右,在验证数据上可能上升到91%。 这是朝着正确方向取得的显著进步! 试着运行更多 阅读全文
posted @ 2021-02-19 10:27 叉叉敌 阅读(146) 评论(0) 推荐(0) 编辑
摘要: 让我们来看这样一个场景,让计算机识别不同的服装用品(有提包、鞋子、裤子等10类物品)。我们将用包含10种不同类型的物品图片的数据集来训练一个神经元网络,实现分类。 数据导入 首先通过tf.keras的API可以直接获得Fashion MNIST数据集。 在mnist对象上调用load_data方法会 阅读全文
posted @ 2021-02-19 10:25 叉叉敌 阅读(106) 评论(0) 推荐(0) 编辑
摘要: 学习目的 了解机器学习的一些基础功能,一些基础用法,然后在我们的实际工作中创造出更多的火花。 环境准备 环境话有很多,我在学习的这个慕课的实验室、谷歌实验室。还有腾讯实验室都可以用来做,也非常方便,本地环境搭建也是非常的方便,但是在训练数据多的时候,那就非常的慢。 这些实验室提供强大的算力,最主要的 阅读全文
posted @ 2021-02-19 10:23 叉叉敌 阅读(132) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示