File: intrinsics.go

intrinsics.go文件是Go语言运行时系统的一个组成部分，主要用于实现Go语言内部的一些编译器内置函数和优化指令。该文件中包含了一系列的内置函数，这些内置函数可以被编译器自动识别，并且具有高效、低延迟的特性，从而能够提升程序的执行效率。

内置函数是Go语言编译器提供的特殊函数，这些函数不需要在代码中明确声明、定义，而是在编译时通过编译器自动识别和替换。这些内置函数包括复制内存、逃逸分析、锁操作等，它们的作用是优化代码的执行效率，提高程序的性能。

intrinsics.go文件中定义的内置函数包括以下几类：

内存操作函数：包括memmove、memset等函数，用于对内存进行复制、填充等操作。
原子操作函数：包括add、swap等函数，用于对内存的原子性操作，避免多线程、多协程的并发冲突。
锁操作函数：包括lock、unlock等函数，用于实现互斥锁、读写锁等。
GC相关函数：包括gcWriteBarrier、gcWriteBarrierRange等函数，用于跟踪对象的引用关系，帮助GC进行垃圾回收。
字符串操作函数：包括memcmp、memchr等函数，用于字符串比较、查找等操作。

这些内置函数都是高效、低延迟的，使用时可以有效地提升程序的性能和效率。同时，由于这些内置函数在编译时会被编译器自动识别和替换，因此可以减少程序的开销和资源占用，提高程序的运行效率。

Var:

deBruijn32tab

在Go语言中，intrinsics.go文件中deBruijn32tab这个变量的作用是用于一些特定的位操作实现中。该变量是一个包含32个元素的整数数组，这些整数的值与其下标值的二进制表示中1的个数相关。具体来说，deBruijn32tab[i]等于（1 << i）× 0x077CB531，其中左移运算符（<<）表示将1左移i位，0x077CB531是一个特定的常数。使用deBruijn32tab变量，可以实现一些高效的位操作，如获取一个32位整数中右侧最高位的位置索引，以及在一个32位整数中设置最低的0位或最高的1位等。

deBruijn64tab

在 Go 语言中，intrinsics.go 这个文件为编译器提供了一些底层的支持，同时也涉及到一些常量的定义。其中，deBruijn64tab 这个变量是一个预计算的常量数组，用于计算二进制数中最低的非零位的位置。

这个常量数组主要用于实现一种高效的算法来计算整数的位宽。位宽指的是一个整数二进制表示中的位数（不包括前导零位）。这个算法利用了一个名为“德布鲁因序列”的数学构造算法。

“德布鲁因序列”是一个能够生成各种不同二进制数最低非零位位置的正整数序列。使用这个序列，我们可以快速地计算任意整数的位宽。

具体实现方式是，将需要计算的整数向右移动一位（即除以2），然后在 deBruijn64tab 中查找到最低的非零位的位置（也就是二进制表示中从右往左数第一个1的位置），然后将这个位置乘以2。最后再减去整数中前导零的个数，就可以得到整数的位宽了。

通过使用 deBruijn64tab 这个常量数组，可以避免在程序运行时动态计算序列，从而提高计算位宽的效率。

Functions:

TrailingZeros32

TrailingZeros32是一个内部函数，其作用是返回32位无符号整数值二进制表示中最低位的0位数。简单来说，就是计算一个数的末尾有多少个连续的0。

其实现使用了一系列位运算来实现快速计算。具体实现如下：

// TrailingZeros32 returns the number of trailing zero bits in x. func TrailingZeros32(x uint32) int { // x &= -x is the idiomatic way to isolate the lowest bit, because -x // is the two's complement negation of x. x <<= 1 sets the isolated bit // to zero and shifts the value left by one, so whatever trailing zeros // x originally had are now trailing zeros in the new value. We use uint16 // to take advantage of the carry from the shift from bit 15 to 16, which // becomes the new least-significant bit. return int(bits.LeadingZeros16(uint16((x & -x) << 1))) }

TrailingZeros32非常常见，例如在解析二进制文件时，需要知道某个数据的长度时，就可以使用TrailingZeros32来计算其末尾的0位数。它还常用于位运算中，以便判断某些特定的标志位是否被设置。

TrailingZeros64

TrailingZeros64是一个内联函数（intrinsic func），用于在运行时中实现有符号64位整数中零位数的算法。这个函数用于查找数字的低位零位数，其执行时间与零位数成比例，常数是非常小的，这使得它非常适合高性能计算。在该函数中使用的算法被称为“德布林算法”，它使用了位级数学技巧来计算整数中的零位数。

具体来说，TrailingZeros64函数接受一个有符号64位整数作为参数，然后使用了德布林算法来计算该整数中的零位数。该算法使用了一系列位掩码，以确定整数中的零位数，然后在每次迭代中将整数右移一位，直到其不再具有任何零位。

此函数主要用于在Go程序中实现高效的算法和数据结构，特别是在需要高性能的计算应用程序中。它提供了一种快速而可靠的方法来确定整数中的零位数，使得在执行高性能运算时可以减少资源开销。

TrailingZeros8

TrailingZeros8这个func的作用是返回一个无符号8位整数中末尾0的数量。

在计算机中，二进制数的末尾0的数量可以直接影响某些操作的速度。例如，右移操作需要将数值的每个位向右移动一定数量，如果末尾有0，则可以减少向右移动的位数，从而加快操作的速度。因此，TrailingZeros8这个func可以用于优化某些操作的性能。

具体实现上，TrailingZeros8是使用位运算来计算末尾0的数量的。它首先将数字按位取反，然后使用位与运算将所有末尾的1都变成了0，最后返回1的数量即为末尾0的数量。例如，对于数字0b11001000，它的末尾0的数量为3，因为它的二进制表示中有3个连续的0。

Len64

Len64函数是一个原生的Go函数，它在runtime包的intrinsics.go文件中定义。它的作用是返回一个根据指定类型计算的长度，在某些系统架构中可以更高效地处理这些类型。在Go程序中，切片是一种非常常用的数据类型，因此对于切片类型，Len64函数可以更快地确定其长度。

在32位系统中，切片的长度是32位的整数类型，因此可以直接使用Go语言的内置函数len来获取长度。但在64位系统中，切片的长度是64位的整数类型，并且len函数返回的是int类型，因此Len64函数在64位系统中可以更高效地计算切片的长度。

此外，Len64函数还可以用于其他类型，例如数组。对于某些类型，Len64函数可以更高效地计算其长度。例如，对于字符串类型，Len64函数返回字符串的字节数，而不是Unicode字符数。

总之，Len64函数在某些系统架构中可以更高效地处理某些类型的长度，并且在64位系统中可以更高效地处理切片长度。

OnesCount64

OnesCount64是一个内置函数，用于计算一个无符号整数的二进制表示中1的个数。它主要用于性能优化，在高性能计算中可以替代常规的循环计算。

该函数接受一个uint64类型的参数，表示要计算二进制中1的个数的无符号整数。它返回一个int类型的值，表示二进制中1的个数。

实现原理主要是使用了查表法。首先会将64位的整数划分成8个8位的字节，对每个字节分别查找内置的表，得到该字节中二进制1的个数。然后将每个字节中1的个数相加，得到总的二进制1的个数。

该函数的使用可以提高代码的性能和效率，尤其是在循环计算中使用。同时也可以避免程序中出现重复的计算操作，提高代码的可读性和维护性。

LeadingZeros64

函数LeadingZeros64返回一个无符号整数x（64位），x中最高位的1之前的0的数量（即领先（左侧）的零的数量）。如果x=0，则返回64。

该函数是为了提高某些操作的性能而提供的，例如在根据哈希值选择桶时，可以使用该函数来确定需要考虑多少位。

下面是该函数的代码实现：

func LeadingZeros64(x uint64) int { if x == 0 { return 64 } var n int if x <= 1<<32-1 { n = 32 x <<= 32 } if x <= 1<<48-1 { n += 16 x <<= 16 } if x <= 1<<56-1 { n += 8 x <<= 8 } if x <= 1<<60-1 { n += 4 x <<= 4 } if x <= 1<<62-1 { n += 2 x <<= 2 } n += int(x >> 63) return n }

该函数的思想是通过不断将x左移一定的位数，来确定x中最高位的1之前的0的数量。如果x的值较小，就向左移动较少的位数，如果x的值较大，则需要左移更多的位数。它通过这种方式使函数的执行速度更快，并提高了在哈希表等数据结构中高效地操作uint64的能力。

LeadingZeros8

LeadingZeros8是用于计算一个8位无符号整数的前导零的函数。前导零是指在数值的二进制表示中，从最高位（或最左边的位）开始的连续的零的个数。

这个函数是通过二分法实现的，主要思路是将8位整数划分为4个部分，每个部分可以看做是二进制数的一半。然后分别判断每个部分是否为0，如果是，则将计数器增加对应部分的位数；否则继续将该部分一分为二，直到找到最高位的一个非零部分为止。

该函数的主要用途是在Go语言的垃圾回收器中，用于计算对象头部中存储的指针数量。通过计算前导零的个数，可以确定对象头部中指针数量的最大值，从而确定对象是否是小对象（即可以通过指针直接访问）或者大对象（需要从指针中读取对象的位置信息并进行跳转）。

除了垃圾回收器之外，LeadingZeros8函数也被一些加密库和数据压缩算法使用。它可以用于确定某些加密算法中使用的随机数是否足够随机，以及在数据压缩算法中计算数据的压缩率。

Len8

Len8函数是一个内部函数，在Go语言运行时中被调用，用于计算具有固定大小的类型（如int64、float64、指针等）的数组或切片的长度。这个函数的作用类似于len()函数，但它的实现方式更加底层，能够利用CPU的SIMD指令来实现高效的计算。

具体地说，Len8函数的实现基于一个叫做“vectorized length calculation”的技术，即利用CPU的向量寄存器来一次性处理多个元素。它将数组或切片的底层指针强制转换为一个int64类型的指针（因为这个指针的大小始终为8字节），然后使用SIMD指令将这个指针加上数组长度，从而得到结果。

使用Len8函数的好处是它可以在大型数组和切片的计算中提高运行时效率，因为它是基于CPU指令集实现的。但它的缺点是它只适用于长度是8字节的数组或切片，而且需要特殊的指令集支持才能正常使用。因此，它只在一些特定的场景下被使用，比如在图像处理、物理模拟等方面。

Bswap64

Bswap64是一个汇编函数，用于交换64位整数的字节顺序。在计算机系统中，字节顺序指定了一个多字节值中字节的排列顺序（通常是大端或小端格式）。在不同的机器上，字节顺序可能不同，因此在进行跨平台通信时，需要确保正确地解释和发送数据。

Bswap64操作通过将输入数据中的字节顺序颠倒，将最高有效字节移动到最低有效字节位置，以实现字节顺序转换。Bswap64通常用于网络协议、文件格式、加密算法等领域，确保系统之间可以正确理解和处理数据。

Bswap32

Bswap32函数的作用是将uint32类型的数据进行字节序交换。

字节序指的是计算机在存储和传输数据时对字节的顺序安排。有大端序和小端序之分，其中大端序是将高位字节存储在低地址，而小端序则是将低位字节存储在低地址。在网络传输数据时通常采用大端序，而在x86架构的计算机上则采用小端序。

Bswap32函数可以将一个32位的无符号整数的字节序颠倒过来，从而得到反转后的数值。这个操作在网络传输数据时很常用，因为不同语言和平台的字节序不一定相同，需要进行转换。

例如，对于十六进制的数值0x12345678，它在小端序的计算机上的存储方式是0x78, 0x56, 0x34, 0x12。执行Bswap32操作后，就会得到0x78563412这个值，在大端序计算机上的存储方式就是正常的顺序了。

Bswap32函数利用x86指令BSWAP实现，这个指令可以将32位整数的字节序进行反转。由于BSWAP指令只在x86平台上支持，因此此函数只适用于x86架构的计算机。

Prefetch

在 Go 语言中，预取（Prefetch）是一种优化技术，可以在读取变量之前将其缓存到处理器缓存中。这可以显著缩短读取变量的时间，因为缓存中的数据比从内存中读取数据的速度要快得多。

在 Go 中，Prefetch 函数可以让开发者手动预取变量。该函数位于 runtime 包的 intrinsics.go 文件中。它的定义如下：

// Prefetch hints to the processor that p should be cached.
//go:linkname Prefetch runtime.prefetch
func Prefetch(p unsafe.Pointer)

该函数接受一个参数 p，表示需要预取的变量的指针。当执行 Prefetch 函数时，它会向处理器发出信号，提示处理器将指针指向的变量预取到处理器缓存中。这个过程是异步的，因此 Prefetch 函数会立即返回。

使用 Prefetch 函数可以提高代码的性能，特别是在需要频繁读取变量时。例如，在循环中读取一个数组时，可以在每次循环迭代中使用 Prefetch 函数来预取循环变量和数组元素。

需要注意的是，Prefetch 函数是一个底层函数，不应该被普通的 Go 代码所使用。使用 Prefetch 函数需要对底层硬件有一定的了解和经验，并且需要进行详细的测试和性能分析，以确保代码的正确性和性能的提高。

PrefetchStreamed

PrefetchStreamed这个函数是一个内嵌汇编指令，用于在程序运行时提前将数据从主内存加载到CPU缓存中，以提高数据访问效率。

具体来说，PrefetchStreamed函数会接收两个参数：ptr和hint。其中，ptr表示要预取的数据存储区域的起始地址，hint表示预取的方式。

在实际使用中，我们可以将预取的方式(hint)设置为0-3之间的整数值，表示不同的预取策略：

0：表示预取时缓存不改变状态
1：表示预取时缓存将数据设置为共享状态
2：表示预取时缓存将数据设置为独占状态
3：表示预取时缓存将数据设置为最近使用状态

在执行PrefetchStreamed函数时，会将ptr和hint作为参数传递给内嵌汇编指令，然后在汇编指令中执行对应的预取操作。具体来说，汇编代码会使用prefetcht2指令，将指定的数据块移动到二级缓存中以供之后使用。

总之，PrefetchStreamed函数主要用于提前将数据从主内存加载到CPU缓存中，以优化程序的运行效率，适用于需要频繁访问的大型数据存储区域。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

intrinsics.go.md

intrinsics.go.md

File: intrinsics.go

Var:

deBruijn32tab

deBruijn64tab

Functions:

TrailingZeros32

TrailingZeros64

TrailingZeros8

Len64

OnesCount64

LeadingZeros64

LeadingZeros8

Len8

Bswap64

Bswap32

Prefetch

PrefetchStreamed

Files

intrinsics.go.md

Latest commit

History

intrinsics.go.md

File metadata and controls

File: intrinsics.go

Var:

deBruijn32tab

deBruijn64tab

Functions:

TrailingZeros32

TrailingZeros64

TrailingZeros8

Len64

OnesCount64

LeadingZeros64

LeadingZeros8

Len8

Bswap64

Bswap32

Prefetch

PrefetchStreamed