5.指针
最后更新于:2022-04-02 04:43:37
Go 语言指针
我们都知道,变量是一种使用方便的占位符,用于引用计算机内存地址。
Golang 支持指针类型 *T,指针的指针 **T,以及包含包名前缀的 *.T。
~~~
• 默认值 nil,没有 NULL 常量。
• 操作符 "&" (取地址符) 取变量地址,"*" (取值符)透过指针访问目标对象。
• 不支持指针运算,不支持 "->" 运算符,直接用 "." 访问目标成员。
~~~
以下实例演示了变量在内存中地址:
~~~
package main
import "fmt"
func main() {
var a int = 10
fmt.Printf("变量的地址: %x\n", &a)
}
~~~
执行以上代码输出结果为:
~~~
变量的地址: c420012058
~~~
现在我们已经了解了什么是内存地址和如何去反问它。接下来我们将具体介绍指针。
什么是指针
一个指针变量可以指向任何一个值的内存地址,它指向那个值的内存地址。
类似于变量和常量,在使用指针前你需要声明指针。
指针声明格式如下:
var name *类型
指针声明:
~~~
package main
var ip *int /* 指向整型*/ //声明一个int值得指针变量
var fp *float32 /* 指向浮点型 */
var sp *string /* 指向字符串类型 */
func main() {
}
~~~
如何使用指针
指针使用流程:
定义指针变量。
为指针变量赋值。
访问指针变量中指向地址的值。
在指针类型前面加上 * 号(前缀)来获取指针所指向的内容。
~~~
package main
import "fmt"
func main() {
var a int = 20 /* 声明实际变量 */
var ip *int /* 声明指针变量 */
ip = &a /* 指针变量的存储地址 */
fmt.Printf("a 变量的地址是: %x\n", &a)
/* 指针变量的存储地址 */
fmt.Printf("ip 变量的存储地址: %x\n", ip)
/* 使用指针访问值 */
fmt.Printf("*ip 变量的值: %d\n", *ip)
}
~~~
输出结果:
~~~
a 变量的地址是: c420012058
ip 变量的存储地址: c420012058
*ip 变量的值: 20
~~~
直接用指针访问目标对象成员:
~~~
package main
import (
"fmt"
)
func main() {
type data struct{ a int }
var d = data{1234}
var p *data
p = &d
fmt.Printf("%p, %v\n", p, p.a) // 直接用指针访问目标对象成员,无须转换。
}
~~~
输出结果:
~~~
0xc420012058, 1234
~~~
不能对指针做加减法等运算。
~~~
package main
func main() {
x := 1234
p := &x
p++
}
~~~
输出结果:
~~~
./main.go:6:3: invalid operation: p++ (non-numeric type *int)
~~~
可以在 unsafe.Pointer 和任意类型指针间进 转换。
~~~
package main
import (
"fmt"
"unsafe"
)
func main() {
x := 0x12345678
p := unsafe.Pointer(&x) // *int -> Pointer
n := (*[4]byte)(p) // Pointer -> *[4]byte
for i := 0; i < len(n); i++ {
fmt.Printf("%X ", n[i])
}
fmt.Println()
}
~~~
输出结果:
~~~
78 56 34 12
~~~
返回局部变量指针是安全的,编译器会根据需要将其分配在 GC Heap 上。
~~~
package main
func main() {}
func test() *int {
x := 100
return &x // 在堆上分配 x 内存。但在内联时,也可能直接分配在目标栈。
}
~~~
将 Pointer 转换成 uintptr,可变相实现指针运算。
~~~
package main
import (
"fmt"
"unsafe"
)
func main() {
d := struct {
s string
x int
}{"abc", 100}
p := uintptr(unsafe.Pointer(&d)) // *struct -> Pointer -> uintptr
p += unsafe.Offsetof(d.x) // uintptr + offset
p2 := unsafe.Pointer(p) // uintptr -> Pointer
px := (*int)(p2) // Pointer -> *int
*px = 200 // d.x = 200
fmt.Printf("%#v\n", d)
}
~~~
输出结果:
~~~
struct { s string; x int }{s:"abc", x:200}
~~~
注意:GC 把 uintptr 当成普通整数对象,它无法阻止 "关联" 对象被回收。
Go 空指针 (nil)
当一个指针被定义后没有分配到任何变量时,它的值为 nil。
nil 指针也称为空指针。
nil在概念上和其它语言的null、None、nil、NULL一样,都指代零值或空值。
一个指针变量通常缩写为 ptr。
实例:
~~~
package main
import "fmt"
func main() {
var ptr *int
fmt.Printf("ptr 的值为 : %x\n", ptr)
}
~~~
输出结果:
~~~
ptr 的值为 : 0
~~~
空指针判断:
~~~
package main
import (
"fmt"
)
func main() {
var ptr1 *int
var i int = 1
ptr2 := &i
if ptr1 == nil {
fmt.Println("prt1 是空指针")
}
if ptr2 != nil {
fmt.Println("prt2 不是空指针")
}
}
~~~
输出结果:
~~~
prt1 是空指针
prt2 不是空指针
~~~
Go 指针数组
在我们了解指针数组前,先看个实例,定义了长度为 3 的整型数组:
~~~
package main
import "fmt"
const MAX int = 3
func main() {
a := [MAX]int{10, 100, 200}
var i int
for i = 0; i < MAX; i++ {
fmt.Printf("a[%d] = %d\n", i, a[i])
}
}
~~~
输出结果:
~~~
a[0] = 10
a[1] = 100
a[2] = 200
~~~
有一种情况,我们可能需要保存数组,这样我们就需要使用到指针。
以下声明了整型指针数组:
~~~
var ptr [MAX]*int;
~~~
ptr 为整型指针数组。因此每个元素都指向了一个值。以下实例的三个整数将存储在指针数组中:
~~~
package main
import "fmt"
const MAX int = 3
func main() {
a := []int{9, 99, 999}
var i int
var ptr [MAX]*int
for i = 0; i < MAX; i++ {
ptr[i] = &a[i] /* 整数地址赋值给指针数组 */
}
for i = 0; i < MAX; i++ {
fmt.Printf("a[%d] = %d\n", i, *ptr[i])
}
}
~~~
输出结果:
~~~
a[0] = 9
a[1] = 99
a[2] = 999
~~~
如果一个指针变量存放的又是另一个指针变量的地址,则称这个指针变量为指向指针的指针变量。
当定义一个指向指针的指针变量时,第一个指针存放第二个指针的地址,第二个指针存放变量的地址:
指向指针的指针变量声明格式如下:
~~~
var ptr **int
~~~
以上指向指针的指针变量为整型。
访问指向指针的指针变量值需要使用两个 * 号,如下所示:
~~~
package main
import "fmt"
func main() {
var a int
var ptr *int
var pptr **int
a = 3000
/* 指针 ptr 地址 */
ptr = &a
/* 指向指针 ptr 地址 */
pptr = &ptr
/* 获取 pptr 的值 */
fmt.Printf("变量 a = %d\n", a)
fmt.Printf("指针变量 *ptr = %d\n", *ptr)
fmt.Printf("指向指针的指针变量 **pptr = %d\n", **pptr)
}
~~~
输出结果:
~~~
变量 a = 3000
指针变量 *ptr = 3000
指向指针的指针变量 **pptr = 3000
~~~
Go 像函数传递指针参数
Go 语言允许向函数传递指针,志需要在函数定义的参数上设置为指针类型即可。
以下实例演示了如何向函数传递指针,并在函数调用后修改函数内的值,:
~~~
package main
import "fmt"
func main() {
/* 定义局部变量 */
var a int = 100
var b int = 200
fmt.Printf("交换前 a 的值 : %d\n", a)
fmt.Printf("交换前 b 的值 : %d\n", b)
/* 调用函数用于交换值
* &a 指向 a 变量的地址
* &b 指向 b 变量的地址
*/
swap(&a, &b)
fmt.Printf("交换后 a 的值 : %d\n", a)
fmt.Printf("交换后 b 的值 : %d\n", b)
}
func swap(x *int, y *int) {
var temp int
temp = *x /* 保存 x 地址的值 */
*x = *y /* 将 y 赋值给 x */
*y = temp /* 将 temp 赋值给 y */
}
~~~
输出结果:
~~~
交换前 a 的值 : 100
交换前 b 的值 : 200
交换后 a 的值 : 200
交换后 b 的值 : 100
~~~
指针类型转换
Go语言是不允许两个指针类型进行转换的。
我们一般使用*T作为一个指针类型,表示一个指向类型T变量的指针。为了安全的考虑,两个不同的指针类型不能相互转换,比如*int不能转为*float64。
~~~
package main
import "fmt"
func main() {
i := 10
ip := &i
var fp *float64 = (*float64)(ip)
fmt.Println(fp)
}
~~~
输出结果:
~~~
./main.go:9:30: cannot convert ip (type *int) to type *float64
~~~
以上代码我们在编译的时候,会提示cannot convert ip (type *int) to type *float64,也就是不能进行强制转型。那如果我们还是需要进行转换怎么做呢?这就需要我们使用unsafe包里的Pointer了,下面我们先看看unsafe.Pointer是什么,然后再介绍如何转换。
Pointer
unsafe.Pointer是一种特殊意义的指针,它可以包含任意类型的地址,有点类似于C语言里的void*指针,全能型的。
~~~
package main
import (
"fmt"
"unsafe"
)
func main() {
i := 10
ip := &i
var fp *float64 = (*float64)(unsafe.Pointer(ip))
*fp = *fp * 3
fmt.Println(i)
}
~~~
输出结果:
~~~
30
~~~
以上示例,我们可以把*int转为*float64,并且我们尝试了对新的*float64进行操作,打印输出i,就会发现i的址同样被改变。
以上这个例子没有任何实际的意义,但是我们说明了,通过unsafe.Pointer这个万能的指针,我们可以在*T之间做任何转换。
~~~
type ArbitraryType int
type Pointer *ArbitraryType
~~~
可以看到unsafe.Pointer其实就是一个*int,一个通用型的指针。
我们看下关于unsafe.Pointer的4个规则。
任何指针都可以转换为unsafe.Pointer
unsafe.Pointer可以转换为任何指针
uintptr可以转换为unsafe.Pointer
unsafe.Pointer可以转换为uintptr
前面两个规则我们刚刚已经演示了,主要用于*T1和*T2之间的转换,那么最后两个规则是做什么的呢?我们都知道*T是不能计算偏移量的,也不能进行计算,但是uintptr可以,所以我们可以把指针转为uintptr再进行便宜计算,这样我们就可以访问特定的内存了,达到对不同的内存读写的目的。
下面我们以通过指针偏移修改Struct结构体内的字段为例,来演示uintptr的用法。
~~~
package main
import (
"fmt"
"unsafe"
)
func main() {
u := new(user)
fmt.Println(*u)
pName := (*string)(unsafe.Pointer(u))
*pName = "张三"
pAge := (*int)(unsafe.Pointer(uintptr(unsafe.Pointer(u)) + unsafe.Offsetof(u.age)))
*pAge = 20
fmt.Println(*u)
}
type user struct {
name string
age int
}
~~~
输出结果:
~~~
{ 0}
{张三 20}
~~~
以上我们通过内存偏移的方式,定位到我们需要操作的字段,然后改变他们的值。
第一个修改user的name值的时候,因为name是第一个字段,所以不用偏移,我们获取user的指针,然后通过unsafe.Pointer转为*string进行赋值操作即可。
第二个修改user的age值的时候,因为age不是第一个字段,所以我们需要内存偏移,内存偏移牵涉到的计算只能通过uintptr,所我们要先把user的指针地址转为uintptr,然后我们再通过unsafe.Offsetof(u.age)获取需要偏移的值,进行地址运算(+)偏移即可。
现在偏移后,地址已经是user的age字段了,如果要给它赋值,我们需要把uintptr转为*int才可以。所以我们通过把uintptr转为unsafe.Pointer,再转为*int就可以操作了。
这里我们可以看到,我们第二个偏移的表达式非常长,但是也千万不要把他们分段,不能像下面这样。
~~~
temp:=uintptr(unsafe.Pointer(u))+unsafe.Offsetof(u.age)
pAge:=(*int)(unsafe.Pointer(temp))
*pAge = 20
~~~
逻辑上看,以上代码不会有什么问题,但是这里会牵涉到GC,如果我们的这些临时变量被GC,那么导致的内存操作就错了,我们最终操作的,就不知道是哪块内存了,会引起莫名其妙的问题。
小结
unsafe是不安全的,所以我们应该尽可能少的使用它,比如内存的操纵,这是绕过Go本身设计的安全机制的,不当的操作,可能会破坏一块内存,而且这种问题非常不好定位。
当然必须的时候我们可以使用它,比如底层类型相同的数组之间的转换;比如使用sync/atomic包中的一些函数时;还有访问Struct的私有字段时;该用还是要用,不过一定要慎之又慎。
还有,整个unsafe包都是用于Go编译器的,不用运行时,在我们编译的时候,Go编译器已经把他们都处理了。
';