“ 上一篇用gdb分析了golang的数据结构,这一期分析golang的语法。”
Golang语法到底是怎么回事?
golang关键字编译之后是什么样子,会展开成什么样。
range
range其实展开本质上和普通的for循环展开是一样的。只不过边界条件的判断稍微有点不一样。
for 初始化; 判断条件; 递进 {
}
只不过编译器帮你来做了判断条件和递进(旁白:还是那句话,Golang那么高级,是因为编译器帮你干了好多事)。下面分别看几个类型遇到 range 是怎么回事,最主要的抓住边界条件是啥即可。
array / slice
边界条件:是否超过数组长度(len)
编译器做了什么?拿slice变量或者array变量来说。
- 取出连续内存元素长度(数组是静态编译就知道的,slice是从len变量里取的)
- 每次循环判断是否超出长度
- 递进
解析下这段代码就知道了
3 func main() {
4 var s []int = []int{11,12,13}
5
6 for i, n:= range s {
7 println(i, n)
8 }
反汇编看下:
…
// 比较
0x000000000044ec4f <+159>: mov 0x20(%rsp),%rax。// 0x20($rsp) 存的就是 len字段
0x000000000044ec54 <+164>: cmp %rax,0x28(%rsp) // 递进的数字index: 0x28($rsp) 和len 比较
// 跳转分支
0x000000000044ec59 <+169>: jl 0x44ec5d <main.main+173>
0x000000000044ec5b <+171>: jmp 0x44ecc8 <main.main+280>
// 业务逻辑
// 递进
0x000000000044ecbe <+270>: inc %rax
map
边界条件:是否还有下一个值。mapiternext -> hiter != nil
map遇到range稍微有点不一样,是通过runtime.mapiternext来获取边界值,并且判断边界值是通过这个调用是否为0来判断的。
// 初始化迭代器
0x0000000000450157 <+487>: callq 0x40bb70 <runtime.mapiterinit>
0x000000000045015c <+492>: jmp 0x45015e <main.main+494>
// 判断是否有元素可以继续迭代
0x000000000045015e <+494>: cmpq $0x0,0xb8(%rsp)
0x0000000000450167 <+503>: jne 0x45016e <main.main+510> // 非0,还有元素,可以继续迭代
0x0000000000450169 <+505>: jmpq 0x450207 <main.main+663>. // 跳出循环
0x000000000045016e <+510>: mov 0xc0(%rsp),%rax
// 业务逻辑
// 获取到下一个值
0x00000000004501fd <+653>: callq 0x40be30 <runtime.mapiternext>
channel
边界调节:是否close
对于channel是调用runtime.chanrecv1展开的,边界值是channel关闭,所以这里如果没有close,就会永远阻塞。
// 迭代开始
// 赋值chanrecv2的参数
0x000000000044ec89 <+153>: mov 0x38(%rsp),%rax
0x000000000044ec8e <+158>: mov %rax,(%rsp)
0x000000000044ec92 <+162>: lea 0x28(%rsp),%rax
0x000000000044ec97 <+167>: mov %rax,0x8(%rsp)
=> 0x000000000044ec9c <+172>: callq 0x404d60 <runtime.chanrecv2> // channel未关闭就有可能是阻塞在这里
// 判读是否满足边界条件
0x000000000044eca6 <+182>: mov %al,0x1f(%rsp)
0x000000000044ecaa <+186>: test %al,%al // 判断是否满足边界条件close
0x000000000044ecac <+188>: jne 0x44ecb0 <main.main+192>
0x000000000044ecae <+190>: jmp 0x44ece4 <main.main+244>
// 业务逻辑
// 直接调到153开始
0x000000000044ece2 <+242>: jmp 0x44ec89 <main.main+153>
// chanrecv receives on channel c and writes the received data to ep.
// ep may be nil, in which case received data is ignored.
// If block == false and no elements are available, returns (false, false).
// Otherwise, if c is closed, zeros *ep and returns (true, false).
// Otherwise, fills in *ep with an element and returns (true, true).
// A non-nil ep must point to the heap or the caller's stack.
func chanrecv(c *hchan, ep unsafe.Pointer, block bool) (selected, received bool) {
select
- select 展开成 selectgo . 有几个需要注意的:
- select运行一次其实就是调用了一次 selectgo
- 调用selectgo之前需要计算参数,表达式会计算出值
-
每个case传到selectgo函数里的一定是io操作;出来之后可以进行赋值操作。但是注意了,chan的io操作一定是在selectgo内部进行的 为什么能得到以上的几个结论:
- 因为每次selectgo调用是需要传参数的,传参数是需要构造变量的,这个时候必须计算出来。这个变量类型就是scase类型。
- 看selectgo的逻辑和汇编代码的生成,所有的channel io操作均在selectgo内部,涉及外部的赋值操作在外部
- selectgo返回的是case的index,外部根据这个判断执行哪个case的逻辑
package main
func main() {
c1 := make(chan int, 2)
c2 := make(chan int, 2)
c1<-1
c2<-2
select {
case <-c1:
println("1\n")
case <-c2:
println("2\n")
}
}
挑重点: 对应关系:
chan<-
runtime.chansend1
<-chan
runtime.chanrecv1
函数
函数
- 函数的调用惯例
- 闭包到底做了什么
函数的调用惯例
所有的参数和返回值都是通过栈来传递。这个和c不同,c是前6个参数按照惯例用寄存器rdi,rsi,rdx,rcx,r8,r9. 参数溢出之后放在栈上,返回值存rax。go的传参这样设计,性能比c差点,但是复杂性大大降低。并且返回值还能统一起来,并且容易支持多参数。
闭包到底做了什么
闭包就是 带环境上下文的函数(funcval结构)。在编译的流程,有一步是专门分析变量捕捉的(分析出哪些变量会被捕捉,会和函数指针构成一个数据结构),然后才是函数编译。这样函数调用的时候,就能直接去上下文地址取变量的值了。
那么这里就要注意下,这里就有引用和值的区别,如果是和函数捆绑的是引用,那么取值的时候,就是通过反引用来取值的,修改的话也会导致这个原变量的值修改。如果是值,那么就是完全clone出来的一个变量对象。和原来的不相关。那么究竟是值,还是引用,这个要看我们业务代码怎么写,编译器才会怎么分析判断。
举个例子:
package main
func main () {
var i int = 0
for i = 0; i< 3; i++ {
go func () {
println(i) // 编译器捕捉分析,按照引用取值
}()
}
}
汇编代码
000000000044ec60 <main.main.func1>:
44ec60: 64 48 8b 0c 25 f8 ff mov %fs:0xfffffffffffffff8,%rcx
44ec67: ff ff
44ec69: 48 3b 61 10 cmp 0x10(%rcx),%rsp
44ec6d: 76 42 jbe 44ecb1 <main.main.func1+0x51>
44ec6f: 48 83 ec 18 sub $0x18,%rsp
44ec73: 48 89 6c 24 10 mov %rbp,0x10(%rsp)
44ec78: 48 8d 6c 24 10 lea 0x10(%rsp),%rbp
44ec7d: 48 8b 44 24 20 mov 0x20(%rsp),%rax // 变量地址
44ec82: 48 8b 00 mov (%rax),%rax // 反引用取值
44ec85: 48 89 44 24 08 mov %rax,0x8(%rsp)
44ec8a: e8 b1 3f fd ff callq 422c40 <runtime.printlock>
44ec8f: 48 8b 44 24 08 mov 0x8(%rsp),%rax
44ec94: 48 89 04 24 mov %rax,(%rsp)
44ec98: e8 13 47 fd ff callq 4233b0 <runtime.printint>
44ec9d: e8 1e 42 fd ff callq 422ec0 <runtime.printnl>
44eca2: e8 19 40 fd ff callq 422cc0 <runtime.printunlock>
44eca7: 48 8b 6c 24 10 mov 0x10(%rsp),%rbp
44ecac: 48 83 c4 18 add $0x18,%rsp
44ecb0: c3 retq
44ecb1: e8 7a 82 ff ff callq 446f30 <runtime.morestack_noctxt>
44ecb6: eb a8 jmp 44ec60 <main.main.func1>
另一个例子
package main
func main () {
var i int = 0
for i = 0; i< 3; i++ {
v := i
go func () {
println(v). // 编译器捕捉分析,直接copy值,和func绑定。运行的时候,直接取值。
}()
}
}
汇编
000000000044ec40 <main.main.func1>:
44ec40: 64 48 8b 0c 25 f8 ff mov %fs:0xfffffffffffffff8,%rcx
44ec47: ff ff
44ec49: 48 3b 61 10 cmp 0x10(%rcx),%rsp
44ec4d: 76 35 jbe 44ec84 <main.main.func1+0x44>
44ec4f: 48 83 ec 10 sub $0x10,%rsp
44ec53: 48 89 6c 24 08 mov %rbp,0x8(%rsp)
44ec58: 48 8d 6c 24 08 lea 0x8(%rsp),%rbp
44ec5d: e8 de 3f fd ff callq 422c40 <runtime.printlock>
44ec62: 48 8b 44 24 18 mov 0x18(%rsp),%rax // 取值
44ec67: 48 89 04 24 mov %rax,(%rsp)
44ec6b: e8 40 47 fd ff callq 4233b0 <runtime.printint>
44ec70: e8 4b 42 fd ff callq 422ec0 <runtime.printnl>
44ec75: e8 46 40 fd ff callq 422cc0 <runtime.printunlock>
44ec7a: 48 8b 6c 24 08 mov 0x8(%rsp),%rbp
44ec7f: 48 83 c4 10 add $0x10,%rsp
44ec83: c3 retq
第一个例子:用的是外面的变量,编译器假设你可能有读取,修改这个变量的值,其他人也是看的到的,那么自然是用引用的方式。
第二个例子:v是一个局部变量,每一轮循环都是新的变量值,是一个非常小的作用域。直接传值的话,没有问题,因为只有这个闭包关注这个值。
坚持思考,方向比努力更重要。关注我:奇伢云存储