定位Python built-in函数的源码实现

用Python开发的代码,有些时候会出现一些故障,这些故障很难从Python级调试中排查出原因。此时,需要对Python解释器进行C级调试,以排查更底层的原因。本文以定位Python built-in函数的源码实现为例,展示这种C级调试的片段。

Q:

我想查看os.system()的源码

这些信息不是我想要的。

A: scz 2015-09-21 10:21

built-in函数名等于system时断下:

PyCFunction_Call()用于调用built-in函数。

即将调用built-in函数system()。查看此时的模块名:

模块名不是想像中的os,而是posix,意味着os模块调用了posix模块。

针对PyCFunction_Call()设置条件断点时,不要轻易检查m_module,除非确知其名。

查看此时的函数信息:

built-in函数system()对应的C实现是posix_system():

现在知道os.system()对应posixmodule.c中的posix_system()。我一般在Source Insight里查看精确版本的源码实现,如果想快速了解大概,可以在线查看:

http://svn.python.org/projects/python/trunk/Modules/posixmodule.c http://hg.python.org/cpython/file/2.7/Modules/posixmodule.c

不要用”until *posix_system”,until有个很微妙的限制:

注意这句,”within the current frame”。一般意义上until *addr并不等价于tb *addr;c。而我们通常想要的是后者。这与windbg的g addr命令有显著不同。以前被坑过,跑飞了还奇怪为什么,辛辛苦苦得到的中间状态就这么没了。

其实,如果确知os.system()会调用C函数system(),可以直接针对后者下断,然后查看调用栈回溯:

从中一眼就看到posixmodule.c的posix_system()。

我前面演示的复杂方案是广谱方案。

发表评论