英文原文:why Python uses 0-based indexing
最近有人在 Twitter 是问我为什么 Python 使用以 0 为第一位的数组索引方式(以下简称0-based),并让我看一篇关于这个主题的文章(很有趣)。这引起了我不少的回忆。ABC 语言——Python 的祖先之一,使用的是以 1 为第一为的索引方式(以下简称1-based),而C语言——另一种对 Python 有影响巨大的语言,使用0-based 方式。我最早学习的几种语言(Algol, Fortran, Pascal),有的是1-based 的,有的是不固定的。我认为,之所以让我决定让 Python 使用0-based 索引方式的原因之一是 Python 的切片(slice)语法。
让我们来先看看切片的用法。可能最常见的用法就是“从数组中切出前n位”或“从数值这第i位起切出n位”(前一种实际上是i==起始位
的特殊用法)。如果使用这种语法时不需要表达成难看的+1
或-1
补充方式,那将是非常的优雅。
使用0-based 的索引方式,Python 的半开区间切片和缺省匹配区间切片语法变得非常漂亮: a[:n]
和 a[i:i+n]
,前者的标准写法就是a[0:n]
。
如果是1-base 的索引方式,那么,想让a[:n]
表达成“取前n个元素”,(这是不行的),你要么使用一个闭合区间切片语法,要么在切片语法中使用切片起始位和切片长度 2 个参数的形式。使用1-based 索引方式,半开区间切片语法变得不优雅。这种方式下使用闭合区间切片语法,为了表达从第i位取n个元素时你必须写出a[i:i+n-1]
。这样看来,如果使用1-based 的索引,使用切片起始位+长度的形式更合适。这样你可以写成a[i:n]
。事实上 ABC 语言就是这样做的——它使用了一个独特的表达方式,写成a@in
。(参看 http://homepages.cwi.nl/~steven/abc/qr.html#EXPRESSIONS。
但是,index:length 这种方式在其它情况下适用吗?说实话,这点我有些记不清了,但我想我是被半开区间语法的优雅迷住了。特别是当两个切片操作位置邻接时,第一个切片操作的终点索引值是第二个切片的起点索引值时,太漂亮了,无法舍弃。例如,你想将一个数组以i,j两个点切成三部分——这三部分将会是a[:i]
,a[i:j]
和a[j:]
。
这就是为什么我要让 Python 使用0-based 的索引方式的原因。