• 沒有找到結果。

通用的序列操作

列表和元组

2.2 通用的序列操作

有几种操作适用于所有序列,包括索引、切片、相加、相乘和成员资格检查。另外,Python 还提供了一些内置函数,可用于确定序列的长度以及找出序列中最大和最小的元素。

注意 有一个重要的操作这里不会介绍,它就是迭代(iteration)。对序列进行迭代意味着对其 每个元素都执行特定的操作。有关迭代的详细信息,请参阅5.5节。

2.2.1 索引

序列中的所有元素都有编号——从0开始递增。你可像下面这样使用编号来访问各个元素:

>>> greeting = 'Hello'

>>> greeting[0]

'H'

注意 字符串就是由字符组成的序列。索引0指向第一个元素,这里为字母H。不同于其他一 些语言,Python没有专门用于表示字符的类型,因此一个字符就是只包含一个元素的字 符串。

这称为索引(indexing)。你可使用索引来获取元素。这种索引方式适用于所有序列。当你使 用负数索引时,Python将从右(即从最后一个元素)开始往左数,因此1是最后一个元素的位置。

>>> greeting[-1]

'o'

对于字符串字面量(以及其他的序列字面量),可直接对其执行索引操作,无需先将其赋给 变量。这与先赋给变量再对变量执行索引操作的效果是一样的。

>>> 'Hello'[1]

'e'

1

>>> fourth = input('Year: ')[3]

Year: 2005

>>> fourth '5' month_number = int(month) day_number = int(day)

# 别忘了将表示月和日的数减1,这样才能得到正确的索引 month_name = months[month_number-1]

ordinal = day + endings[day_number-1]

print(month_name + ' ' + ordinal + ', ' + year)

这个程序的运行情况类似于下面这样:

Year: 1974 Month (1-12): 8 Day (1-31): 16 August 16th, 1974

最后一行为这个程序的输出。

2.2.2 切片

除使用索引来访问单个元素外,还可使用切片(slicing)来访问特定范围内的元素。为此,

可使用两个索引,并用冒号分隔:

>>> tag = '<a href="http://www.python.org">Python web site</a>'

>>> tag[9:30]

'http://www.python.org'

>>> tag[32:-4]

'Python web site'

如你所见,切片适用于提取序列的一部分,其中的编号非常重要:第一个索引是包含的第一 个元素的编号,但第二个索引是切片后余下的第一个元素的编号。请看下面的示例:

>>> numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

>>> numbers[3:6] [4, 5, 6]

>>> numbers[0:1] [1]

简而言之,你提供两个索引来指定切片的边界,其中第一个索引指定的元素包含在切片内,

但第二个索引指定的元素不包含在切片内。

1. 绝妙的简写

假设你要访问前述数字列表中的最后三个元素,显然可以明确地指定这一点。

>>> numbers[7:10]

[8, 9, 10]

在这里,索引10指的是第11个元素:它并不存在,但确实是到达最后一个元素后再前进一步 所处的位置。明白了吗?如果要从列表末尾开始数,可使用负数索引。

>>> numbers[-3:-1]

[8, 9]

然而,这样好像无法包含最后一个元素。如果使用索引0,即到达列表末尾后再前进一步所 处的位置,结果将如何呢?

>>> numbers[-3:0]

[]

结果并不是你想要的。事实上,执行切片操作时,如果第一个索引指定的元素位于第二个索 引指定的元素后面(在这里,倒数第3个元素位于第1个元素后面),结果就为空序列。好在你能 使用一种简写:如果切片结束于序列末尾,可省略第二个索引。

>>> numbers[-3:]

[8, 9, 10]

同样,如果切片始于序列开头,可省略第一个索引。

>>> numbers[:3]

[1, 2, 3]

1

>>> numbers[:]

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

代码清单2-2是一个小程序,它提示用户输入一个URL,并从中提取域名。(这里假定输入的 URL类似于http://www.somedomainname.com。)

代码清单2-2 切片操作示例

# 从类似于http://www.something.com的URL中提取域名 url = input('Please enter the URL:')

domain = url[11:-4]

print("Domain name: " + domain)

这个程序的运行情况类似于下面这样:

Please enter the URL: http://www.python.org Domain name: python

2. 更大的步长

执行切片操作时,你显式或隐式地指定起点和终点,但通常省略另一个参数,即步长。在普 通切片中,步长为1。这意味着从一个元素移到下一个元素,因此切片包含起点和终点之间的所 有元素。

>>> numbers[0:10:1]

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

在这个示例中,指定了另一个数。你可能猜到了,这显式地指定了步长。如果指定的步长大 于1,将跳过一些元素。例如,步长为2时,将从起点和终点之间每隔一个元素提取一个元素。

>>> numbers[0:10:2]

[1, 3, 5, 7, 9]

numbers[3:6:3]

[4]

显式地指定步长时,也可使用前述简写。例如,要从序列中每隔3个元素提取1个,只需提供 步长4即可。

>>> numbers[::4]

[1, 5, 9]

当然,步长不能为0,否则无法向前移动,但可以为负数,即从右向左提取元素。

>>> numbers[8:3:-1]

[9, 8, 7, 6, 5]

>>> numbers[10:0:-2]

[10, 8, 6, 4, 2]

>>> numbers[0:10:-2]

[]

>>> numbers[::-2]

[10, 8, 6, 4, 2]

>>> numbers[5::-2]

[6, 4, 2]

>>> numbers[:5:-2]

[10, 8]

在这种情况下,要正确地提取颇费思量。如你所见,第一个索引依然包含在内,而第二个索 引不包含在内。步长为负数时,第一个索引必须比第二个索引大。可能有点令人迷惑的是,当你 省略起始和结束索引时,Python竟然执行了正确的操作:步长为正数时,它从起点移到终点,而 步长为负数时,它从终点移到起点。

2.2.3 序列相加

可使用加法运算符来拼接序列。

>>> [1, 2, 3] + [4, 5, 6]

[1, 2, 3, 4, 5, 6]

>>> 'Hello,' + 'world!' 'Hello, world!'

>>> [1, 2, 3] + 'world!' Traceback (innermost last):

File "<pyshell>", line 1, in ? [1, 2, 3] + 'world!'

TypeError: can only concatenate list (not "string") to list

从错误消息可知,不能拼接列表和字符串,虽然它们都是序列。一般而言,不能拼接不同类 型的序列。

2.2.4 乘法

将序列与数x相乘时,将重复这个序列x次来创建一个新序列:

>>> 'python' * 5

'pythonpythonpythonpythonpython'

>>> [42] * 10

[42, 42, 42, 42, 42, 42, 42, 42, 42, 42]

None、空列表和初始化

空列表是使用不包含任何内容的两个方括号([])表示的。如果要创建一个可包含10个元素 的列表,但没有任何有用的内容,可像前面那样使用[42]*10。但更准确的做法是使用[0]*10, 这将创建一个包含10个零的列表。然而,在有些情况下,你可能想使用表示“什么都没有”的值,

如表示还没有在列表中添加任何内容。在这种情况下,可使用None。在Python中,None表示什么 都没有。因此,要将列表的长度初始化为10,可像下面这样做:

>>> sequence = [None] * 10

>>> sequence

[None, None, None, None, None, None, None, None, None, None]

代码清单2-3所示的程序在屏幕上打印一个由字符组成的方框。这个方框位于屏幕中央,宽 度取决于用户提供的句子的长度。这些代码看似很复杂,但基本上只使用了算术运算:计算需要

1

sentence = input("Sentence: ")

screen_width = 80

text_width = len(sentence) box_width = text_width + 6

left_margin = (screen_width - box_width) // 2 print()

Sentence: He's a very naughty boy!

+---+

>>> permissions = 'rw'

>>> 'w' in permissions True

>>> 'x' in permissions False

>>> users = ['mlh', 'foo', 'bar']

>>> input('Enter your user name: ') in users Enter your user name: mlh

True

>>> subject = '$$$ Get rich now!!! $$$'

>>> '$$$' in subject True

开头两个示例使用成员资格测试分别检查'w'和'x'是否包含在字符串变量permissions中。在 UNIX系统中,可在脚本中使用这两行代码来检查对文件的写入和执行权限。接下来的示例检查 提供的用户名mlh是否包含在用户列表中,这在程序需要执行特定的安全策略时很有用(在这种 情况下,可能还需检查密码)。最后一个示例检查字符串变量subject是否包含字符串'$$$',这 可用于垃圾邮件过滤器中。

注意 相比于其他示例,检查字符串是否包含'$$$'的示例稍有不同。一般而言,运算符in检查 指定的对象是否是序列(或其他集合)的成员(即其中的一个元素),但对字符串来说,

只有它包含的字符才是其成员或元素,因此下面的代码完全合理:

>>> 'P' in 'Python' True

事实上,在较早的Python版本中,只能对字符串执行这种成员资格检查——确定指定的 字符是否包含在字符串中,但现在可使用运算符in来检查指定的字符串是否为另一个字 符串的子串。

代码清单2-4所示的程序从用户那里获取一个用户名和一个PIN码,并检查它们组成的列表是 否包含在数据库(实际上也是一个列表)中。如果用户名PIN码对包含在数据库中,就打印字符 串'Access granted'(if语句在第1章提到过,并将在第5章全面介绍)。

代码清单2-4 序列成员资格示例

# 检查用户名和PIN码 database = [

['albert', '1234'], ['dilbert', '4242'], ['smith', '7524'], ['jones', '9843']

]

username = input('User name: ') pin = input('PIN code: ')

if [username, pin] in database: print('Access granted')

长度、最小值和最大值

内置函数len、min和max很有用,其中函数len返回序列包含的元素个数,而min和max分别返 回序列中最小和最大的元素(对象比较将在5.4.6节的“比较运算符”部分详细介绍)。

>>> numbers = [100, 34, 678]

>>> len(numbers) 3

>>> max(numbers) 678

>>> min(numbers)

1