10个易被忽视但应掌握的Python基本用法
我一辈子都在写代码,但从来没有掌握编码的精髓。大部分情况下使用Visual Basic,因为我用VB最舒服。同时还略微了解一点其他语言(R、C、JavaScript、Applescript、Hypertext和1979年学习的BASIC)。几年前,我决定只用Python,以此来提高我的编码能力。在此过程中重复发明了许多轮子,但我并不介意,因为我享受解决问题的乐趣。同时有时能发现更有效、Python式的解决方案。时间长了以后,会有顿悟的时刻,意识到根本没必要用困难且冗长的方式处理问题。下面列出10条Python用法,如果我早点发现,也许能节省很多时间。
这里没有列表推导和lambda函数。虽然这两个用法都是Python式的,效率高也非常酷,但由于经常在StackOverflow或其他地方碰到,所以学Python的应该都知道这两个东西。同时也没有三元运算符、装饰器和生成器,因为我很少用到。
本文还有一个IPython notebook nbviewer版本。
1. 在Python 2中使用Python 3式的输出
Python 2与Python 3不兼容,这让我不知道该选择哪个版本的Python。最终我选择了Python 2,因为当时许多我需要用的库都与Python 3不兼容。
但实际上,日常使用中最大的版本差异是输出(print)和除法行为。现在我在Python 2的代码中都用import from future来导入Python 3的输出和除法。现在我用到的几乎所有库都支持Python 3,因此会很快迁移到Python 3中。
mynumber = 5 print "Python 2:" print "The number is %d" % (mynumber) print mynumber / 2, print mynumber // 2 from __future__ import print_function from __future__ import division print('nPython 3:') print("The number is {}".format(mynumber)) print(mynumber / 2, end=' ') print(mynumber // 2) Python 2: The number is 5 2 2 Python 3: The number is 5 2.5 2
对了,对于C系的那些更喜欢括号而不是缩进的开发者,这里还有一个彩蛋:
from __future__ import braces File "", line 1 from __future__ import braces SyntaxError: not a chance
2. enumerate(list)
很明显,迭代列表时,应该同时迭代其中的元素及其索引,但在很长一段时间内,我都尴尬的使用计数变量或切片。
mylist = ["It's", 'only', 'a', 'model'] for index, item in enumerate(mylist): print(index, item) 0 It's 1 only 2 a 3 model
3. 链式比较操作符
由于我以前使用的是静态语言(在这些语言中该用法有二义性),从来没有将两个比较操作符放在一个表达式中。在许多语言中,4 > 3 > 2会返回False,因为4 > 3的结果是布尔值,而True > 2将得出False。
mynumber = 3 if 4 > mynumber > 2: print("Chained comparison operators work! n" * 3) Chained comparison operators work! Chained comparison operators work! Chained comparison operators work!
4. collections.Counter
Python的集合库看上去是最好的。在计算需要集合中元素的个数时,StackOverflow找到的答案是创建有序字典,但我坚持使用一个代码片段来创建字典,计算结果中元素出现的频率。直到有一天,我发现可以用collections.deque。
from collections import Counter from random import randrange import pprint mycounter = Counter() for i in range(100): random_number = randrange(10) mycounter[random_number] += 1 for i in range(10): print(i, mycounter[i])
0 10 1 10 2 13 3 6 4 6 5 11 6 10 7 14 8 12 9 8
5. 字典推导
Python开发者的一个重要标志就是理解列表推导,但最终我发现字典推导也很有用,特别是在交换字典的键和值的时候。
my_phrase = ["No", "one", "expects", "the", "Spanish", "Inquisition"] my_dict = {key: value for value, key in enumerate(my_phrase)} print(my_dict) reversed_dict = {value: key for key, value in my_dict.items()} print(reversed_dict)
{'Inquisition': 5, 'No': 0, 'expects': 2, 'one': 1, 'Spanish': 4, 'the': 3} {0: 'No', 1: 'one', 2: 'expects', 3: 'the', 4: 'Spanish', 5: 'Inquisition'}
6. 用subprocess执行shell命令
以前,我使用os库调用外部命令处理文件,而现在我可以在Python中以编码的方式执行诸如ffmpeg这样的复杂命令进行视频编辑。
(是的,我和我的客户都使用Windows,如果你们因此鄙视我,我会大方地接受!)
注意,用os库完成这个特定命令比用subprocess更好。我只想有一个大家都熟悉的命令。同时,一般来说,在subprocess中使用shell=True参数是非常糟糕的主意,在这里使用这个参数仅仅是为了能在一个IPython notebook单元中放置命令的输出。不要自己使用这个参数!
import subprocess output = subprocess.check_output('dir', shell=True) print(output)
Volume in drive C is OS Volume Serial Number is [REDACTED] Directory of C:UsersDavidDocuments[REDACTED] 2014-11-26 06:04 AM <DIR> . 2014-11-26 06:04 AM <DIR> .. 2014-11-23 11:47 AM <DIR> .git 2014-11-26 06:06 AM <DIR> .ipynb_checkpoints 2014-11-23 08:59 AM <DIR> CCCma 2014-09-03 06:58 AM 19,450 colorbrewdict.py 2014-09-03 06:58 AM 92,175 imagecompare.ipynb 2014-11-23 08:41 AM <DIR> Japan_Earthquakes 2014-09-03 06:58 AM 1,100 LICENSE 2014-09-03 06:58 AM 5,263 monty_monte.ipynb 2014-09-03 06:58 AM 31,082 pocket_tumblr_reddit_api.ipynb 2014-11-26 06:04 AM 3,211 README.md 2014-11-26 06:14 AM 19,898 top_10_python_idioms.ipynb 2014-09-03 06:58 AM 5,813 tree_convert_mega_to_gexf.ipynb 2014-09-03 06:58 AM 5,453 tree_convert_mega_to_json.ipynb 2014-09-03 06:58 AM 1,211 tree_convert_newick_to_json.py 2014-09-03 06:58 AM 55,970 weather_ML.ipynb 11 File(s) 240,626 bytes 6 Dir(s) 180,880,490,496 bytes free
7. 字典的.get()和.iteritems()方法
字典的get()方法可以设置默认值,当用get()查找的键不存在时,返回方法中的默认值参数是很有用的。与列表中的enumerate()相同,可以用键值元组迭代字典中的元素。
my_dict = {'name': 'Lancelot', 'quest': 'Holy Grail', 'favourite_color': 'blue'} print(my_dict.get('airspeed velocity of an unladen swallow', 'African or European?n')) for key, value in my_dict.iteritems(): print(key, value, sep=": ") African or European? quest: Holy Grail name: Lancelot favourite_color: blue
8. 用于交换元素的元组解包
在VB中,每当需要交换两个变量时,都要用要一个愚蠢的临时变量:c = a; a = b; b = c
a = 'Spam' b = 'Eggs' print(a, b) a, b = b, a print(a, b) Spam Eggs Eggs Spam
9. 内省工具Introspection tools
我知道dir()方法,我本以为help()方法和IPython中的?魔法命令是一样的,但help()的功能更强大。
my_dict = {'That': 'an ex-parrot!'} help(my_dict)
Help on dict object: class dict(object) | dict() -> new empty dictionary | dict(mapping) -> new dictionary initialized from a mapping object's | (key, value) pairs | dict(iterable) -> new dictionary initialized as if via: | d = {} | for k, v in iterable: | d[k] = v | dict(**kwargs) -> new dictionary initialized with the name=value pairs | in the keyword argument list. For example: dict(one=1, two=2) | | Methods defined here: | | __cmp__(...) | x.__cmp__(y) <==> cmp(x,y) | | __contains__(...) | D.__contains__(k) -> True if D has a key k, else False | | __delitem__(...) | x.__delitem__(y) <==> del x[y] | | __eq__(...) | x.__eq__(y) <==> x==y | [TRUNCATED FOR SPACE] | | update(...) | D.update([E, ]**F) -> None. Update D from dict/iterable E and F. | If E present and has a .keys() method, does: for k in E: D[k] = E[k] | If E present and lacks .keys() method, does: for (k, v) in E: D[k] = v | In either case, this is followed by: for k in F: D[k] = F[k] | | values(...) | D.values() -> list of D's values | | viewitems(...) | D.viewitems() -> a set-like object providing a view on D's items | | viewkeys(...) | D.viewkeys() -> a set-like object providing a view on D's keys | | viewvalues(...) | D.viewvalues() -> an object providing a view on D's values | | ---------------------------------------------------------------------- | Data and other attributes defined here: | | __hash__ = None | | __new__ = | T.__new__(S, ...) -> a new object with type S, a subtype of T
10. PEP-8兼容的字符串连接
PEP8是Python编码样式指南。撇开其他的不看,PEP8要求每行不能超过80个字符,超过的部分要换行并缩进。
可以通过反斜杠、带逗号“,”的圆括号“()”、或者额外的加号“+”来完成换行。但对于多行字符串,这些解决方案都不够优雅。Python有个多行字符串记号,即三个引号,但这样无法换行后保持缩进。
还有一个方法,那就是不带逗号的圆括号。我不知道为什么这种方式能工作,但能用就行。
my_long_text = ("We are no longer the knights who say Ni! " "We are now the knights who say ekki-ekki-" "ekki-p'tang-zoom-boing-z'nourrwringmm!") print(my_long_text)
we are no longer the knights who say Ni! We are now the knights who say ekki-ekki-ekki-p'tang-zoom-boing-z'nourrwringmm!