0be34fcd34a743413465bb8ef106b215c37b867f
[python-guide.git] / docs / writing / style.rst
1 Code Style
2 ==========
3
4 If you ask Python programmers what they like most in Python, they will
5 often say its high readability.  Indeed, a high level of readability
6 is at the heart of the design of the Python language, following the
7 recognised fact that code is read much more often than it is written.
8
9 One reason for Python code to be easily read and understood is its relatively
10 complete set of Code Style guidelines and "Pythonic" idioms.
11
12 Moreover, when a veteran Python developer (a Pythonistas) point to some
13 parts of a code and say it is not "Pythonic", it usually means that these lines
14 of code do not follow the common guidelines and fail to express the intent in
15 what is considered the best (hear: most readable) way.
16
17 On some border cases, no best way has been agreed upon on how to express
18 an intent in Python code, but these cases are rare.
19
20 General concepts
21 ----------------
22
23 Explicit code
24 ~~~~~~~~~~~~~
25
26 While any kind of black magic is possible with Python, the
27 most explicit and straightforward manner is preferred.
28
29 **Bad**
30
31 .. code-block:: python
32
33     def make_complex(\*args):
34         x, y = args
35         return dict(\**locals())
36
37 **Good**
38
39 .. code-block:: python
40
41     def make_complex(x, y):
42         return {'x': x, 'y': y}
43
44 In the good code above, x and y are explicitely received from
45 the caller, and an explicit dictionary is returned. The developer
46 using this function knows exactly what to do by reading the
47 first and last lines, which is not the case with the bad example.
48
49 One statement per line
50 ~~~~~~~~~~~~~~~~~~~~~~
51
52 While some compound statements such as list comprehensions are
53 allowed and appreciated for their brevity and their expressivity,
54 it is bad practice to have two disjoint statements on the same line.
55
56 **Bad**
57
58 .. code-block:: python
59
60     print 'one'; print 'two'
61
62     if x == 1: print 'one'
63
64     if <complex comparison> and <other complex comparison>:
65         # do something
66
67 **Good**
68
69 .. code-block:: python
70
71     print 'one'
72     print 'two'
73
74     if x == 1:
75         print 'one'
76
77     cond1 = <complex comparison>
78     cond2 = <other complex comparison>
79     if cond1 and cond2:
80         # do something
81
82 Function arguments
83 ~~~~~~~~~~~~~~~~~~
84
85 Arguments can be passed to functions in four different ways.
86
87 **Positional arguments** are mandatory and have no default values. They are the
88 simplest form of arguments and they can be used for the few function arguments
89 that are fully part of the functions meaning and their order is natural. For
90 instance, in ``send(message, recipient)`` or ``point(x, y)`` the user of the
91 function has no difficulty to remember that those two function require two
92 arguments, and in which order.
93
94 In those two cases, it is possible to use argument names when calling the functions
95 and, doing so, it is possible to switch the order of arguments, calling for instance
96 ``send(recipient='World', message='Hello')`` and ``point(y=2, x=1)`` but this
97 reduce readability and is unnecessarily verbose, compared to the more straightforward
98 calls to ``send('Hello', 'World')`` and ``point(1, 2)``.
99
100 **Keyword arguments** are not mandatory and have default values. They are often
101 used for optional parameters sent to the function. When a function has more than
102 two or three positional parameters, its signature will be more difficult to remember
103 and using keyword argument with default values is helpful. For instance, a more
104 complete ``send`` function could be defined as ``send(message, to, cc=None, bcc=None)``.
105 Here ``cc`` and ``bcc`` are optional, and evaluate to ``None`` when the are not
106 passed another value.
107
108 Calling a function with keyword arguments can be done in multiple ways in Python,
109 for example it is possible to follow the order of arguments in the definition without
110 explicitely naming the arguments, like in ``send('Hello', 'World', 'Cthulhu`, 'God')``,
111 sending a blank carbon copy to God. It would also be possible to name arguments in
112 another order, like in ``send('Hello again', 'World', bcc='God', cc='Cthulhu')``.
113 Those two possibilities are better avoided whitout any strong reason to not
114 follow the syntax that is the closest to the function definition: ``send('Hello',
115 'World', cc='Cthulhu', bcc='God')``.
116
117 As a side note, following YAGNI_ principle, it is often harder to remove an
118 optional argument (and its logic inside the function) that was added "just in
119 case" and is seemingly never used, than to add a new optional argument and its
120 logic when needed.
121
122 The **arbitrary argument list** is the third way to pass arguments to a
123 function.  If the function intention is better expressed by a signature with an
124 extensible number of positional arguments, it can be defined with the ``*args``
125 constructs.  In the function body, ``args`` will be a tuple of all the
126 remaining positional arguments. For example, ``send(message, *args)`` can be
127 called with each recipient as an argument: ``send('Hello', 'God', 'Mom',
128 'Cthulhu')``, and in the function body ``args`` will be equal to ``('God',
129 'Mom', 'Cthulhu')``.
130
131 However, this construct has some drawback and should be used with caution. If a
132 function receives a list of arguments of the same nature, it is often more
133 clear to define it as a function of one argument, that argument being a list or
134 any sequence. Here, if ``send`` has multiple recipients, it is better to define
135 it explicitely: ``send(message, recipients)`` and call it with ``send('Hello',
136 ['God', 'Mom', 'Cthulhu'])``. This way, the user of the function can manipulate
137 the recipient list as a list beforhand, and it opens the possibility to pass
138 any sequence, inculding iterators, that cannot be unpacked as other sequences.
139
140 The **arbitrary keyword argument dictionary** is the last way to pass arguments
141 to functions. If the function requires an undetermined serie of named
142 arguments, it is possible to used the ``**kwargs`` construct. In the function
143 body, ``kwargs`` will be a dictionary of all the passed named arguments that
144 have not been caught be other keyword argument in the function signature.
145
146 The same caution as in the case of *arbitrary argument list* is necessary, for
147 similar reasons: these powerful techniques are to be used when there is a
148 proven necessity to use them, and they should not be used if the simpler and
149 clearer construct is sufficient to express the function's intention.
150
151 It is up to the programmer writing the function to determine which arguments
152 are positional argmuents and which are optional keyword arguments, and to
153 decide wheter to use the advanced techniques of arbitrary argument passing. If
154 the advices above are followed wisely, it is possible and enjoyable to write
155 Python functions that are:
156
157 * easy to read (the name and arguments need no explanations)
158
159 * easy to change (adding a new keyword argument do not break other parts of the
160   code)
161
162 Avoid the magical wand
163 ~~~~~~~~~~~~~~~~~~~~~~
164
165 A powerful tool for hackers, Python comes with a very rich set of hooks and
166 tools allowing to do almost any kind of tricky tricks. For instance, it is
167 possible to change how objects are created and instanciated, it is possible to
168 change how the Python interpreter imports modules, it is even possible (and
169 recommended if needed) to embed C routines in Python.
170
171 However, all these options have many drawbacks and it is always better to use
172 the most straightforward way to achieve your goal. The main drawback is that
173 readability suffers deeply from them. Many code analysis tools, such as pylint
174 or pyflakes, will be unable to parse this "magic" code.
175
176 We consider that a Python developer should know about these nearly infinite
177 possibilities, because it grows the confidence that no hard-wall will be on the
178 way.  However, knowing how to use them and particularly when **not** to use
179 them is the most important.
180
181 Like a Kungfu master, a pythonistas knows how to kill with a single finger, and
182 never do it.
183
184 We are all consenting adults
185 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~
186
187 As seen above, Python allows many tricks, and some of them are potentially
188 dangerous. A good example is that any client code can override an object's
189 properties and methods: there is no "private" keyword in Python. This
190 philosophy, very different from highly defensive languages like Java, which
191 give a lot of mechanism to prevent any misuse, is expressed by the saying: "We
192 are consenting adults".
193
194 This doesn't mean that, for example, no properties are considered private, and
195 that no proper encapsulation is possible in Python. But, instead of relying on
196 concrete walls erected by the developers between their code and other's, the
197 Python community prefers to rely on a set of convention indicating that these
198 elements should not be accessed directly.
199
200 The main convention for private properties and implementation details is to
201 prefix all "internals" with an underscore. If the client code breaks this rule
202 and access to these marked elements, any misbehavior or problems encountered if
203 the code is modified is the responsibility of the client code.
204
205 Using this convention generously is encouraged: any method or property that is
206 not intended to be used by client code should be prefixed with an underscore.
207 This will guarantee a better separation of duties and easier modifications of
208 existing code, and it will always be possible to publicize a private property,
209 while privatising a public property might be a much harder operation.
210
211 Idioms
212 ------
213
214 Idiomatic Python code is often referred to as being *Pythonic*.
215
216 .. _unpacking-ref:
217
218 Unpacking
219 ~~~~~~~~~
220
221 If you know the length of a list or tuple, you can assign names to its
222 elements with unpacking:
223
224 .. code-block:: python
225
226     for index, item in enumerate(some_list):
227         # do something with index and item
228
229 You can use this to swap variables, as well:
230
231 .. code-block:: python
232
233     a, b = b, a
234
235 Create an ignored variable
236 ~~~~~~~~~~~~~~~~~~~~~~~~~~
237
238 If you need to assign something (for instance, in :ref:`unpacking-ref`) but
239 will not need that variable, use ``__``:
240
241 .. code-block:: python
242
243     filename = 'foobar.txt'
244     basename, __, ext = filename.rpartition()
245
246 .. note::
247
248    Many Python style guides recommend the use of a single underscore "``_``"
249    for throwaway variables rather than the double underscore "``__``"
250    recommended here. The issue is that "``_``" is commonly used as an alias
251    for the :func:`~gettext.gettext` function, and is also used at the
252    interactive prompt to hold the value of the last operation. Using a
253    double underscore instead is just as clear and almost as convenient,
254    and eliminates the risk of accidentally interfering with either of
255    these other use cases.
256
257 Create a length-N list of the same thing
258 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
259
260 Use the Python list ``*`` operator:
261
262 .. code-block:: python
263
264     four_nones = [None] * 4
265
266 Create a length-N list of lists
267 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
268
269 Because lists are mutable, the ``*`` operator (as above) will create a list
270 of N references to the `same` list, which is not likely what you want.
271 Instead, use a list comprehension:
272
273 .. code-block:: python
274
275     four_lists = [[] for _ in xrange(4)]
276
277
278 A common idiom for creating strings is to use `join <http://docs.python.org/library/string.html#string.join>`_ on an empty string.::
279
280     letters = ['s', 'p', 'a', 'm']
281     word = ''.join(letters)
282
283 This will set the value of the variable *word* to 'spam'. This idiom can be applied to lists and tuples.
284
285 Sometimes we need to search through a collection of things. Let's look at two options: lists and dictionaries.
286
287 Take the following code for example::
288
289     d = {'s': [], 'p': [], 'a': [], 'm': []}
290     l = ['s', 'p', 'a', 'm']
291
292     def lookup_dict(d):
293         return 's' in d
294
295     def lookup_list(l):
296         return 's' in l
297
298 Even though both functions look identical, because *lookup_dict* is utilizing the fact that dictionaries in python are hashtables, the lookup performance between the two is very different.
299 Python will have to go through each item in the list to find a matching case, which is time consuming. By analysing the hash of the dictionary finding keys in the dict can be done very quickly.
300 For more information see this `StackOverflow <http://stackoverflow.com/questions/513882/python-list-vs-dict-for-look-up-table>`_ page.
301
302 Zen of Python
303 -------------
304
305 Also known as PEP 20, the guiding principles for Python's design.
306
307 ::
308
309     >>> import this
310     The Zen of Python, by Tim Peters
311
312     Beautiful is better than ugly.
313     Explicit is better than implicit.
314     Simple is better than complex.
315     Complex is better than complicated.
316     Flat is better than nested.
317     Sparse is better than dense.
318     Readability counts.
319     Special cases aren't special enough to break the rules.
320     Although practicality beats purity.
321     Errors should never pass silently.
322     Unless explicitly silenced.
323     In the face of ambiguity, refuse the temptation to guess.
324     There should be one-- and preferably only one --obvious way to do it.
325     Although that way may not be obvious at first unless you're Dutch.
326     Now is better than never.
327     Although never is often better than *right* now.
328     If the implementation is hard to explain, it's a bad idea.
329     If the implementation is easy to explain, it may be a good idea.
330     Namespaces are one honking great idea -- let's do more of those!
331
332 For some examples of good Python style, see `this Stack Overflow question
333 <http://stackoverflow.com/questions/228181/the-zen-of-python>`_ or `these
334 slides from a Python user group
335 <http://artifex.org/~hblanks/talks/2011/pep20_by_example.pdf>`_.
336
337 PEP 8
338 -----
339
340 PEP 8 is the de-facto code style guide for Python.
341
342     `PEP 8 <http://www.python.org/dev/peps/pep-0008/>`_
343
344 Conforming your Python code to PEP 8 is generally a good idea and helps make
345 code more consistent when working on projects with other developers. There
346 exists a command-line program, `pep8 <https://github.com/jcrocholl/pep8>`_,
347 that can check your code for conformance. Install it by running the following
348 command in your Terminal:
349
350 ::
351
352     $ pip install pep8
353
354
355 Then run it on a file or series of files to get a report of any violations.
356
357 ::
358
359     $ pep8 optparse.py
360     optparse.py:69:11: E401 multiple imports on one line
361     optparse.py:77:1: E302 expected 2 blank lines, found 1
362     optparse.py:88:5: E301 expected 1 blank line, found 0
363     optparse.py:222:34: W602 deprecated form of raising exception
364     optparse.py:347:31: E211 whitespace before '('
365     optparse.py:357:17: E201 whitespace after '{'
366     optparse.py:472:29: E221 multiple spaces before operator
367     optparse.py:544:21: W601 .has_key() is deprecated, use 'in'
368
369 Conventions
370 :::::::::::
371
372 Here are some conventions you should follow to make your code easier to read.
373
374 Check if variable equals a constant
375 -----------------------------------
376
377 You don't need to explicitly compare a value to True, or None, or 0 - you can
378 just add it to the if statement. See `Truth Value Testing
379 <http://docs.python.org/library/stdtypes.html#truth-value-testing>`_ for a
380 list of what is considered false.
381
382 **Bad**:
383
384 .. code-block:: python
385
386     if attr == True:
387         print 'True!'
388
389     if attr == None:
390         print 'attr is None!'
391
392 **Good**:
393
394 .. code-block:: python
395
396     # Just check the value
397     if attr:
398         print 'attr is truthy!'
399
400     # or check for the opposite
401     if not attr:
402         print 'attr is falsey!'
403
404     # or, since None is considered false, explicity check for it
405     if attr is None:
406         print 'attr is None!'
407
408 Access a Dictionary Element
409 ---------------------------
410
411 Don't use the ``has_key`` function. Instead use ``x in d`` syntax, or pass
412 a default argument to ``get``.
413
414 **Bad**:
415
416 .. code-block:: python
417
418     d = {'hello': 'world'}
419     if d.has_key('hello'):
420         print d['hello']    # prints 'world'
421     else:
422         print 'default_value'
423
424 **Good**:
425
426 .. code-block:: python
427
428     d = {'hello': 'world'}
429
430     print d.get('hello', 'default_value') # prints 'world'
431     print d.get('thingy', 'default_value') # prints 'default_value'
432
433     # Or:
434     if 'hello' in d:
435         print d['hello']
436
437 Short Ways to Manipulate Lists
438 ------------------------------
439
440 `List comprehensions
441 <http://docs.python.org/tutorial/datastructures.html#list-comprehensions>`_
442 provide a powerful, concise way to work with lists. Also, the `map
443 <http://docs.python.org/library/functions.html#map>`_ and `filter
444 <http://docs.python.org/library/functions.html#filter>`_ functions can perform
445 operations on lists using a different concise syntax.
446
447 **Bad**:
448
449 .. code-block:: python
450
451     # Filter elements greater than 4
452     a = [3, 4, 5]
453     b = []
454     for i in a:
455         if i > 4:
456             b.append(i)
457
458 **Good**:
459
460 .. code-block:: python
461
462     b = [i for i in a if i > 4]
463     b = filter(lambda x: x > 4, a)
464
465 **Bad**:
466
467 .. code-block:: python
468
469     # Add three to all list members.
470     a = [3, 4, 5]
471     count = 0
472     for i in a:
473         a[count] = i + 3
474         count = count + 1
475
476 **Good**:
477
478 .. code-block:: python
479
480     a = [3, 4, 5]
481     a = [i + 3 for i in a]
482     # Or:
483     a = map(lambda i: i + 3, a)
484
485 Use `enumerate <http://docs.python.org/library/functions.html#enumerate>`_ to
486 keep a count of your place in the list.
487
488 .. code-block:: python
489
490     for i, item in enumerate(a):
491         print i + ", " + item
492     # prints
493     # 0, 3
494     # 1, 4
495     # 2, 5
496
497 The ``enumerate`` function has better readability than handling a counter
498 manually. Moreover,
499 it is better optimized for iterators.
500
501 Read From a File
502 ----------------
503
504 Use the ``with open`` syntax to read from files. This will automatically close
505 files for you.
506
507 **Bad**:
508
509 .. code-block:: python
510
511     f = open('file.txt')
512     a = f.read()
513     print a
514     f.close()
515
516 **Good**:
517
518 .. code-block:: python
519
520     with open('file.txt') as f:
521         for line in f:
522             print line
523
524 The ``with`` statement is better because it will ensure you always close the
525 file, even if an exception is raised.
526
527 Returning Multiple Values from a Function
528 -----------------------------------------
529
530 Python supports returning multiple values from a function as a comma-separated
531 list, so you don't have to create an object or dictionary and pack multiple
532 values in before you return
533
534 **Bad**:
535
536 .. code-block:: python
537
538     def math_func(a):
539         return {'square': a ** 2, 'cube': a ** 3}
540
541     d = math_func(3)
542     s = d['square']
543     c = d['cube']
544
545 **Good**:
546
547 .. code-block:: python
548
549     def math_func(a):
550         return a ** 2, a ** 3
551
552     square, cube = math_func(3)
553
554 Line Continuations
555 ~~~~~~~~~~~~~~~~~~
556
557 When a logical line of code is longer than the accepted limit, you need to
558 split it over multiple physical lines. Python interpreter will join consecutive
559 lines if the last character of the line is a backslash. This is helpful
560 sometime but is preferably avoided, because of its fragility: a white space
561 added to the end of the line, after the backslash, will break the code and may
562 have unexpected results.
563
564 A prefered solution is to use parenthesis around your elements. Left with an
565 unclosed parenthesis on an end-of-line the Python interpreter will join the
566 next line until the parenthesis is closed. The same behavior holds for curly
567 and square braces.
568
569 **Bad**:
570
571 .. code-block:: python
572
573     my_very_big_string = """For a long time I used to go to bed early. Sometimes, \
574         when I had put out my candle, my eyes would close so quickly that I had not even \
575         time to say “I’m going to sleep.”"""
576
577     from some.deep.module.inside.a.module import a_nice_function, another_nice_function, \
578         yet_another_nice_functio
579
580 **Good**:
581
582 .. code-block:: python
583
584     my_very_big_string = (
585         "For a long time I used to go to bed early. Sometimes, "
586         "when I had put out my candle, my eyes would close so quickly "
587         "that I had not even time to say “I’m going to sleep.”"
588     )
589
590     from some.deep.module.inside.a.module import (
591         a_nice_function, another_nice_function, yet_another_nice_function)
592
593 However, more often than not having to split long logical line is a sign that
594 you are trying to do too many things at the same time, which may hinder
595 readability.