4198c276b623b9a5c0c03e4b9adfe79530af1c9b
[python-guide.git] / docs / writing / style.rst
1 Code Style
2 ==========
3
4 If you ask Python programmers what they like most in Python, they will
5 often say its high readability.  Indeed, a high level of readability
6 is at the heart of the design of the Python language, following the
7 recognised fact that code is read much more often than it is written.
8
9 One reason for Python code to be easily read and understood is its relatively
10 complete set of Code Style guidelines and "Pythonic" idioms.
11
12 Moreover, when a veteran Python developer (a Pythonistas) point to some
13 parts of a code and say it is not "Pythonic", it usually means that these lines
14 of code do not follow the common guidelines and fail to express the intent in
15 what is considered the best (hear: most readable) way.
16
17 On some border cases, no best way has been agreed upon on how to express
18 an intent in Python code, but these cases are rare.
19
20 General concepts
21 ----------------
22
23 Explicit code
24 ~~~~~~~~~~~~~
25
26 While any kind of black magic is possible with Python, the
27 most explicit and straightforward manner is preferred.
28
29 **Bad**
30
31 .. code-block:: python
32
33     def make_complex(\*args):
34         x, y = args
35         return dict(\**locals())
36
37 **Good**
38
39 .. code-block:: python
40
41     def make_complex(x, y):
42         return {'x': x, 'y': y}
43
44 In the good code above, x and y are explicitely received from
45 the caller, and an explicit dictionary is returned. The developer
46 using this function knows exactly what to do by reading the
47 first and last lines, which is not the case with the bad example.
48
49 One statement per line
50 ~~~~~~~~~~~~~~~~~~~~~~
51
52 While some compound statements such as list comprehensions are
53 allowed and appreciated for their brevity and their expressivity,
54 it is bad practice to have two disjoint statements on the same line.
55
56 **Bad**
57
58 .. code-block:: python
59
60     print 'one'; print 'two'
61
62     if x == 1: print 'one'
63
64     if <complex comparison> and <other complex comparison>:
65         # do something
66
67 **Good**
68
69 .. code-block:: python
70
71     print 'one'
72     print 'two'
73
74     if x == 1:
75         print 'one'
76
77     cond1 = <complex comparison>
78     cond2 = <other complex comparison>
79     if cond1 and cond2:
80         # do something
81
82 Function arguments
83 ~~~~~~~~~~~~~~~~~~
84
85 Arguments can be passed to functions in four different ways.
86
87 **Positional arguments** are mandatory and have no default values. They are the
88 simplest form of arguments and they can be used for the few function arguments
89 that are fully part of the functions meaning and their order is natural. For
90 instance, in ``send(message, recipient)`` or ``point(x, y)`` the user of the
91 function has no difficulty to remember that those two function require two
92 arguments, and in which order.
93
94 In those two cases, it is possible to use argument names when calling the functions
95 and, doing so, it is possible to switch the order of arguments, calling for instance
96 ``send(recipient='World', message='Hello')`` and ``point(y=2, x=1)`` but this
97 reduce readability and is unnecessarily verbose, compared to the more straightforward
98 calls to ``send('Hello', 'World')`` and ``point(1, 2)``.
99
100 **Keyword arguments** are not mandatory and have default values. They are often
101 used for optional parameters sent to the function. When a function has more than
102 two or three positional parameters, its signature will be more difficult to remember
103 and using keyword argument with default values is helpful. For instance, a more
104 complete ``send`` function could be defined as ``send(message, to, cc=None, bcc=None)``.
105 Here ``cc`` and ``bcc`` are optional, and evaluate to ``None`` when the are not
106 passed another value.
107
108 Calling a function with keyword arguments can be done in multiple ways in Python,
109 for example it is possible to follow the order of arguments in the definition without
110 explicitely naming the arguments, like in ``send('Hello', 'World', 'Cthulhu`, 'God')``,
111 sending a blank carbon copy to God. It would also be possible to name arguments in
112 another order, like in ``send('Hello again', 'World', bcc='God', cc='Cthulhu')``.
113 Those two possibilities are better avoided whitout any strong reason to not
114 follow the syntax that is the closest to the function definition: ``send('Hello',
115 'World', cc='Cthulhu', bcc='God')``.
116
117 As a side note, following YAGNI_ principle, it is often harder to remove an
118 optional argument (and its logic inside the function) that was added "just in
119 case" and is seemingly never used, than to add a new optional argument and its
120 logic when needed.
121
122 The **arbitrary argument list** is the third way to pass arguments to a
123 function.  If the function intention is better expressed by a signature with an
124 extensible number of positional arguments, it can be defined with the ``*args``
125 constructs.  In the function body, ``args`` will be a tuple of all the
126 remaining positional arguments. For example, ``send(message, *args)`` can be
127 called with each recipient as an argument: ``send('Hello', 'God', 'Mom',
128 'Cthulhu')``, and in the function body ``args`` will be equal to ``('God',
129 'Mom', 'Cthulhu')``.
130
131 However, this construct has some drawback and should be used with caution. If a
132 function receives a list of arguments of the same nature, it is often more
133 clear to define it as a function of one argument, that argument being a list or
134 any sequence. Here, if ``send`` has multiple recipients, it is better to define
135 it explicitely: ``send(message, recipients)`` and call it with ``send('Hello',
136 ['God', 'Mom', 'Cthulhu'])``. This way, the user of the function can manipulate
137 the recipient list as a list beforhand, and it opens the possibility to pass
138 any sequence, inculding iterators, that cannot be unpacked as other sequences.
139
140 The **arbitrary keyword argument dictionary** is the last way to pass arguments
141 to functions. If the function requires an undetermined serie of named
142 arguments, it is possible to used the ``**kwargs`` construct. In the function
143 body, ``kwargs`` will be a dictionary of all the passed named arguments that
144 have not been caught be other keyword argument in the function signature.
145
146 The same caution as in the case of *arbitrary argument list* is necessary, for
147 similar reasons: these powerful techniques are to be used when there is a
148 proven necessity to use them, and they should not be used if the simpler and
149 clearer construct is sufficient to express the function's intention.
150
151 It is up to the programmer writing the function to determine which arguments
152 are positional argmuents and which are optional keyword arguments, and to
153 decide wheter to use the advanced techniques of arbitrary argument passing. If
154 the advices above are followed wisely, it is possible and enjoyable to write
155 Python functions that are:
156
157 * easy to read (the name and arguments need no explanations)
158
159 * easy to change (adding a new keyword argument do not break other parts of the
160   code)
161
162 Avoid the magical wand
163 ~~~~~~~~~~~~~~~~~~~~~~
164
165 A powerful tool for hackers, Python comes with a very rich set of hooks and
166 tools allowing to do almost any kind of tricky tricks. For instance, it is
167 possible to change how objects are created and instanciated, it is possible to
168 change how the Python interpreter imports modules, it is even possible (and
169 recommended if needed) to embed C routines in Python.
170
171 However, all these options have many drawbacks and it is always better to use
172 the most straightforward way to achieve your goal. The main drawback is that
173 readability suffers deeply from them. Many code analysis tools, such as pylint
174 or pyflakes, will be unable to parse this "magic" code.
175
176 We consider that a Python developer should know about these nearly infinite
177 possibilities, because it grows the confidence that no hard-wall will be on the
178 way.  However, knowing how to use them and particularly when **not** to use
179 them is the most important.
180
181 Like a Kungfu master, a pythonistas knows how to kill with a single finger, and
182 never do it.
183
184 We are all consenting adults
185 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~
186
187 As seen above, Python allows many tricks, and some of them are potentially
188 dangerous. A good example is that any client code can override an object's
189 properties and methods: there is no "private" keyword in Python. This
190 philosophy, very different from highly defensive languages like Java, which
191 give a lot of mechanism to prevent any misuse, is expressed by the saying: "We
192 are consenting adults".
193
194 This doesn't mean that, for example, no properties are considered private, and
195 that no proper encapsulation is possible in Python. But, instead of relying on
196 concrete walls erected by the developers between their code and other's, the
197 Python community prefers to rely on a set of convention indicating that these
198 elements should not be accessed directly.
199
200 The main convention for private properties and implementation details is to
201 prefix all "internals" with an underscore. If the client code breaks this rule
202 and access to these marked elements, any misbehavior or problems encountered if
203 the code is modified is the responsibility of the client code.
204
205 Using this convention generously is encouraged: any method or property that is
206 not intended to be used by client code should be prefixed with an underscore.
207 This will guarantee a better separation of duties and easier modifications of
208 existing code, and it will always be possible to publicize a private property,
209 while privatising a public property might be a much harder operation.
210
211 Idioms
212 ------
213
214 Idiomatic Python code is often referred to as being *Pythonic*.
215
216 .. _unpacking-ref:
217
218 Unpacking
219 ~~~~~~~~~
220
221 If you know the length of a list or tuple, you can assign names to its
222 elements with unpacking:
223
224 .. code-block:: python
225
226     for index, item in enumerate(some_list):
227         # do something with index and item
228
229 You can use this to swap variables, as well:
230
231 .. code-block:: python
232
233     a, b = b, a
234
235 Nested unpacking works too:
236
237 .. code-block:: python
238
239    a, (b, c) = 1, (2, 3)
240
241 Create an ignored variable
242 ~~~~~~~~~~~~~~~~~~~~~~~~~~
243
244 If you need to assign something (for instance, in :ref:`unpacking-ref`) but
245 will not need that variable, use ``__``:
246
247 .. code-block:: python
248
249     filename = 'foobar.txt'
250     basename, __, ext = filename.rpartition()
251
252 .. note::
253
254    Many Python style guides recommend the use of a single underscore "``_``"
255    for throwaway variables rather than the double underscore "``__``"
256    recommended here. The issue is that "``_``" is commonly used as an alias
257    for the :func:`~gettext.gettext` function, and is also used at the
258    interactive prompt to hold the value of the last operation. Using a
259    double underscore instead is just as clear and almost as convenient,
260    and eliminates the risk of accidentally interfering with either of
261    these other use cases.
262
263 Create a length-N list of the same thing
264 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
265
266 Use the Python list ``*`` operator:
267
268 .. code-block:: python
269
270     four_nones = [None] * 4
271
272 Create a length-N list of lists
273 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
274
275 Because lists are mutable, the ``*`` operator (as above) will create a list
276 of N references to the `same` list, which is not likely what you want.
277 Instead, use a list comprehension:
278
279 .. code-block:: python
280
281     four_lists = [[] for _ in xrange(4)]
282
283
284 A common idiom for creating strings is to use `join <http://docs.python.org/library/string.html#string.join>`_ on an empty string.::
285
286     letters = ['s', 'p', 'a', 'm']
287     word = ''.join(letters)
288
289 This will set the value of the variable *word* to 'spam'. This idiom can be applied to lists and tuples.
290
291 Sometimes we need to search through a collection of things. Let's look at two options: lists and dictionaries.
292
293 Take the following code for example::
294
295     d = {'s': [], 'p': [], 'a': [], 'm': []}
296     l = ['s', 'p', 'a', 'm']
297
298     def lookup_dict(d):
299         return 's' in d
300
301     def lookup_list(l):
302         return 's' in l
303
304 Even though both functions look identical, because *lookup_dict* is utilizing the fact that dictionaries in python are hashtables, the lookup performance between the two is very different.
305 Python will have to go through each item in the list to find a matching case, which is time consuming. By analysing the hash of the dictionary finding keys in the dict can be done very quickly.
306 For more information see this `StackOverflow <http://stackoverflow.com/questions/513882/python-list-vs-dict-for-look-up-table>`_ page.
307
308 Zen of Python
309 -------------
310
311 Also known as PEP 20, the guiding principles for Python's design.
312
313 ::
314
315     >>> import this
316     The Zen of Python, by Tim Peters
317
318     Beautiful is better than ugly.
319     Explicit is better than implicit.
320     Simple is better than complex.
321     Complex is better than complicated.
322     Flat is better than nested.
323     Sparse is better than dense.
324     Readability counts.
325     Special cases aren't special enough to break the rules.
326     Although practicality beats purity.
327     Errors should never pass silently.
328     Unless explicitly silenced.
329     In the face of ambiguity, refuse the temptation to guess.
330     There should be one-- and preferably only one --obvious way to do it.
331     Although that way may not be obvious at first unless you're Dutch.
332     Now is better than never.
333     Although never is often better than *right* now.
334     If the implementation is hard to explain, it's a bad idea.
335     If the implementation is easy to explain, it may be a good idea.
336     Namespaces are one honking great idea -- let's do more of those!
337
338 For some examples of good Python style, see `this Stack Overflow question
339 <http://stackoverflow.com/questions/228181/the-zen-of-python>`_ or `these
340 slides from a Python user group
341 <http://artifex.org/~hblanks/talks/2011/pep20_by_example.pdf>`_.
342
343 PEP 8
344 -----
345
346 PEP 8 is the de-facto code style guide for Python.
347
348     `PEP 8 <http://www.python.org/dev/peps/pep-0008/>`_
349
350 Conforming your Python code to PEP 8 is generally a good idea and helps make
351 code more consistent when working on projects with other developers. There
352 exists a command-line program, `pep8 <https://github.com/jcrocholl/pep8>`_,
353 that can check your code for conformance. Install it by running the following
354 command in your Terminal:
355
356 ::
357
358     $ pip install pep8
359
360
361 Then run it on a file or series of files to get a report of any violations.
362
363 ::
364
365     $ pep8 optparse.py
366     optparse.py:69:11: E401 multiple imports on one line
367     optparse.py:77:1: E302 expected 2 blank lines, found 1
368     optparse.py:88:5: E301 expected 1 blank line, found 0
369     optparse.py:222:34: W602 deprecated form of raising exception
370     optparse.py:347:31: E211 whitespace before '('
371     optparse.py:357:17: E201 whitespace after '{'
372     optparse.py:472:29: E221 multiple spaces before operator
373     optparse.py:544:21: W601 .has_key() is deprecated, use 'in'
374
375 Conventions
376 :::::::::::
377
378 Here are some conventions you should follow to make your code easier to read.
379
380 Check if variable equals a constant
381 -----------------------------------
382
383 You don't need to explicitly compare a value to True, or None, or 0 - you can
384 just add it to the if statement. See `Truth Value Testing
385 <http://docs.python.org/library/stdtypes.html#truth-value-testing>`_ for a
386 list of what is considered false.
387
388 **Bad**:
389
390 .. code-block:: python
391
392     if attr == True:
393         print 'True!'
394
395     if attr == None:
396         print 'attr is None!'
397
398 **Good**:
399
400 .. code-block:: python
401
402     # Just check the value
403     if attr:
404         print 'attr is truthy!'
405
406     # or check for the opposite
407     if not attr:
408         print 'attr is falsey!'
409
410     # or, since None is considered false, explicity check for it
411     if attr is None:
412         print 'attr is None!'
413
414 Access a Dictionary Element
415 ---------------------------
416
417 Don't use the ``has_key`` function. Instead use ``x in d`` syntax, or pass
418 a default argument to ``get``.
419
420 **Bad**:
421
422 .. code-block:: python
423
424     d = {'hello': 'world'}
425     if d.has_key('hello'):
426         print d['hello']    # prints 'world'
427     else:
428         print 'default_value'
429
430 **Good**:
431
432 .. code-block:: python
433
434     d = {'hello': 'world'}
435
436     print d.get('hello', 'default_value') # prints 'world'
437     print d.get('thingy', 'default_value') # prints 'default_value'
438
439     # Or:
440     if 'hello' in d:
441         print d['hello']
442
443 Short Ways to Manipulate Lists
444 ------------------------------
445
446 `List comprehensions
447 <http://docs.python.org/tutorial/datastructures.html#list-comprehensions>`_
448 provide a powerful, concise way to work with lists. Also, the `map
449 <http://docs.python.org/library/functions.html#map>`_ and `filter
450 <http://docs.python.org/library/functions.html#filter>`_ functions can perform
451 operations on lists using a different concise syntax.
452
453 **Bad**:
454
455 .. code-block:: python
456
457     # Filter elements greater than 4
458     a = [3, 4, 5]
459     b = []
460     for i in a:
461         if i > 4:
462             b.append(i)
463
464 **Good**:
465
466 .. code-block:: python
467
468     b = [i for i in a if i > 4]
469     b = filter(lambda x: x > 4, a)
470
471 **Bad**:
472
473 .. code-block:: python
474
475     # Add three to all list members.
476     a = [3, 4, 5]
477     count = 0
478     for i in a:
479         a[count] = i + 3
480         count = count + 1
481
482 **Good**:
483
484 .. code-block:: python
485
486     a = [3, 4, 5]
487     a = [i + 3 for i in a]
488     # Or:
489     a = map(lambda i: i + 3, a)
490
491 Use `enumerate <http://docs.python.org/library/functions.html#enumerate>`_ to
492 keep a count of your place in the list.
493
494 .. code-block:: python
495
496     for i, item in enumerate(a):
497         print i + ", " + item
498     # prints
499     # 0, 3
500     # 1, 4
501     # 2, 5
502
503 The ``enumerate`` function has better readability than handling a counter
504 manually. Moreover,
505 it is better optimized for iterators.
506
507 Read From a File
508 ----------------
509
510 Use the ``with open`` syntax to read from files. This will automatically close
511 files for you.
512
513 **Bad**:
514
515 .. code-block:: python
516
517     f = open('file.txt')
518     a = f.read()
519     print a
520     f.close()
521
522 **Good**:
523
524 .. code-block:: python
525
526     with open('file.txt') as f:
527         for line in f:
528             print line
529
530 The ``with`` statement is better because it will ensure you always close the
531 file, even if an exception is raised.
532
533 Returning Multiple Values from a Function
534 -----------------------------------------
535
536 Python supports returning multiple values from a function as a comma-separated
537 list, so you don't have to create an object or dictionary and pack multiple
538 values in before you return
539
540 **Bad**:
541
542 .. code-block:: python
543
544     def math_func(a):
545         return {'square': a ** 2, 'cube': a ** 3}
546
547     d = math_func(3)
548     s = d['square']
549     c = d['cube']
550
551 **Good**:
552
553 .. code-block:: python
554
555     def math_func(a):
556         return a ** 2, a ** 3
557
558     square, cube = math_func(3)
559
560 Line Continuations
561 ~~~~~~~~~~~~~~~~~~
562
563 When a logical line of code is longer than the accepted limit, you need to
564 split it over multiple physical lines. Python interpreter will join consecutive
565 lines if the last character of the line is a backslash. This is helpful
566 sometime but is preferably avoided, because of its fragility: a white space
567 added to the end of the line, after the backslash, will break the code and may
568 have unexpected results.
569
570 A prefered solution is to use parenthesis around your elements. Left with an
571 unclosed parenthesis on an end-of-line the Python interpreter will join the
572 next line until the parenthesis is closed. The same behavior holds for curly
573 and square braces.
574
575 **Bad**:
576
577 .. code-block:: python
578
579     my_very_big_string = """For a long time I used to go to bed early. Sometimes, \
580         when I had put out my candle, my eyes would close so quickly that I had not even \
581         time to say “I’m going to sleep.”"""
582
583     from some.deep.module.inside.a.module import a_nice_function, another_nice_function, \
584         yet_another_nice_functio
585
586 **Good**:
587
588 .. code-block:: python
589
590     my_very_big_string = (
591         "For a long time I used to go to bed early. Sometimes, "
592         "when I had put out my candle, my eyes would close so quickly "
593         "that I had not even time to say “I’m going to sleep.”"
594     )
595
596     from some.deep.module.inside.a.module import (
597         a_nice_function, another_nice_function, yet_another_nice_function)
598
599 However, more often than not having to split long logical line is a sign that
600 you are trying to do too many things at the same time, which may hinder
601 readability.