歡迎光臨
每天分享高質量文章

面試必備 | 帶你徹底搞懂 Python 生成器

(點擊上方公眾號,可快速關註一起學Python)

來源: Python空間   鏈接:

https://mp.weixin.qq.com/s/mDh15ML7YyONc62sYSD3tw

寫在之前

 

Python 的高級語言特性一直是我們學習 Python 的一個難點,大部分人並沒有做到熟練的掌握,甚至去學習它都感覺很困難,「生成器」作為其中甚是有用的特性之一,更是如此。

 

因為在其它的主流語言(C/C++/JAVA)中並沒有生成器的概念,加之其具有一定的難度,學習起來花費的時間成本較大,很多人自我安慰式的視其為“雞肋”,然後果斷放棄如此有用的一個高級語言特性,實在是一件很惋惜的事情。

 

其實不光是對於「生成器」而言,對於其它的高級語言特性還是建議大家要花點時間去搞懂的,不說其它,這些東西作為面試中常考的內容也應該引起你的重視,畢竟公司不是傻瓜,沒有用的東西幹嘛要考你?

 

接下來就讓我們來一起學習「生成器」,我儘量用大家都聽的懂的話,層層遞進的講解,保證大家都能看懂,前提是要有耐心,文章較長,建議先收藏再看。

 

答應我,一定要有耐心。

 

迭代器

 

在這說「迭代器」的原因是生成器」自動實現了「迭代器協議」,所謂協議,就是一種約定為了更好的理解生成器,我們需要簡單知道一下「迭代器協議」到底是個什麼東西。其實只需要滿足兩個兩個條件:1.實現 __iter__ 方法;2.物件實現 next() 方法,要麼傳回迭代中的下一項,要麼就是以 StopIteration 異常終止迭代。

 

物件就是「可迭代物件」,即實現了迭代器協議的物件,它實現了迭代器協議。其實像是 Python 中 for 迴圈,sum 函式等等就是使用迭代器協議訪問物件。

 

生成器

 

如果你理解了上一節的內容,那麼恭喜你,接下來學習「生成器」就會簡單很多。Python 使用生成器對「延遲操作」提供了支持,所謂「延遲操作」就是在需要它的時候才產生結果,而不是說立即產生結果。

 

Python 其實有兩種不同的方法來提供生成器,一種是函式形式,另一種是運算式形式,說全一點兒就是「生成器函式」和「生成器運算式」。

 

1.生成器函式

 

「生成器函式」和普通的函式定義類似。區別在於普通函式使用 return 傳回結果,生成器函式是用 yield 傳回結果。

 

yield 的作用是在呼叫的時候傳回相應的值,一次傳回一個結果,在每個結果中間掛起函式的狀態(即暫停執行),下一次執行是從上次暫停的位置開始,繼續向下執行。

 

下麵我們來做一道題,要求寫出「將一個全是整數的串列進行操作後只保留奇數」。相信大多數人都能很快的寫出下麵這樣的函式:

 

def get_odd(lst):
    res = []
    for i in lst:
        if i % 2:
            res.append(i)
    return res

def main():
    lst = range(10)
    for i in get_odd(lst):
        print(i)

if __name__ == '__main__':
    main()

上面這個沒什麼難度,既然我們學了「生成器」,我在前面還這麼舔它,是不是我們該用生成器來做一下這道題?看看用生成器來做同樣的功能,到底有什麼不同:

 

def get_odd(lst):
    for i in lst:
        if i % 2:
            yield i

def main():
    lst = range(10)
    for i in get_odd(lst):
        print(i)

if __name__ == '__main__':
    main()

對比一下這個功能的兩種做法,使用「生成器」以後,代碼變的行數更少了(省去了對 res 的操作,不用把結果存在 res 里),代碼整體看起來更清晰了(一看就知道幹嘛的,不用一上來去想 res 是個什麼鬼,append 進去的是個什麼玩意兒)。

 

2.生成器運算式

 

「生成器運算式」和串列推導式類似。區別在於使用串列推導,一次會產生所有的結果,而用「生成器運算式」則不會這樣,它是按需產生。

 

串列推導式的寫法如下:

 

>>> res = [x for x in range(5)]
>>> res
[0, 1, 2, 3, 4]

生成器運算式就是將上面的 [] 變成 () 即可:

 

>>> res = (x for x in range(5))
>>> res
 at 0x109d9f570>
>>> next(res)
0
>>> next(res)
1
>>> next(res)
2
>>> next(res)
3

我們也順便簡單的看一下「生成器」的優勢在「生成器運算式」中是怎麼體現的。如果我們想對一系列整數求和,直接用生成器可以寫成下麵這樣:

 

>>> sum((x for x in range(5)))
10

當然為了方便起見,也可以省略圓括號,即寫成下麵這樣:

 

>>> sum(x for x in range(5))
10

但是如果你用常規的寫法去寫,就會寫成下麵這樣:

 

>>> sum([x for x in range(5)])
10

上面的代碼先構造了一個串列,然後再用 sum 函式求和,多了一步,天差地別,光在時間效率上,就已經輸掉了褲子。

 

所以綜合上面文章所講,「生成器」光在明面上的優點就有好幾個:代碼行數更少;代碼更易讀;時效更高…

 

所以,你還敢視它為“雞肋”嗎?

 

(完)

看完本文有收穫?請轉發分享給更多人

關註「Python那些事」,做全棧開發工程師

    赞(0)

    分享創造快樂