2020年3月3日 星期二

generator, generator, 多少 iterator 假汝之名而行

Design Patterns (1994) 自從寫就以來,對程式語言本身似乎沒什麼影響,因為大家都找到自己的方法去實踐。一個例外是 python 的 yield 指令,它嘗試以原生的機制來做到迭代子 (iterator) 功能,通常配合的是 for / next。

拋開這些術語不談,實務上當我們使用迴圈時,會有個邏輯來告訴我們如何取得下一個元素,以及如何回傳結果(如果需要的話)。最簡單的情況,下個元素是累加 1 ,結果則寫入一個串列,並在迴圈結束時回傳 (return)。當下個元素不是累加 1 這麼單純時,若不先生成整個序列,那麼如何能達成相同的目的呢? 直觀上我們可以先生成所要迭代的元素序列。

然而出於記憶體的考量,類似檔案處理為何要走 streaming ,如果能生成每個元素時都立即進行所要的運算,那麼即使整個序列很大也沒關係。其次,生成下個元素的邏輯可以獨立於對元素的運算而抽象化,成為一個可重用的架構,這是第二個好處。

實作上典型的 yield 迭代因此就會有兩層迴圈,內層產生序列,外層逐一取得序列的元素,進行所要的運算。內層迴圈約定好去寫成一個函數,稱為 generator (定義上就是一個有回傳值的 iterator) ,外層則是第一段提到的 for / next 。內層迴圈一旦產生新元素,就必需有個機制暫停內圈執行、保存狀態、回傳元素,這就是 yield 的功用。外層迴圈以 for 迭代 generator ,隱式呼叫了 next 函數,暫停外圈執行、保存狀態、啟動/繼續內圈執行。內圈被執行後會執行到 yield (或結束迴圈產生例外,外圈依約定結束迭代,太細了處不談)暫停內圈執行、保存狀態並回傳元素。外圈取得元素並繼續執行,直到再回到 for 而隱式呼叫 next ,如此週而復始。

說實在的不用 yield 也能依 design pattern 做到相同的事,但是 yield 的工作條件實在太特殊了,這就是一個見仁見智的語言設計。隱約看得到 goto 的影子,不是嗎XD

下圖取自 python yield 語法與 generator 物件介紹

沒有留言:

張貼留言