「 ↑ 2つのアルゴリズムを比べてみて、どっちが うまいぐあいに 報酬を儲けてるかを
折れ線グラフにしたものだぜ」
「 どっちが うまいぐあいに設けてんの?」

「 ステップを多く繰り返すと ε-greedy という方が ちょっぴり多く儲けてるな」
「 その差は そんなにいいもんなのかだぜ?」

「 知らね」

「 ↑ どんどん サンプルを試していこうぜ?」

「 猿みたいにキーボード叩いてるけど 頭使ってんの?」

「 使ってるぜ!」

「 ↑ 本のコードが 合ってね~」
「 じゃあ仮に 学習率イータを0.1、時間割引率ガンマを0.9 にして進めろだぜ」

「 へい」

「 ↑ Python にはデフォルト引数という便利なものがあるので 勝手に改造したろ」

「 ↑ 飽きてきたぜ」

「 それが学習部を作るということなのよ」

「 ↑ ダメだ、4章4節のコードは エラーが出るぜ。
古いバージョンに落として動かすほど がんばりたくないんで やーめた」

「 じゃあ 5章を見てみようぜ?」

「 ↑ ランダムムーブで 3目並べだぜ」

「 そんな復習 やらなくていいのでは?」

「 ↑ サンプルプログラムがなんかバグってて、それを直すのも めんどくさいぜ!」

「 もうその本 投げ捨てていいんじゃないの?」

「 アルファゼロの強化学習を覚える本なのに、そこまで行けないじゃないか」

「 わたしに ディープラーニングをやる基礎がないようだぜ」