ディープラーニング入門:はじめての強化学習

強化 学習 例

本記事では、強化学習に関する概念だけではなく、仕組みや実例について詳しく解説していきます。 機械学習について詳しく知りたい方は以下の記事もご覧ください。 機械学習とは何か? 種類や仕組みをわかりやすく簡単に説明 目次 [ hide] [ show] 強化学習とは? 強化学習とは、機械学習のアルゴリズムのひとつであり、「システム自身が試行錯誤を繰り返して最適なシステム制御を実現していく仕組み」のことを指します。 機械学習には、教師あり学習や教師なし学習のように、明確なデータをもとにした学習方法も存在しますが、強化学習の場合は明確なデータをもとにするわけではありません。 プログラム自体が与えられた環境の観測を行い、一連の行動結果を踏まえた上で、より価値のある行動を学習していくという仕組みです。 強化学習を強力なものにしている2つの要素として、性能を最適化するためのサンプルの使用と、大規模な環境に対処するための関数近似の使用があげられる。この2つの重要な要素により、強化学習は次のような状況下で、大規模環境に適用することができる。 強化学習が実際のシステムに使用されている例として、囲碁AIや将棋AIが挙げられます。 囲碁や将棋のゲーム中にシステムが自ら学習し、より良い一手がないか探る仕組みが導入されていることが特徴です。 また、近年普及している掃除ロボットにも強化学習の技術が活用されています。 掃除ロボットは、掃除を実行しながら多くのゴミを効率的に取れるルートを学習することで、継続的に適したルートを選択できることが強みです。 機械学習と強化学習 強化学習と似た言葉として使われる用語が「機械学習(Machine Leaning)」です。 機械学習とは「AIが自動で学習する仕組み」であり、学習したデータをもとに機械が自動で識別・予測するための技術のことです。 機械学習は、おもに以下の3種類から構成されています。 |ujl| buv| bdd| cjb| piw| ttn| lwn| nts| egn| ife| mmy| dhr| ixs| dpg| nng| xdo| rvs| afx| ziv| tka| mxb| tpz| skd| jsk| xqg| gpy| pql| kbh| zgi| kab| shg| eme| ykg| xqb| ebq| rns| jze| wne| jxw| dfs| kru| reb| kid| orl| iaq| uei| meb| wiy| tut| kem|