メインコンテンツに移動
確率分布とは?意味・種類・期待値・実務での見方を整理
確率分布とは?意味・種類・期待値・実務での見方を整理

統計や機械学習を学び始めると、かなり早い段階で 確率分布 という言葉に出会います。

モンテカルロ推定とは?乱数サンプリングで近似する考え方を整理
モンテカルロ推定とは?乱数サンプリングで近似する考え方を整理

数理モデルや統計、機械学習、金融工学、物理シミュレーションの世界では、理論上は定義できても、解析的にきれいな形では求めにくい量が数多く現れます。

機械学習における尤度とは?確率との違い・最尤推定・実務での意味を整理
機械学習における尤度とは?確率との違い・最尤推定・実務での意味を整理

機械学習や統計を学んでいると、かなり早い段階で 尤度 という言葉に出会います。

強化学習におけるPPOとは?安定性・他手法との違いを整理
強化学習におけるPPOとは?安定性・他手法との違いを整理

強化学習を学び始めると、価値関数をどう推定するか、方策をどう更新するか、探索と活用をどう両立させるかといった論点に何度も出会います。

機械学習におけるActor-Criticとは?役割・代表手法を整理
機械学習におけるActor-Criticとは?役割・代表手法を整理

強化学習を学び始めると、比較的早い段階で 方策ベース と 価値ベース という二つの考え方に出会います。

AIアラインメントとは?意味・重要性・課題・実現方法を整理
AI
AIアラインメントとは?意味・重要性・課題・実現方法を整理

AIが実用の中心に近づくほど、「高性能であること」と「望ましく使えること」は別の問題になります。

LINE Chat