2018-01-01から1年間の記事一覧
データ分析では正規分布を仮定することが多いが、生存時間分析・信頼性工学では、ワイブル分布を仮定することが多い。これはワイブル分布が、形状パラメータ・尺度パラメータによって、所謂バスタブカーブの3要素(初期故障、偶発故障、摩耗)を表現可能で…
この章の例題をpymcで実装してみた。 pymcによる実装の課題は以下の通り。 順序付けを行うorderedが、pymcにはない(と思われる) 単純にMCMCを実行するとエラーで実行できない 1点目は、以前のドラゴンボールの戦闘力推定の実装を使った。 gaiasky.hatenabl…
名前のとおり、ゼロが多いポアソン分布ということで、ベルヌーイ分布とポアソン分布を組み合わせたZIP分布を使った例題。 StanとRでベイズ統計モデリング (Wonderful R) [ 松浦 健太郎 ]ジャンル: 本・雑誌・コミック > PC・システム開発 > プログラミング…
8.4章のロジスティック回帰は、ある一つの項目(出席/欠席)についてのみ考えるが、多項ロジスティック回帰は複数の項目について考える。 StanとRでベイズ統計モデリング (Wonderful R) [ 松浦 健太郎 ]ジャンル: 本・雑誌・コミック > PC・システム開発 >…
この例題は、学生の出席/欠席を、アルバイト好きか、学問への興味、天気などのデータから予測するもので、 学生差や科目差を考慮した階層モデルになっている。 StanとRでベイズ統計モデリング (Wonderful R) [ 松浦 健太郎 ]ジャンル: 本・雑誌・コミック …
StanとRでベイズ統計モデリングの8.3「非線形モデルの階層モデル」をpymcで実装してみる、というお話。 この本は実践的な例題が多く、非常に参考になる。ただし、タイトルの通りだが、RとStanの実装。 StanとRでベイズ統計モデリング (Wonderful R) [ 松浦…
久保先生の緑本6章には、応答変数が非負であったり、ばらつきを正規分布で仮定できない場合として、ガンマ分布を用いた例がある。ガンマ分布のGLMもRやpythonのstatsmodelsを使った例はよく見るが、pymcで実装した例は見当たらなかっため、実装してみること…
前回の記事で、pymc3の公式HPに、ラグビーチームの戦力をモデル化する例題があることに触れた。 https://docs.pymc.io/notebooks/rugby_analytics.html これは、各チームの攻撃力、防御力にホーム効果の有無を付けたものになっている。 これはラグビーだけで…
pymc3のExampleには、ラグビーチームの攻撃力や防御力をモデル化する例がある。 https://docs.pymc.io/notebooks/rugby_analytics.html こういったモデル化もあるのかと思っていると、世の中には、面白いことを考える人がいて、ドラゴンボールのキャラの戦闘…
世の中には非常に優秀な人がいるもので、中古マンション価格について、そのスペックだけでなく、駅・路線の効果を分析した方がいる。(すごい!) http://smrmkt.hatenablog.jp/entry/2014/11/17/234538 原著者の方は幾つかのモデルを試行錯誤的に検討されて…
前回紹介した「ベイズ統計モデリング」では、MCMCの効率的な実行のため、データの前処理として、標準化または平均化が推奨されている。 ベイズ統計モデリング R、JAGS、 Stanによるチュートリアル 原著第2版 [ John K. Kruschke ]ジャンル: 本・雑誌・コミッ…
モデルの表記形式 ベイズ推定におけるモデルの表記形式としては、有向グラフが最も一般的であろうと思う。 一方、「ベイズ統計モデリング」の原著者であるKruschke先生は、新しい表記形式でモデルを記載している。 ベイズ統計モデリング R、JAGS、 Stanによ…
CAR model(条件つき自己回帰モデル) いわゆる久保先生の緑本(データ解析のための統計モデリング入門)11章で紹介されている空間構造を考慮したモデル。 データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC (シリーズ確率と…
ベイズ統計モデリングをpymc3を使って学ぶ 最近、ベイズ統計モデリングに興味があり、勉強をはじめた。学んだ結果の記録も兼ねて、ブログもやってみることに。 幾つかのWebや書籍を調べてみると、ツールとしてはstanが主流の模様。Rやpythonのラッパもあるよ…