gaiaskyの技術メモ

ベイズ、機械学習などのデータサイエンスがテーマ。言語はpythonで。

2018-01-01から1年間の記事一覧

ベイズ生存時間分析(Weibull分布)

データ分析では正規分布を仮定することが多いが、生存時間分析・信頼性工学では、ワイブル分布を仮定することが多い。これはワイブル分布が、形状パラメータ・尺度パラメータによって、所謂バスタブカーブの3要素(初期故障、偶発故障、摩耗)を表現可能で…

アヒル本10章棋士の強さのモデル化をpymcでやってみる。

この章の例題をpymcで実装してみた。 pymcによる実装の課題は以下の通り。 順序付けを行うorderedが、pymcにはない(と思われる) 単純にMCMCを実行するとエラーで実行できない 1点目は、以前のドラゴンボールの戦闘力推定の実装を使った。 gaiasky.hatenabl…

アヒル本11章ゼロ過剰ポアソン分布をpymcでやってみる。

名前のとおり、ゼロが多いポアソン分布ということで、ベルヌーイ分布とポアソン分布を組み合わせたZIP分布を使った例題。 StanとRでベイズ統計モデリング (Wonderful R) [ 松浦 健太郎 ]ジャンル: 本・雑誌・コミック > PC・システム開発 > プログラミング…

アヒル本10章多項ロジスティック回帰をpymcでやってみる。

8.4章のロジスティック回帰は、ある一つの項目(出席/欠席)についてのみ考えるが、多項ロジスティック回帰は複数の項目について考える。 StanとRでベイズ統計モデリング (Wonderful R) [ 松浦 健太郎 ]ジャンル: 本・雑誌・コミック > PC・システム開発 >…

アヒル本8.4章ロジスティック回帰階層モデルをpymcでやってみる。

この例題は、学生の出席/欠席を、アルバイト好きか、学問への興味、天気などのデータから予測するもので、 学生差や科目差を考慮した階層モデルになっている。 StanとRでベイズ統計モデリング (Wonderful R) [ 松浦 健太郎 ]ジャンル: 本・雑誌・コミック …

アヒル本8.3章非線形モデルの階層モデルをpymcでやってみる。

StanとRでベイズ統計モデリングの8.3「非線形モデルの階層モデル」をpymcで実装してみる、というお話。 この本は実践的な例題が多く、非常に参考になる。ただし、タイトルの通りだが、RとStanの実装。 StanとRでベイズ統計モデリング (Wonderful R) [ 松浦…

ガンマ回帰モデル(緑本6章)

久保先生の緑本6章には、応答変数が非負であったり、ばらつきを正規分布で仮定できない場合として、ガンマ分布を用いた例がある。ガンマ分布のGLMもRやpythonのstatsmodelsを使った例はよく見るが、pymcで実装した例は見当たらなかっため、実装してみること…

2018年Jリーグの各チームの戦力をモデル化する

前回の記事で、pymc3の公式HPに、ラグビーチームの戦力をモデル化する例題があることに触れた。 https://docs.pymc.io/notebooks/rugby_analytics.html これは、各チームの攻撃力、防御力にホーム効果の有無を付けたものになっている。 これはラグビーだけで…

戦闘力のモデル化をpymcでやってみる。

pymc3のExampleには、ラグビーチームの攻撃力や防御力をモデル化する例がある。 https://docs.pymc.io/notebooks/rugby_analytics.html こういったモデル化もあるのかと思っていると、世の中には、面白いことを考える人がいて、ドラゴンボールのキャラの戦闘…

中古マンション価格における駅・路線の影響分析をpymcでやってみる。

世の中には非常に優秀な人がいるもので、中古マンション価格について、そのスペックだけでなく、駅・路線の効果を分析した方がいる。(すごい!) http://smrmkt.hatenablog.jp/entry/2014/11/17/234538 原著者の方は幾つかのモデルを試行錯誤的に検討されて…

MCMCにおける標準化処理の効果について

前回紹介した「ベイズ統計モデリング」では、MCMCの効率的な実行のため、データの前処理として、標準化または平均化が推奨されている。 ベイズ統計モデリング R、JAGS、 Stanによるチュートリアル 原著第2版 [ John K. Kruschke ]ジャンル: 本・雑誌・コミッ…

Kruschkeのモデルダイアグラム

モデルの表記形式 ベイズ推定におけるモデルの表記形式としては、有向グラフが最も一般的であろうと思う。 一方、「ベイズ統計モデリング」の原著者であるKruschke先生は、新しい表記形式でモデルを記載している。 ベイズ統計モデリング R、JAGS、 Stanによ…

空間統計モデル(CAR model)をpymc3で。(緑本11章)

CAR model(条件つき自己回帰モデル) いわゆる久保先生の緑本(データ解析のための統計モデリング入門)11章で紹介されている空間構造を考慮したモデル。 データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC (シリーズ確率と…

pymc3を始める。

ベイズ統計モデリングをpymc3を使って学ぶ 最近、ベイズ統計モデリングに興味があり、勉強をはじめた。学んだ結果の記録も兼ねて、ブログもやってみることに。 幾つかのWebや書籍を調べてみると、ツールとしてはstanが主流の模様。Rやpythonのラッパもあるよ…