mathhunの日記

Haskellと機械学習の勉強日記。PRML読みます。

R

RJagsでMCMCやってみた (緑本9章)

データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)作者: 久保拓弥出版社/メーカー: 岩波書店発売日: 2012/05/19メディア: 単行本購入: 16人 クリック: 163回この商品を含むブログ (18件) を見る9章の例題…

Python Pandasメモ

Rを先に覚えたので、Rだと簡単に書けるようになったもののそれと同じ事をPython(numpy+pandas)でやりたいときに良いやり方が思いつかない AND ググっても時間がかかる AND 多分すぐ忘れる。 ので特にはまったのをメモしておく。 DataFrame ある条件を満たす…

正規分布 vs t分布 - 外れ値に影響されやすい度グラフ化してみた

PRML 図2.16を再現してみた。まずはグラフから 上は外れ値なし、下はあり。赤が正規分布で青はt分布。外れ値なしでは2つのグラフはほぼ重なる。このグラフは乱数を何度か取り直してあえて重なりが少なくなるものを選んだが、たいていはほぼ完全に一致する。 …

解いてみる(3)「機械学習基礎」簡単な問題を 解いて理解しよう!後篇

R

「機械学習基礎」簡単な問題を解いて理解しよう!後篇|【Tech総研】後編 問題 異常(外れ値)検出で、選んではいけない玉を見つけ出せ! 100個の玉のうち、貴重な石でできた玉がどれなのか教えてほしい。 判定が微妙なものがあれば、怪しい玉も含めて3つぐ…

解いてみる(2)「機械学習基礎」簡単な問題を 解いて理解しよう!前篇

R

「機械学習基礎」簡単な問題を解いて理解しよう!前篇|【Tech総研】 第2問 「採ってきたキノコと、隊員が食べたキノコのデータを送るから、 食べても大丈夫なキノコを教えてほしい」コード library(ggplot2) iq.data <- read.csv("CodeIQ_data.txt", sep=" …

解いてみる(1)「機械学習基礎」簡単な問題を 解いて理解しよう!前篇

R

「機械学習基礎」簡単な問題を解いて理解しよう!前篇|【Tech総研】解答出てるけど解いてみる。 1問目 与えられた学習データを基に、二値分類を行うもの。難易度★1なので特に工夫しなくても正解が出たコード library(e1071) mycoins <- read.csv("CodeIQ_my…

R で wordcloud

R

Rでwordcloud描いてみた。 ネタは英語版Wikipediaから適当に MathematicsとGaussとLinear Algebraから。 library(tm) library(wordcloud) library(SnowballC) library(RColorBrewer) ws <- Corpus(DirSource("~/tmp/wordcloud")) #ws <- tm_map(ws, removeWh…