mathhunの日記

Haskellと機械学習の勉強日記。PRML読みます。

HaskellのOptparse-Applicativeの底力を知る

元ネタ RubyのOptionParserの底力を知る - ザリガニが見ていた...。Haskell版で苦労最小限でオプションを解析できるのか、調べてみた。使うライブラリは optparse-applicative 理由は最近見かけたこのスライドで推薦されていたから Getting it Done with Has…

Haskellのデバッグ方法(受け売り)

Twitterでボヤいていたらいろいろ教えて頂いたので今後のために残しておこうと思います。.@objectxplosive @mathshun 純粋なコードで無理矢理 trace を書いても利用されなければ trace が起動しません。純粋なモナドでは、 !_ <- return $ trace (show a) a …

「エンジニアの学び方─効率的に知識を得て,成果に結び付ける」まとめ

記事の要約・引用。一部自分の言葉で若干表現を変えたかも。 1. 効率的に学ぶには 知識には3つの軸がある 「広い視野」軸 学ぶべき対象を見つける。勉強会・ブログ記事・ニュース記事。 「深い理解」軸 学びの効率化と応用のために必要 「応用対象」軸 自分…

RJagsでMCMCやってみた (緑本9章)

データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)作者: 久保拓弥出版社/メーカー: 岩波書店発売日: 2012/05/19メディア: 単行本購入: 16人 クリック: 163回この商品を含むブログ (18件) を見る9章の例題…

ログの収集・可視化サービス

人に教えてもらった。知らないのがたくさんある。 とりあえず貼っとくだけ。あとで軽く調べて概要書いてみる。 https://www.loggly.com/ http://www.sumologic.com/ http://ja.splunk.com/view/SP-CAAAG58 https://papertrailapp.com/ https://logentries.co…

2つの正規分布(pdf)の積はまた正規分布?

PRML2章 (2.139)~(2.143)の式変形がわからない。http://en.wikipedia.org/wiki/Conjugate_prior http://www.cs.ubc.ca/~murphyk/Papers/bayesGauss.pdf この辺を見ても同じことが書いてあるが手計算しても合わない。 あとでまた戻ってくるようにメモっとく。

「社内の情報共有・情報発信」(Web+DB Vol.77) を読んだ

今さら感満載だけど読んだ。というか読みなおした。社内でちょっとやってみようと思うので記事の内容を簡単にまとめておく。 書く側のメリット 伝える技術を身につけられる 書くことにより伝える事もうまくなる 自分用メモ 読む側のメリット いろいろな人の…

PythonでPerceptronを実装してみた

PRML 4.1.7 にあるパーセプトロンを実装した。勉強のため。 いまのところPython(numpy, pandas)の知識がなさすぎて時間がかかる。 パーセプトロンは単純だし他にわかりやすい説明がいろいろあるし特に書くこともないかな。 こんなに単純なのにちゃんと学習で…

Python Pandasメモ

Rを先に覚えたので、Rだと簡単に書けるようになったもののそれと同じ事をPython(numpy+pandas)でやりたいときに良いやり方が思いつかない AND ググっても時間がかかる AND 多分すぐ忘れる。 ので特にはまったのをメモしておく。 DataFrame ある条件を満たす…

「基礎線形代数と固有値問題」読んだ

科学者・技術者のための 基礎線形代数と固有値問題作者: 柴田正和出版社/メーカー: 森北出版発売日: 2013/12/20メディア: 単行本(ソフトカバー)この商品を含むブログを見る正月休みに読んだ。1日1章ずつで読める範囲で、ざっと内容を把握出来る程度に読ん…

StackOverflowの質問数で見るプログラミング言語

API経由でStackOverflowの質問数を取得してグラフ化してみた。 雑感 最近はScalaが伸びてるんじゃないかなと予想していたがそうでもなかった。 PythonのAPIはまだAPI V1.x系を使用しているようだが、V2.x系が出てるのでそっちを使えという事らしい。(http://…

GoogleのDeep Learning論文読んだ

Representation Learning: A Review and New Perspectives を読んだ。どこまで理解出来てるかいまいちだがメモとしてAbstractの要約をまとめとく。読んだことメモってことで。 高レベルの特徴抽出器(教師なし)を構築した (high-level, class-specific featur…

Deep Learning 資料まとめのまとめ

Yet Another まとめのまとめ。資料ありすぎて混乱してきたので自分用メモということで。まとめ系 ニューラルネットの逆襲 | Preferred Research Deep Learningを勉強する際に参考にしたサイト・書籍まとめ - fz-qqq's diary Googleの猫認識 (Deep Learning) …

正規分布 vs t分布 - 外れ値に影響されやすい度グラフ化してみた

PRML 図2.16を再現してみた。まずはグラフから 上は外れ値なし、下はあり。赤が正規分布で青はt分布。外れ値なしでは2つのグラフはほぼ重なる。このグラフは乱数を何度か取り直してあえて重なりが少なくなるものを選んだが、たいていはほぼ完全に一致する。 …

解いてみる(3)「機械学習基礎」簡単な問題を 解いて理解しよう!後篇

R

「機械学習基礎」簡単な問題を解いて理解しよう!後篇|【Tech総研】後編 問題 異常(外れ値)検出で、選んではいけない玉を見つけ出せ! 100個の玉のうち、貴重な石でできた玉がどれなのか教えてほしい。 判定が微妙なものがあれば、怪しい玉も含めて3つぐ…

解いてみる(2)「機械学習基礎」簡単な問題を 解いて理解しよう!前篇

R

「機械学習基礎」簡単な問題を解いて理解しよう!前篇|【Tech総研】 第2問 「採ってきたキノコと、隊員が食べたキノコのデータを送るから、 食べても大丈夫なキノコを教えてほしい」コード library(ggplot2) iq.data <- read.csv("CodeIQ_data.txt", sep=" …

解いてみる(1)「機械学習基礎」簡単な問題を 解いて理解しよう!前篇

R

「機械学習基礎」簡単な問題を解いて理解しよう!前篇|【Tech総研】解答出てるけど解いてみる。 1問目 与えられた学習データを基に、二値分類を行うもの。難易度★1なので特に工夫しなくても正解が出たコード library(e1071) mycoins <- read.csv("CodeIQ_my…

ブログを始めるきっかけのスライド

技術ブログ書くきっかけになったスライド抜粋 前書いていたのもあるけどゼロからスタート真似したい点は 「質より量」「量でごまかす」「慣れるまでこっそり&大量に書く」 => 自分用メモでいいのでとにかく書く。続ける。「スキルなし・実績なし」 32歳窓際…

人間API

データサイエンティストに必要な3つのスキル 線形代数(と多変数微分) 何がなんでもきちんとしたデータを取ってこれるスクリプティング能力 データに疎い人たちの期待値を上手に設定し、彼らを味方につける政治力 らしい。 「データサイエンティスト」なん…

R で wordcloud

R

Rでwordcloud描いてみた。 ネタは英語版Wikipediaから適当に MathematicsとGaussとLinear Algebraから。 library(tm) library(wordcloud) library(SnowballC) library(RColorBrewer) ws <- Corpus(DirSource("~/tmp/wordcloud")) #ws <- tm_map(ws, removeWh…

PRML 2章 ベータ分布のグラフを描く

Rに慣れるため本にあるグラフをひたすら描いてみる。 png("beta01.png",height=600,width=800) fbeta <- function(x) { dbeta(x,5,5) } curve(fbeta,0,1,col="1") fbeta <- function(x) { dbeta(x,2,2) } curve(fbeta,0,1,col="2",add=T) fbeta <- function(…

PLML 2章 二項分布のグラフを描く

PRML二章から読む。 とりあえず手始めに図2.1をRで書いてみる。 plot(0:10, dbinom(0:10, 10, 0.25), pch=19, type="b") ヒストグラム風に描画する方法が分からないから点と線で。 乱数で出すバージョンも描いてみる。 > x <- rbinom(1000, 10, 0.25); table…

ブログ始める(また)

機械学習勉強日記を始める