Stanã§çµ±è¨ˆãƒ¢ãƒ‡ãƒªãƒ³ã‚°ã‚’å¦ã¶(3): ã–ã£ã¨ã€ŒStanã§ä½•ãŒã§ãã‚‹ã‹ã€ã‚’çœºã‚ã¦ã¿ã‚‹

å®Ÿã¯æ¥å‹™ã§ã‚‚Stanä½¿ã„å§‹ã‚ã¦ã‚‹ã‚“ã§ã™ãŒã€ã¾ã ã¾ã å˜ä½æ ¹ã‚ã‚Šãƒ‘ãƒãƒ«ãƒ‡ãƒ¼ã‚¿ã®åˆ†æžã«å›žã™ãªã©ä½Žãƒ¬ãƒ™ãƒ«ãªã‚‚ã®ãŒå¤šãã€ç„¡æƒ…å ±äº‹å‰åˆ†å¸ƒã¨éšŽå±¤äº‹å‰åˆ†å¸ƒã‚’å·§ã¿ã«ä½¿ã„ã“ãªã—ã¦è¯éº—ã«ã‚µãƒ³ãƒ—ãƒªãƒ³ã‚°ã€‚ã€‚ã€‚ãªã‚“ã¦å¤¢ã®ã¾ãŸå¤¢ã¨ã„ã†æƒ…ã‘ãªã„çŠ¶æ³ã§ã™ï¼ˆæ³£ï¼‰ã€‚

ã§ã€æ°—ãŒä»˜ã„ãŸã‚‰@berobero11ã•ã‚“ã®Stan関連ブログ記事が超絶充実ã—ã¦ã„ã¦ã€久保先生もびっくりã¿ãŸã„ãªçŠ¶æ³ã«ã€‚ã‚‚ã¯ã‚„åƒ•ãŒä½•ã‹ã‚’ã ã‚‰ã ã‚‰æ›¸ãã®ã‚‚ã‚¢ãƒ›ã‚‰ã—ã„ã®ã§ã€å…ˆã«Stanã®ä½¿ã„æ–¹ã‚’è¦šãˆãŸã„ã¨ã„ã†æ–¹ã¯æ˜¯éž@berobero11ã•ã‚“ã®ãƒ–ãƒã‚°ã‹ã‚‰èªã‚“ã§ä¸‹ã•ã„ï¼ˆç¬‘ï¼‰ã€‚åƒ•ã¯ã²ãŸã™ã‚‰ãã¡ã‚‰ã®è¨˜äº‹ã‚’ï¼ˆä¾‹ãˆã°infer.NETã‚ãŸã‚Šã®ä¾‹é¡Œã‚’è§£ããªãŒã‚‰ï¼‰ãƒˆãƒ¬ãƒ¼ã‚¹ã—ã¦ã„ãã ã‘ã®ã‚·ãƒ§ãƒœã„è¨˜äº‹ã‚’ã ã‚‰ã ã‚‰æ›¸ã„ã¦ã„ã“ã†ã¨æ€ã£ã¦ã¾ã™ã€‚

ã¨ã„ã†ã“ã¨ã§ã€ã¨ã‚Šã‚ãˆãšStanマニュアルã§ã‚ã‚‹stan-reference-2.1.0.pdfã‚’æ–œã‚èªã¿ã—ã¦*1ã€ã–ã£ã¨åƒ•ãŒèˆˆå‘³ã®ã‚ã‚‹ç¯„å›²ã§ã¾ã¨ã‚ãŸã ã‘ã®ã‚‚ã®ã‚’æ›¸ãå‡ºã—ã¦ã¿ã¾ã™ã€‚Stanã‚³ãƒ¼ãƒ‰ä¾‹ã¯å…¨ã¦ãƒžãƒ‹ãƒ¥ã‚¢ãƒ«ã‹ã‚‰ã®å¼•ç”¨ã§ã™ã€‚

ã¯ã˜ã‚ã«

åŸºæœ¬çš„ã«Stanï¼ˆã¨ã„ã†ã‹MC / MCMC ã‚µãƒ³ãƒ—ãƒ©ãƒ¼ï¼‰ã¯å°¤åº¦è¨ˆç®—ã‚’ãƒ¢ãƒ³ãƒ†ã‚«ãƒ«ãƒæ³•ã«åŸºã¥ã„ã¦ã‚„ã£ã¦ãã‚Œã‚‹ã‚‚ã®ã§ã™ã€‚ãªã®ã§ã€å°¤åº¦è¨ˆç®—ã•ãˆåŽæŸã™ã‚Œã°è‰¯ã„ã¨ã„ã†ã‚¿ã‚¤ãƒ—ã®çµ±è¨ˆãƒ¢ãƒ‡ãƒªãƒ³ã‚°ã¯äº‹å®Ÿä¸Šä½•ã§ã‚‚Stanã§ã§ãã‚‹ã¯ãšã§ã™ã€‚ã‚ˆã£ã¦ã€ã“ã“ã«åå‰ãŒæŒ™ãŒã£ã¦ãªã„ãƒ¢ãƒ‡ãƒªãƒ³ã‚°æ‰‹æ³•ã‚‚ã€ã†ã¾ãã‚³ãƒ¼ãƒ‰ã‚’æ›¸ã„ã¦å®Ÿè£…ã§ãã‚Œã°Stanã§èµ°ã‚‰ã›ã‚‹ã“ã¨ãŒå¯èƒ½ã ã¨ã‚‚è¨€ãˆã‚‹ã¨æ€ã„ã¾ã™ã€‚

f:id:TJO:20140207180929p:plain

ãƒ¢ãƒ³ãƒ†ã‚«ãƒ«ãƒæ³•ã«ã‚ˆã‚‹å°¤åº¦è¨ˆç®—ã®ã‚¤ãƒ¡ãƒ¼ã‚¸ã¯ã“ã‚“ãªæ„Ÿã˜ã€ã¨ã„ã†ã®ã¯前回記事ã§ç´¹ä»‹ã—ãŸé€šã‚Šã§ã™ã€‚ã§ã€å¤§äº‹ãªã“ã¨ã¯ã©ã‚“ãªãƒ¢ãƒ‡ãƒªãƒ³ã‚°ã«ã›ã‚ˆã€Œå…ƒã®ãƒ¢ãƒ‡ãƒ«å¼ã‚’ãã¡ã‚“ã¨ã€Žå·¦è¾ºï¼å³è¾ºï¼ˆç¢ºçŽ‡åˆ†å¸ƒï¼‰ã€ã®å½¢ã«ç›´ã›ã‚‹ã€ã¨ã„ã†ã“ã¨ã€‚ä¾‹ãˆã°æ£è¦ç·šå½¢ãƒ¢ãƒ‡ãƒ«ã§ã‚ã‚Œã°ã€

$Y_n=\alpha+\beta x_n + \eps_n \hspace{10pt} where \hspace{10pt} \eps_n \sim Normal(0, \sigma)$
â†“
$Y_n - (\alpha+\beta x_n) \sim Normal(0, \sigma)$
â†“
$Y_n \sim Normal(\alpha+\beta x_n, \sigma)$
â†“

y[i] ~ normal( alpha + beta * x[i], sigma )

ã¨ã„ã†ã‚ˆã†ã«Stanã‚³ãƒ¼ãƒ‰ã§è¡¨ç¾ã§ãã‚‹ã¨ã“ã‚ã¾ã§å¼å¤‰å½¢ã§ãã‚‹ã¨ã„ã†ã“ã¨ã§ã™ãã€‚æ…£ã‚Œã‚Œã°ãƒ‘ãƒƒã¨æ›¸ã‘ã‚‹ã‚ˆã†ã«ãªã‚‹ã¨æ€ã„ã¾ã™ãŒã€è¤‡é›‘ãªãƒ¢ãƒ‡ãƒªãƒ³ã‚°ã‚’è¡Œã„ãŸã„å ´åˆã¯æœ€åˆã«ãƒ™ã‚¿ãƒƒã¨åŽŸç†ã«å¾“ã£ãŸãƒ¢ãƒ‡ãƒªãƒ³ã‚°å¼ã‚’æ›¸ãã€ãã‚Œã‚’å¼å¤‰å½¢ã—ã¦Stanã‚³ãƒ¼ãƒ‰ã«æ”¹ã‚ã‚‹ã¨ã„ã†ã®ãŒè‰¯ã•ãã†ã§ã™ã€‚

å¤šå¤‰é‡è§£æžã¾ã‚ã‚Š

å¤§ä½“ä½•ã§ã‚‚ã§ãã¾ã™ãŒã€Stanã¯ã‚³ãƒ¼ãƒ‰æ–‡æ³•ãŒã‚„ã‚„ã“ã—ã‹ã£ãŸã‚Šã€ã‚µãƒ³ãƒ—ãƒªãƒ³ã‚°ã®ä»•æ–¹ã«ã‚ˆã£ã¦åŽæŸã®åº¦åˆã„ãŒã¾ã‚‹ã£ãã‚Šå¤‰ã‚ã£ãŸã‚Šã™ã‚‹ã®ã§æ³¨æ„ãŒå¿…è¦ã§ã™ã€‚åˆ†ã‹ã‚‰ãªã„æ™‚ã¯è¿·ã‚ãš@berobero11ã•ã‚“ã‚ãŸã‚Šã«èžãã¾ã—ã‚‡ã†ï½—ï¼ˆä½•ã§ã‚‚ä¸¸æŠ•ã’ï½—ï½—ï¼‰

æ£è¦ç·šå½¢ãƒ¢ãƒ‡ãƒ«

ã¾ãšè¶…ã®å—ãŒã¤ãåŸºæœ¬ä¸ã®åŸºæœ¬ã¨ã—ã¦ã€æ£è¦ç·šå½¢ãƒ¢ãƒ‡ãƒ«ã€‚ã“ã‚Œã¯æ£è¦åˆ†å¸ƒnormal(mu, sigma)ã§è¨ˆç®—ã§ãã¾ã™ã€‚

ï¼œä¾‹ï¼ž

data {
	int<lower=0> N;
	vector[N] x;
	vector[N] y;
}
parameters {
	real alpha;
	real beta;
	real<lower=0> sigma;
}
model {
	for (n in 1:N)
		y[n] ~ normal(alpha + beta * x[n], sigma);
}

ãƒã‚¸ã‚¹ãƒ†ã‚£ãƒƒã‚¯å›žå¸°ãƒ»ãƒ—ãƒãƒ“ãƒƒãƒˆãƒ¢ãƒ‡ãƒ«

ã“ã‚Œã¯ãƒ™ãƒ«ãƒŒãƒ¼ã‚¤åˆ†å¸ƒbernoulli(theta)ã§è¨ˆç®—ã§ãã¾ã™ã€‚ç›®çš„å¤‰æ•°ãŒäºŒå€¤ã§ã¡ã‚ƒã‚“ã¨intã§ä¸Žãˆã¦ãŠã‹ãªã„ã¨æ™®é€šã«ã‚³ãƒ³ãƒ‘ã‚¤ãƒ«ã‚¨ãƒ©ãƒ¼ã«ãªã‚‹ã®ã§è¦æ³¨æ„ã€‚

ï¼œä¾‹ï¼ž
data {
	int<lower=0> N;
	real x[N];
	int<lower=0,upper=1> y[N];
}
parameters {
	real alpha;
	real beta;
}
model {
	for (n in 1:N)
		y[n] ~ bernoulli(inv_logit(alpha + beta * x[n]));
}

å¤šé …ãƒã‚¸ãƒƒãƒˆãƒ¢ãƒ‡ãƒ«

äºŒå€¤ãƒã‚¸ãƒƒãƒˆãƒ¢ãƒ‡ãƒ«ãŒã§ãã‚‹ãªã‚‰ã€å½“ç„¶å¤šé …ãƒã‚¸ãƒƒãƒˆã‚‚ã§ãã¾ã™ã€‚ã“ã‚Œã¯å¤šé …åˆ†å¸ƒcategorical(theta)ã§å®Ÿç¾å¯èƒ½ã§ã™ã€‚ã¡ãªã¿ã«é †åºãƒã‚¸ã‚¹ãƒ†ã‚£ãƒƒã‚¯å›žå¸°ã¯ãã®ã¾ã‚“ã¾ã®ordered_logistic(eta,c)ã§ã§ãã¾ã™ã€‚

ï¼œä¾‹ï¼ž
data {
	int K;
	int N;
	int D;
	int y[N];
	vector[D] x[N];
}
parameters {
	matrix[K,D] beta;
}
model {
	for (k in 1:K)
		for (d in 1:D)
			beta[k,d] ~ normal(0,5);
	for (n in 1:N)
		y[n] ~ categorical(softmax(beta * x[n]));
}

ãã®ä»–

éšŽå±¤ãƒã‚¸ã‚¹ãƒ†ã‚£ãƒƒã‚¯ãƒ¢ãƒ‡ãƒ«ã¨ã‹item-response theory model(1PL-Rasch model / Multi-level 2PL model)ã¨ã‹ã‚‚å‡ºã¦ãã‚‹ã‚“ã§ã™ãŒã€åƒ•ã¯ã‚ˆãåˆ†ã‹ã‚‰ãªã„ã®ã§ã“ã“ã§ã¯å‰²æ„›ã—ã¾ã™ã€‚ã€‚ã€‚*2

è¨ˆé‡æ™‚ç³»åˆ—åˆ†æžã¾ã‚ã‚Š

ä½•ã§ã‚‚å‹æ‰‹ã«ç¢ºçŽ‡åˆ†å¸ƒã‚’ãã£ã¤ã‘ã¦ãƒ¢ãƒ‡ãƒªãƒ³ã‚°ã§ãã‚‹ã¨ã„ã†Stanã®ç‰¹æ€§ã‚’ç”Ÿã‹ã—ã¦ã€æ™®é€šã«è¨ˆé‡æ™‚ç³»åˆ—ãƒ¢ãƒ‡ãƒ«ã®ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿æŽ¨å®šã‚’è¡Œã†ã“ã¨ãŒã§ãã¾ã™ã€‚「Rで計量時系列分析」シリーズ記事ã§è¦‹ã¦ããŸã‚ˆã†ã«ã€ã“ã‚Œã¾ãŸæœ€å°¤æ³•ã§æŽ¨å®šã—ã¦ã„ã‚‹ã®ã§ã‚‚ã¡ã‚ã‚“Stanã§ãƒãƒƒãƒãƒªã‚„ã‚Œã‚‹ã¨ã„ã†ã‚ã‘ã§ã™ã€‚

ARãƒ¢ãƒ‡ãƒ«

ã‚¿ã‚¤ãƒ ãƒ©ã‚°ã®åˆ†ã ã‘å·®åˆ†ã‚’å–ã£ã¦ã€æ£è¦åˆ†å¸ƒnormal(mu,sigma)ã§ãƒ¢ãƒ‡ãƒªãƒ³ã‚°ã™ã‚Œã°OKã§ã™ã€‚ãªãŠç™ºå±•ã¨ã—ã¦ARCHãƒ¢ãƒ‡ãƒ«ã‚‚æŽ¨å®šã§ãã¾ã™ãŒã€GARCHãƒ¢ãƒ‡ãƒ«ã®èª¬æ˜ŽãŒè©³ã—ã„ã®ã§ã“ã“ã§ã¯å‰²æ„›ã€‚

ï¼œä¾‹ï¼šAR(1)ãƒ¢ãƒ‡ãƒ«ï¼ž
data {
	int<lower=0> N;
	real y[N];
}
parameters {
	real alpha;
	real beta;
	real sigma;
}
model {
	for (n in 2:N)
		y[n] ~ normal(alpha + beta*y[n-1], sigma);
}

ï¼œä¾‹ï¼šAR(K)ãƒ¢ãƒ‡ãƒ«ï¼ž
data {
	int<lower=0> K;
	int<lower=0> N;
	real y[N];
}
parameters {
	real alpha;
	real beta[K];
	real sigma;
}
model {
	for (n in (K+1):N) {
		real mu;
		mu <- alpha;
		for (k in 1:K)
			mu <- mu + beta[k] * y[n-k];
		y[n] ~ normal(mu, sigma);
	}
}

GARCHãƒ¢ãƒ‡ãƒ«

å®Ÿã¯ARCH(1)ãƒ¢ãƒ‡ãƒ«ã®èª¬æ˜Žã«ä½¿ã‚ã‚Œã¦ã„ã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ç¾¤ã®èª¬æ˜ŽãŒã‚ã‚‹ã®ã§è¦æ³¨æ„ï½—

ï¼œä¾‹ï¼šGARCH(1,1)ãƒ¢ãƒ‡ãƒ«ï¼ž
data {
	int<lower=0> T;
	real r[T];
	real<lower=0> sigma1;
}
parameters {
	real mu;
	real<lower=0> alpha0;
	real<lower=0,upper=1> alpha1;
	real<lower=0,upper=(1-alpha1)> beta1;
}
transformed parameters {
	real<lower=0> sigma[T];
	sigma[1] <- sigma1;
	for (t in 2:T)
		sigma[t] <- sqrt(alpha0
				+ alpha1 * pow(r[t-1] - mu, 2)
				+ beta1 * pow(sigma[t-1], 2));
}
model {
	r ~ normal(mu,sigma);
}

MAãƒ¢ãƒ‡ãƒ«

MA(Q)ãƒ¢ãƒ‡ãƒ«ã¯ãƒ™ã‚¯ãƒˆãƒ«è¡¨ç¾ã‚’ä½¿ã£ã¦ä»¥ä¸‹ã®ã‚ˆã†ã«æ›¸ã‘ã¾ã™ã€‚

ï¼œä¾‹ï¼šMA(Q)ãƒ¢ãƒ‡ãƒ«ï¼ž
data {
	int<lower=0> Q; // num previous noise terms
	int<lower=3> T; // num observations
	vector[T] y; // observation at time t
}
parameters {
	real mu; // mean
	real<lower=0> sigma; // error scale
	vector[Q] theta; // error coeff, lag -t
}
transformed parameters {
	vector[T] epsilon; // error term at time t
	for (t in 1:T) {
		epsilon[t] <- y[t] - mu;
		for (q in 1:min(t-1,Q))
			epsilon[t] <- epsilon[t] - theta[q] * epsilon[t - q];
	}
}
model {
	vector[T] eta;
	mu ~ cauchy(0,2.5);
	theta ~ cauchy(0,2.5);
	sigma ~ cauchy(0,2.5);
	for (t in 1:T) {
		eta[t] <- mu;
		for (q in 1:min(t-1,Q))
			eta[t] <- eta[t] + theta[q] * epsilon[t - q];
	}
	y ~ normal(eta,sigma);
}

ARMAãƒ¢ãƒ‡ãƒ«

ã“ã“ã§ã¯ARMA(1,1)ãƒ¢ãƒ‡ãƒ«ã®ä¾‹ã ã‘å¼•ç”¨ã—ã¦ãŠãã¾ã™ã€‚

ï¼œä¾‹ï¼šARMA(1,1)ãƒ¢ãƒ‡ãƒ«ï¼ž
data {
	int<lower=1> T; // num observations
	real y[T]; // observed outputs
}
parameters {
	real mu; // mean coeff
	real phi; // autoregression coeff
	real theta; // moving avg coeff
	real<lower=0> sigma; // noise scale
}
model {
	vector[T] nu; // prediction for time t
	vector[T] err; // error for time t
	nu[1] <- mu + phi * mu; // assume err[0] == 0
	err[1] <- y[1] - nu[1];
	for (t in 2:T) {
		nu[t] <- mu + phi * y[t-1] + theta * err[t-1];
		err[t] <- y[t] - nu[t];
	}
	mu ~ normal(0,10); // priors
	phi ~ normal(0,2);
	theta ~ normal(0,2);
	sigma ~ cauchy(0,5);
	err ~ normal(0,sigma); // likelihood
}

ãã®ä»–

ç¢ºçŽ‡çš„ãƒœãƒ©ãƒ†ã‚£ãƒªãƒ†ã‚£ãƒ¢ãƒ‡ãƒ«ã‚„éš ã‚Œãƒžãƒ«ã‚³ãƒ•ãƒ¢ãƒ‡ãƒ«ã‚’ã‚³ãƒ¼ãƒ‰ã§ãã‚‹ãã†ã§ã™ãŒã€å¾Œè€…ã¯ã¨ã‚‚ã‹ãå‰è€…ã¯åƒ•ã¯æ™®æ®µã¯å…¨ç„¶æ‰±ã‚ãªãã¦ç–Žã„ã®ã§å‰²æ„›ã—ã¾ã—ãŸã€‚ã€‚ã€‚

æ¸¬å®šèª¤å·®ã¨ãƒ¡ã‚¿ã‚¢ãƒŠãƒªã‚·ã‚¹

ã“ã®è¾ºåƒ•ã¯ã¾ãƒ¼ãƒ¼ãƒ¼ãƒ¼ãƒ¼ãƒ¼ã£ãŸãè©³ã—ããªã„ã®ã§å…¨ã¦å‰²æ„›ï¼ˆã”ã‚ã‚“ãªã•ã„ï¼‰ã€‚ã¨ã¯è¨€ãˆã€æ¸¬å®šèª¤å·®ã®ãƒ¢ãƒ‡ãƒªãƒ³ã‚°ã‚‚Stanã‚’ä½¿ãˆã°è‡ªç”±è‡ªåœ¨ã«ã§ãã‚‹ã®ã§ã€ä¾‹ã«ã‚‚æŒ™ãŒã£ã¦ã„ã‚‹ã‚ˆã†ã«ãƒ¡ã‚¿ã‚¢ãƒŠãƒªã‚·ã‚¹ãªã©ã§æ¸¬å®šèª¤å·®åŒå£«ã‚’çµ±åˆã—ã¦è©•ä¾¡ã—ãŸã„ã‚±ãƒ¼ã‚¹ãªã‚“ã‹ã§ã¯ç‰©å‡„ãæœ‰ç”¨ãªæ°—ãŒã—ã¾ã™ã€‚

ã‚ã–ã‚ã–å¤šé …åˆ†å¸ƒcategorical(theta)ãŒå®Ÿè£…ã•ã‚Œã¦ã„ã‚‹ã®ã‚’è¦‹ã‚Œã°åˆ†ã‹ã‚‹é€šã‚Šã€ãƒ™ã‚¤ã‚¸ã‚¢ãƒ³ã®æµå„€ã§ã‚¯ãƒ©ã‚¹ã‚¿ãƒªãƒ³ã‚°ã‚’å®Ÿè£…ã™ã‚‹ã“ã¨ã‚‚ã§ãã¾ã™ã€‚

K-means

ã”ãã”ãæ™®é€šã®ãƒ¦ãƒ¼ã‚¯ãƒªãƒƒãƒ‰è·é›¢ã‚’ä½¿ã£ãŸãƒãƒ¼ã‚¸ãƒ§ãƒ³ãŒãƒžãƒ‹ãƒ¥ã‚¢ãƒ«ã«è¼‰ã£ã¦ã„ã¾ã™ã€‚

ï¼œä¾‹ï¼š"Soft" K-meansï¼ž
data {
	int<lower=0> N; // number of data points
	int<lower=1> D; // number of dimensions
	int<lower=1> K; // number of clusters
	vector[D] y[N]; // observations
}
transformed data {
	real<upper=0> neg_log_K;
	neg_log_K <- -log(K);
}
parameters {
	vector[D] mu[K]; // cluster means
}
transformed parameters {
	real<upper=0> soft_z[N,K]; // log unnormalized clusters
	for (n in 1:N)
		for (k in 1:K)
		soft_z[n,k] <- neg_log_K
				- 0.5 * dot_self(mu[k] - y[n]);
}
model {
	// prior
	for (k in 1:K)
		mu[k] ~ normal(0,1);
	// likelihood
	for (n in 1:N)
	increment_log_prob(log_sum_exp(soft_z[n]));
}

ã¨ã€ä½•æ•…ã‹1ç¯€ã¾ã‚‹ã¾ã‚‹ä½¿ã£ã¦ãƒžãƒ‹ãƒ¥ã‚¢ãƒ«ã§ç‰©å‡„ãèª¬æ•™ã—ã¦ã¾ã™ï¼ˆç¬‘ï¼‰ã€‚è©³ã—ãã¯ãƒžãƒ‹ãƒ¥ã‚¢ãƒ«æœ¬æ–‡ã‚’èªã‚“ã§ã‚‚ã‚‰ã„ãŸã„ã®ã§ã™ãŒã€Non-Identifiabilityã¨MultimodalityãŒå…ƒå‡¶ã§ã‚ã‚‹ã¨ã„ã†ã‚³ãƒ¡ãƒ³ãƒˆãŒã•ã‚Œã¦ã¾ã™ã€‚ã²ã¨ã¾ãšã“ã“ã¯@berobero11ã•ã‚“ã«ã§ã‚‚ã”è§£èª¬ã‚’è³œã‚‹ã¨ã—ã¦*3ã€æ¬¡ã«ã„ãã¾ã—ã‚‡ã†ã€‚

æ··åˆãƒ¢ãƒ‡ãƒ«

å®Ÿã¯ãƒžãƒ‹ãƒ¥ã‚¢ãƒ«ã®ãƒˆãƒƒãƒ—ã«å‡ºã¦ã‚‹ä¾‹ãªã‚“ã§ã™ãŒã€æ™®é€šã«æ··åˆæ£è¦åˆ†å¸ƒã¨ã‹ã‚‚å¤šé …åˆ†å¸ƒcategorial(theta)ã¨æ£è¦åˆ†å¸ƒnormal(mu,sigma)ã¨ã®åˆã‚ã›æŠ€ã§ã„ã‘ã¾ã™ã€‚

ï¼œä¾‹ï¼šæ··åˆãƒ¢ãƒ‡ãƒ«ï¼ž
data {
	int<lower=1> K; // number of mixture components
	int<lower=1> N; // number of data points
	real y[N]; // observations
}
parameters {
	simplex[K] theta; // mixing proportions
	real mu[K]; // locations of mixture components
	real<lower=0,upper=10> sigma[K]; // scales of mixture components
}
model {
	real ps[K]; // temp for log component densities
	for (k in 1:K) {
		mu[k] ~ normal(0,10);
	}
	for (n in 1:N) {
		for (k in 1:K) {
			ps[k] <- log(theta[k])
				+ normal_log(y[n],mu[k],sigma[k]);
		}
		increment_log_prob(log_sum_exp(ps));
	}
}

Latent Dirichlet Allocation (LDA)

ã¨ã„ã†ã“ã¨ã§è‰²ã€…åˆ¶ç´„ã¯ã‚ã‚‹ã‚‰ã—ã„ã‚“ã§ã™ãŒã€äº‹å‰åˆ†å¸ƒã«ãƒ‡ã‚£ãƒªã‚¯ãƒ¬åˆ†å¸ƒdirichlet(alpha)ã‚’å……ã¦ã¦ã€å°¤åº¦è¨ˆç®—ã‚’å¤šé …åˆ†å¸ƒcategorical(theta)ã§ã‚„ã‚Œã°ã€ã‚ºãƒãƒªLatent Dirichlet Allocationã‚’èµ°ã‚‰ã›ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚

ï¼œä¾‹ï¼šLDAï¼ž
data {
	int<lower=2> K; // num topics
	int<lower=2> V; // num words
	int<lower=1> M; // num docs
	int<lower=1> N; // total word instances
	int<lower=1,upper=V> w[N]; // word n
	int<lower=1,upper=M> doc[N]; // doc ID for word n
	vector<lower=0>[K] alpha; // topic prior
	vector<lower=0>[V] beta; // word prior
}
parameters {
	simplex[K] theta[M]; // topic dist for doc m
	simplex[V] phi[K]; // word dist for topic k
}
model {
	for (m in 1:M)
		theta[m] ~ dirichlet(alpha); // prior
	for (k in 1:K)
		phi[k] ~ dirichlet(beta); // prior
	for (n in 1:N) {
		real gamma[K];
		for (k in 1:K)
			gamma[k] <- log(theta[doc[n],k]) + log(phi[k,w[n]]);
		increment_log_prob(log_sum_exp(gamma)); // likelihood
	}
}

ãã®ä»–

ã‚¬ã‚¦ã‚¹éŽç¨‹ã‚’ä½¿ã†ã‚„ã¤ã¨ã‹ã€cholesky_decompose()é–¢æ•°ã§ã‚³ãƒ¬ã‚¹ã‚ãƒ¼åˆ†è§£ãŒå‡ºæ¥ã‚‹ã¨ã‹*4ã€è‰²ã€…ãªãƒˆãƒ”ãƒƒã‚¯ã‚¹ãŒä»–ã«ã‚‚ç¶šãã‚“ã§ã™ãŒã€åƒ•ã®ç¾åœ¨ã®ç†è§£ã®ç¯„ç–‡ã‚’ä»Šå›žã¯ä¸€æ—¦å‰²æ„›ã—ã¾ã™ã€‚ã¾ãŸå¿…è¦ã«ãªã£ãŸã‚‰å–ã‚Šä¸Šã’ã¾ã™ã‚ˆãƒ¼ã¨ã„ã†ã“ã¨ã§ã€‚ã‚€ã—ã‚ã“ã‚Œã‹ã‚‰ã®Stanä¿®è¡Œå¤§å¤‰ã‹ã‚‚ã€‚ã€‚ã€‚

*1:ã¾ã Stan2.2.0ã«ã‚¢ãƒƒãƒ—ãƒ‡ãƒ¼ãƒˆã—ã¦ãªã„ã‚“ã§ã™ã”ã‚ã‚“ãªã•ã„

*2:å‹‰å¼·ã—ã‚ã‚ˆã‚´ãƒ«ã‚¡ã¨ã‹è¨€ã‚ãªã„ã§ãƒ¼

*3:ãƒžã‚¸ã“ã‚Œã°ã£ã‹ï½—

*4:ã“ã‚ŒçŸ¥ã‚‰ãªã‹ã£ãŸã€‚ã€‚ã€‚

æ¸‹è°·é§…å‰ã§åƒããƒ‡ãƒ¼ã‚¿ã‚µã‚¤ã‚¨ãƒ³ãƒ†ã‚£ã‚¹ãƒˆã®ãƒ–ãƒã‚°

å…ƒç¥–ã€Œå…æœ¬æœ¨ã§åƒããƒ‡ãƒ¼ã‚¿ã‚µã‚¤ã‚¨ãƒ³ãƒ†ã‚£ã‚¹ãƒˆã€ã§ã™ / é“çŽ„å‚â†’éŠ€åº§â†’æ±äº¬â†’å…æœ¬æœ¨â†’æ¸‹è°·é§…å‰

ã¯ã˜ã‚ã«

å¤šå¤‰é‡è§£æžã¾ã‚ã‚Š

æ£è¦ç·šå½¢ãƒ¢ãƒ‡ãƒ«

ãƒã‚¸ã‚¹ãƒ†ã‚£ãƒƒã‚¯å›žå¸°ãƒ»ãƒ—ãƒãƒ“ãƒƒãƒˆãƒ¢ãƒ‡ãƒ«

å¤šé …ãƒã‚¸ãƒƒãƒˆãƒ¢ãƒ‡ãƒ«

ãã®ä»–

è¨ˆé‡æ™‚ç³»åˆ—åˆ†æžã¾ã‚ã‚Š

ARãƒ¢ãƒ‡ãƒ«

GARCHãƒ¢ãƒ‡ãƒ«

MAãƒ¢ãƒ‡ãƒ«

ARMAãƒ¢ãƒ‡ãƒ«

ãã®ä»–

æ¸¬å®šèª¤å·®ã¨ãƒ¡ã‚¿ã‚¢ãƒŠãƒªã‚·ã‚¹

ã‚¯ãƒ©ã‚¹ã‚¿ãƒªãƒ³ã‚°ã¾ã‚ã‚Š

K-means

ã€Œãƒ™ã‚¤ã‚¸ã‚¢ãƒ³ã§ç”Ÿæˆãƒ¢ãƒ‡ãƒ«ã‚„ã‚‹ã®ã¯é›£ã—ã„ã‚“ã ã‚ˆã‚³ãƒ©ã€

æ··åˆãƒ¢ãƒ‡ãƒ«

Latent Dirichlet Allocation (LDA)

ãã®ä»–

ã¯ã˜ã‚ã«

å¤šå¤‰é‡è§£æžã¾ã‚ã‚Š

æ­£è¦ç·šå½¢ãƒ¢ãƒ‡ãƒ«

ãƒ­ã‚¸ã‚¹ãƒ†ã‚£ãƒƒã‚¯å›žå¸°ãƒ»ãƒ—ãƒ­ãƒ“ãƒƒãƒˆãƒ¢ãƒ‡ãƒ«

å¤šé …ãƒ­ã‚¸ãƒƒãƒˆãƒ¢ãƒ‡ãƒ«

ãã®ä»–

è¨ˆé‡æ™‚ç³»åˆ—åˆ†æžã¾ã‚ã‚Š

ARãƒ¢ãƒ‡ãƒ«

GARCHãƒ¢ãƒ‡ãƒ«

MAãƒ¢ãƒ‡ãƒ«

ARMAãƒ¢ãƒ‡ãƒ«

ãã®ä»–

æ¸¬å®šèª¤å·®ã¨ãƒ¡ã‚¿ã‚¢ãƒŠãƒªã‚·ã‚¹

ã‚¯ãƒ©ã‚¹ã‚¿ãƒªãƒ³ã‚°ã¾ã‚ã‚Š

K-means

ã€Œãƒ™ã‚¤ã‚¸ã‚¢ãƒ³ã§ç”Ÿæˆãƒ¢ãƒ‡ãƒ«ã‚„ã‚‹ã®ã¯é›£ã—ã„ã‚“ã ã‚ˆã‚³ãƒ©ã€

æ··åˆãƒ¢ãƒ‡ãƒ«

Latent Dirichlet Allocation (LDA)

ãã®ä»–

ã¯ã˜ã‚ã«

å¤šå¤‰é‡è§£æžã¾ã‚ã‚Š

æ£è¦ç·šå½¢ãƒ¢ãƒ‡ãƒ«

ãƒã‚¸ã‚¹ãƒ†ã‚£ãƒƒã‚¯å›žå¸°ãƒ»ãƒ—ãƒãƒ“ãƒƒãƒˆãƒ¢ãƒ‡ãƒ«

å¤šé …ãƒã‚¸ãƒƒãƒˆãƒ¢ãƒ‡ãƒ«

ãã®ä»–

è¨ˆé‡æ™‚ç³»åˆ—åˆ†æžã¾ã‚ã‚Š

ãã®ä»–

æ¸¬å®šèª¤å·®ã¨ãƒ¡ã‚¿ã‚¢ãƒŠãƒªã‚·ã‚¹

ã‚¯ãƒ©ã‚¹ã‚¿ãƒªãƒ³ã‚°ã¾ã‚ã‚Š

ã€Œãƒ™ã‚¤ã‚¸ã‚¢ãƒ³ã§ç”Ÿæˆãƒ¢ãƒ‡ãƒ«ã‚„ã‚‹ã®ã¯é›£ã—ã„ã‚“ã ã‚ˆã‚³ãƒ©ã€

æ··åˆãƒ¢ãƒ‡ãƒ«

ãã®ä»–