glmnetã‚’ã‚‚ã†å°‘ã—ç†è§£ã—ãŸã„â‘ - çµ±è¨ˆã‚³ãƒ³ã‚µãƒ«ã®è°äº‹ãƒ¡ãƒ¢

ä¹…ã—ã¶ã‚Šã®æ›´æ–°ã§ã™ï¼ˆã„ã¤ã‚‚è¨€ã£ã¦ã„ã¾ã™ï¼‰ã€‚

èƒŒæ™¯

ãƒ‡ãƒ¼ã‚¿ã‚µã‚¤ã‚¨ãƒ³ã‚¹å…¥é–€ã‚·ãƒªãƒ¼ã‚ºã®ã€Œã‚¹ãƒ‘ãƒ¼ã‚¹å›žå¸°åˆ†æžã¨ãƒ‘ã‚¿ãƒ¼ãƒ³èªè˜ã€ã‚’èªã‚“ã§ã„ãŸã‚‰å¤§å¤‰é¢ç™½ã‹ã£ãŸã®ã§ã€ã„ã¤ã‚‚ã®ã‚ˆã†ã« glmnet ã®ä¸èº«ã‚’è¦‹ã¦ã¿ã‚‹ã“ã¨ã«ã—ã¾ã—ãŸã€‚ ãªãŠç§ã¯æ¥å‹™ã§Lasso/Ridgeã‚’ä½¿ã£ãŸçµŒé¨“ãŒã‚ã¾ã‚Šãªã„ãŸã‚ç†è§£ãŒé–“é•ã£ã¦ã„ã‚‹ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ãŒã€ãã®ç‚¹ã‚ã‚‰ã‹ã˜ã‚ã”äº†æ‰¿ãã ã•ã„ã€‚

ã‚¹ãƒ‘ãƒ¼ã‚¹å›žå¸°åˆ†æžã¨ãƒ‘ã‚¿ãƒ¼ãƒ³èªè˜ (ãƒ‡ãƒ¼ã‚¿ã‚µã‚¤ã‚¨ãƒ³ã‚¹å…¥é–€ã‚·ãƒªãƒ¼ã‚º)

ä½œè€…:æ¢…æ´¥ ä½‘å¤ª,è¥¿äº• é¾æ˜ ,ä¸Šç”° å‹‡ç¥
ç™ºå£²æ—¥: 2020/02/28
ãƒ¡ãƒ‡ã‚£ã‚¢: å˜è¡Œæœ¬ï¼ˆã‚½ãƒ•ãƒˆã‚«ãƒãƒ¼ï¼‰

ã“ã¡ã‚‰ã®æœ¬ã§ã™ã€‚è‰¯ã„æœ¬ã§ã™ã€‚

`glmnet` ã®å®Ÿè¡Œçµæžœ

å‰å›žã® GAM ã®æ™‚ã¨åŒæ§˜ã«ã€ã¾ãšã¯ glmnet ã§ã©ã®ã‚ˆã†ãªçµæžœã‚’å¾—ã‚‹ã“ã¨ãŒã§ãã‚‹ã®ã‹ç¢ºèªã—ã¦ã¿ã¾ã—ã‚‡ã†ã€‚ã€Œã‚¹ãƒ‘ãƒ¼ã‚¹å›žå¸°åˆ†æžã¨ãƒ‘ã‚¿ãƒ¼ãƒ³èªè˜ã€ï¼ˆä»¥ä¸‹ã€æ•™ç§‘æ›¸ï¼‰P12 ã‚³ãƒ¼ãƒ‰1.2ã‚’ï¼ˆå°‘ã—æ”¹å¤‰ã—ã¦ï¼‰å®Ÿè¡Œã—ã¦ã¿ã¾ã™ã€‚ ãªãŠã“ã‚Œã‚‰ã®ã‚³ãƒ¼ãƒ‰ã¯ã“ã¡ã‚‰ã‹ã‚‰ãƒ€ã‚¦ãƒ³ãƒãƒ¼ãƒ‰ã™ã‚‹ã“ã¨ã‚‚ã§ãã¾ã™ã€‚ ç’°å¢ƒã¯ä»¥ä¸‹ã®ã‚ˆã†ãªæ„Ÿã˜ã§ã™ã€‚

> sessionInfo()
R version 3.6.0 (2019-04-26)
Platform: x86_64-apple-darwin15.6.0 (64-bit)
Running under: macOS Mojave 10.14.6

Matrix products: default
BLAS:   /System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib
LAPACK: /Library/Frameworks/R.framework/Versions/3.6/Resources/lib/libRlapack.dylib

locale:
[1] ja_JP.UTF-8/ja_JP.UTF-8/ja_JP.UTF-8/C/ja_JP.UTF-8/ja_JP.UTF-8

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

loaded via a namespace (and not attached):
[1] compiler_3.6.0  tools_3.6.0     grid_3.6.0      lattice_0.20-38

library(glmnet)
library(plotmo)

x <- scale(LifeCycleSavings[, 2:5])
y <- LifeCycleSavings[, 1] - mean(LifeCycleSavings[, 1])

lasso <- glmnet(x, y, family = "gaussian", alpha = 1) # alpha = 1 ã§ lasso
ridge <- glmnet(x, y, family = "gaussian", alpha = 0) # alpha = 0 ã§ ridge

## directoryã¯é©å½“ã«æŒ‡å®š
png("./Image/glmnet_dive_01_01.png", width = 600, height = 400)
plot_glmnet(lasso, xvar = "lambda", label = TRUE)
dev.off()
png("./Image/glmnet_dive_01_02.png", width = 600, height = 400)
plot_glmnet(ridge, xvar = "lambda", label = TRUE)
dev.off()

f:id:ushi-goroshi:20200402204310p:plain

f:id:ushi-goroshi:20200402204326p:plain

çµæžœã®è§£é‡ˆãªã©ã«ã¤ã„ã¦è©³ã—ãã¯æ•™ç§‘æ›¸ã‚’è¦‹ã¦é ‚ãã¨ã—ã¦ã€ glmnet ã¯ç›®çš„é–¢æ•°ã«å›žå¸°ä¿‚æ•°ã®è¦æ¨¡ã«å¿œã˜ãŸç½°å‰‡ã‚’è¨ã‘ã‚‹ã“ã¨ã§ã€å›žå¸°ä¿‚æ•°ã‚’0ã«å‘ã‹ã£ã¦ç¸®å°ã•ã›ãªãŒã‚‰ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°ã‚’è¡Œã„ã¾ã™ã€‚ ã¾ãŸã‚°ãƒ©ãƒ•ã®ã‚ˆã†ã«ç½°å‰‡ã®å¤§ãã•ã‚’è‰²ã€…ã¨å‹•ã‹ã™ã“ã¨ã§å„å¤‰æ•°ã¸ã®å›žå¸°ä¿‚æ•°ãŒã©ã®ã‚ˆã†ã«å¤‰åŒ–ã™ã‚‹ã‹ã‚’è©•ä¾¡ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚ ã“ã®ã‚°ãƒ©ãƒ•ã§ã¯å·¦ã‹ã‚‰å³ã«å‘ã‹ã£ã¦ç½°å‰‡ãŒå¼·ããªã‚Šã¾ã™ãŒã€ãã‚Œã«ã¤ã‚Œã¦Lasso/Ridgeã®ä¸¡æ–¹ã¨ã‚‚å›žå¸°ä¿‚æ•°ãŒ0ã«å‘ã‹ã£ã¦å°ã•ããªã£ã¦ã„ã‚‹ï¼ˆç¸®å°ã—ã¦ã„ã‚‹ï¼‰ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ã€‚

ãªãŠ Lasso ã§ã¯å›žå¸°ä¿‚æ•°ãŒ0ã«åŽæŸã—ã¦ã„ã‚‹ä¸€æ–¹ã€ Ridge ã§ã¯å¾®å°ãªãŒã‚‰æœ€å¾Œã¾ã§ä¿‚æ•°ãŒ0ã¨ãªã‚‰ãšã«æ®‹ã£ã¦ã„ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ãŒï¼ˆã‚°ãƒ©ãƒ•ä¸Šéƒ¨ã® Degrees of Freedom ãŒ 4 ã®ã¾ã¾ã¨ãªã£ã¦ã„ã¾ã™ï¼‰ã€ Lasso ã®ã‚ˆã†ã«ä¸€éƒ¨ã®å›žå¸°ä¿‚æ•°ã‚’æ£ç¢ºã« 0 ã¨æŽ¨å®šã™ã‚‹ã“ã¨ãŒå¯èƒ½ãªæ‰‹æ³•ã‚’ã‚¹ãƒ‘ãƒ¼ã‚¹æŽ¨å®šã¨å‘¼ã³ã¾ã™ã€‚

`glmnet` ã®å®Ÿè£…

ãã‚Œã§ã¯ glmnet ã¨ã„ã†é–¢æ•°ãŒã©ã®ã‚ˆã†ã«å®Ÿè£…ã•ã‚Œã¦ã„ã‚‹ã®ã‹è¦‹ã¦ã„ãã¾ã—ã‚‡ã†ã€‚ ã¾ãšã¯ã„ã¤ã‚‚ã®ã‚ˆã†ã«å…¨ä½“ã‚’çœºã‚ã€è¦‹é€šã—ã‚’ã‚ˆãã—ã¾ã™ã€‚

function (x, y, family = c("gaussian", "binomial", "poisson", 
                           "multinomial", "cox", "mgaussian"), weights, offset = NULL, 
          alpha = 1, nlambda = 100, lambda.min.ratio = ifelse(nobs < 
                                                                nvars, 0.01, 1e-04), lambda = NULL, standardize = TRUE, 
          intercept = TRUE, thresh = 1e-07, dfmax = nvars + 1, pmax = min(dfmax * 
                                                                            2 + 20, nvars), exclude, penalty.factor = rep(1, nvars), 
          lower.limits = -Inf, upper.limits = Inf, maxit = 1e+05, type.gaussian = ifelse(nvars < 
                                                                                           500, "covariance", "naive"), type.logistic = c("Newton", 
                                                                                                                                          "modified.Newton"), standardize.response = FALSE, type.multinomial = c("ungrouped", 
                                                                                                                                                                                                                 "grouped"), relax = FALSE, trace.it = 0, ...) 
{
  
  ### 1. ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®è¨å®šã€å‰å‡¦ç†ã€ã‚¨ãƒ©ãƒ¼ãƒã‚§ãƒƒã‚¯
  family = match.arg(family)
  if (alpha > 1) {
    warning("alpha >1; set to 1")
    alpha = 1
  }
  if (alpha < 0) {
    warning("alpha<0; set to 0")
    alpha = 0
  }
  alpha = as.double(alpha)
  this.call = match.call()
  nlam = as.integer(nlambda)
  y = drop(y)
  np = dim(x)
  if (is.null(np) | (np[2] <= 1)) 
    stop("x should be a matrix with 2 or more columns")
  nobs = as.integer(np[1])
  if (missing(weights)) 
    weights = rep(1, nobs)
  else if (length(weights) != nobs) 
    stop(paste("number of elements in weights (", length(weights), 
               ") not equal to the number of rows of x (", nobs, 
               ")", sep = ""))
  nvars = as.integer(np[2])
  dimy = dim(y)
  nrowy = ifelse(is.null(dimy), length(y), dimy[1])
  if (nrowy != nobs) 
    stop(paste("number of observations in y (", nrowy, ") not equal to the number of rows of x (", 
               nobs, ")", sep = ""))
  vnames = colnames(x)
  if (is.null(vnames)) 
    vnames = paste("V", seq(nvars), sep = "")
  ne = as.integer(dfmax)
  nx = as.integer(pmax)
  if (missing(exclude)) 
    exclude = integer(0)
  if (any(penalty.factor == Inf)) {
    exclude = c(exclude, seq(nvars)[penalty.factor == Inf])
    exclude = sort(unique(exclude))
  }
  if (length(exclude) > 0) {
    jd = match(exclude, seq(nvars), 0)
    if (!all(jd > 0)) 
      stop("Some excluded variables out of range")
    penalty.factor[jd] = 1
    jd = as.integer(c(length(jd), jd))
  }
  else jd = as.integer(0)
  vp = as.double(penalty.factor)
  internal.parms = glmnet.control()
  if (internal.parms$itrace) 
    trace.it = 1
  else {
    if (trace.it) {
      glmnet.control(itrace = 1)
      on.exit(glmnet.control(itrace = 0))
    }
  }
  if (any(lower.limits > 0)) {
    stop("Lower limits should be non-positive")
  }
  if (any(upper.limits < 0)) {
    stop("Upper limits should be non-negative")
  }
  lower.limits[lower.limits == -Inf] = -internal.parms$big
  upper.limits[upper.limits == Inf] = internal.parms$big
  if (length(lower.limits) < nvars) {
    if (length(lower.limits) == 1) 
      lower.limits = rep(lower.limits, nvars)
    else stop("Require length 1 or nvars lower.limits")
  }
  else lower.limits = lower.limits[seq(nvars)]
  if (length(upper.limits) < nvars) {
    if (length(upper.limits) == 1) 
      upper.limits = rep(upper.limits, nvars)
    else stop("Require length 1 or nvars upper.limits")
  }
  else upper.limits = upper.limits[seq(nvars)]
  cl = rbind(lower.limits, upper.limits)
  if (any(cl == 0)) {
    fdev = glmnet.control()$fdev
    if (fdev != 0) {
      glmnet.control(fdev = 0)
      on.exit(glmnet.control(fdev = fdev))
    }
  }
  storage.mode(cl) = "double"
  isd = as.integer(standardize)
  intr = as.integer(intercept)
  if (!missing(intercept) && family == "cox") 
    warning("Cox model has no intercept")
  jsd = as.integer(standardize.response)
  thresh = as.double(thresh)
  if (is.null(lambda)) {
    if (lambda.min.ratio >= 1) 
      stop("lambda.min.ratio should be less than 1")
    flmin = as.double(lambda.min.ratio)
    ulam = double(1)
  }
  else {
    flmin = as.double(1)
    if (any(lambda < 0)) 
      stop("lambdas should be non-negative")
    ulam = as.double(rev(sort(lambda)))
    nlam = as.integer(length(lambda))
  }
  is.sparse = FALSE
  ix = jx = NULL
  if (inherits(x, "sparseMatrix")) {
    is.sparse = TRUE
    x = as(x, "CsparseMatrix")
    x = as(x, "dgCMatrix")
    ix = as.integer(x@p + 1)
    jx = as.integer(x@i + 1)
    x = as.double(x@x)
  }
  if (trace.it) {
    if (relax) 
      cat("Training Fit\n")
    pb <- createPB(min = 0, max = nlam, initial = 0, style = 3)
  }
  kopt = switch(match.arg(type.logistic), Newton = 0, modified.Newton = 1)
  if (family == "multinomial") {
    type.multinomial = match.arg(type.multinomial)
    if (type.multinomial == "grouped") 
      kopt = 2
  }
  kopt = as.integer(kopt)
  
  ### 2. ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°
  fit = switch(family, gaussian = elnet(x, is.sparse, ix, jx, 
                                        y, weights, offset, type.gaussian, alpha, nobs, nvars, 
                                        jd, vp, cl, ne, nx, nlam, flmin, ulam, thresh, isd, intr, 
                                        vnames, maxit), poisson = fishnet(x, is.sparse, ix, jx, 
                                                                          y, weights, offset, alpha, nobs, nvars, jd, vp, cl, ne, 
                                                                          nx, nlam, flmin, ulam, thresh, isd, intr, vnames, maxit), 
               binomial = lognet(x, is.sparse, ix, jx, y, weights, offset, 
                                 alpha, nobs, nvars, jd, vp, cl, ne, nx, nlam, flmin, 
                                 ulam, thresh, isd, intr, vnames, maxit, kopt, family), 
               multinomial = lognet(x, is.sparse, ix, jx, y, weights, 
                                    offset, alpha, nobs, nvars, jd, vp, cl, ne, nx, nlam, 
                                    flmin, ulam, thresh, isd, intr, vnames, maxit, kopt, 
                                    family), cox = coxnet(x, is.sparse, ix, jx, y, weights, 
                                                          offset, alpha, nobs, nvars, jd, vp, cl, ne, nx, nlam, 
                                                          flmin, ulam, thresh, isd, vnames, maxit), mgaussian = mrelnet(x, 
                                                                                                                        is.sparse, ix, jx, y, weights, offset, alpha, nobs, 
                                                                                                                        nvars, jd, vp, cl, ne, nx, nlam, flmin, ulam, thresh, 
                                                                                                                        isd, jsd, intr, vnames, maxit))
  if (trace.it) {
    utils::setTxtProgressBar(pb, nlam)
    close(pb)
  }
  
  ### 3. å¾Œå‡¦ç†
  if (is.null(lambda)) 
    fit$lambda = fix.lam(fit$lambda)
  fit$call = this.call
  fit$nobs = nobs
  class(fit) = c(class(fit), "glmnet")
  if (relax) 
    relax.glmnet(fit, x = x, y = y, weights = weights, offset = offset, 
                 lower.limits = lower.limits, upper.limits = upper.limits, 
                 check.args = FALSE, ...)
  else fit
}

glmnet ã§ã¯ä»¥ä¸Šã®ã‚ˆã†ã«ã€

ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®è¨å®šã€å‰å‡¦ç†ã€ã‚¨ãƒ©ãƒ¼ãƒã‚§ãƒƒã‚¯
ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°
å¾Œå‡¦ç†

ã¨ã„ã£ãŸã‚¹ãƒ†ãƒƒãƒ—ã§å‡¦ç†ãŒé€²ã‚“ã§ãŠã‚Šã€ã“ã‚Œã¯éŽåŽ»ã«ã¿ã¦ããŸ glm ã‚„ gam ã¨åŒæ§˜ã§ã™ãã€‚ ãã‚Œã§ã¯å„ã‚¹ãƒ†ãƒƒãƒ—ã‚’ç´°ã‹ãè¦‹ã¦ã„ãã¾ã—ã‚‡ã†ã€‚

1. ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®è¨å®šã€å‰å‡¦ç†ã€ã‚¨ãƒ©ãƒ¼ãƒã‚§ãƒƒã‚¯

ã¾ãšã¯ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®è¨å®šã‚„å‰å‡¦ç†ã«é–¢ã‚ã‚‹éƒ¨åˆ†ã§ã™ãŒã€ã¯ã˜ã‚ã« family ã®æŒ‡å®šãŒå•é¡Œãªã„ã‹ã‚’ãƒã‚§ãƒƒã‚¯ã—ã¾ã™ã€‚

## æŒ‡å®šã—ãŸfamilyãŒå¼•æ•°ã¨ã—ã¦OKã‹ãƒã‚§ãƒƒã‚¯
family = match.arg(family)

glmnet ã§ä½¿ç”¨å¯èƒ½ãª family ã¯ glm ã¨ã¯ç•°ãªã£ã¦ãŠã‚Šã€Gamma / inverse.gaussian / quasi- ãŒä½¿ãˆãªã„ä»£ã‚ã‚Šã«ã€ multinomial / cox / mgaussian ãŒä½¿ãˆã‚‹ã‚ˆã†ã«ãªã£ã¦ã„ã¾ã™ã€‚ ã“ã“ã§ multinomial ã¯å¤šé …åˆ†å¸ƒã€mgaussian ã¯å¤šå¤‰é‡æ£è¦åˆ†å¸ƒã‚’æ„å‘³ã™ã‚‹ã‚ˆã†ã§ã™ã€‚

family ã®ãƒã‚§ãƒƒã‚¯ã«ã¯ match.arg é–¢æ•°ãŒä½¿ã‚ã‚Œã¦ã„ã¾ã™ã€‚ ã“ã®é–¢æ•°ã®æŒ™å‹•ã‚’ç†è§£ã™ã‚‹ã®ã¯å°‘ã—é›£ã—ã„ã®ã§ã™ãŒã€ã“ã¡ã‚‰ã®ãƒ–ãƒã‚°ãŒå‚è€ƒã«ãªã‚Šã¾ã™ã€‚

ç¶šã„ã¦ alpha ã‚’ãƒã‚§ãƒƒã‚¯ã—ã¾ã™ï¼š

## alpha
### Lassoã¨Ridgeãã‚Œãžã‚Œã«å¯¾ã™ã‚‹ãƒšãƒŠãƒ«ãƒ†ã‚£ã®é…åˆ†ã‚’æ±ºã‚ã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿
### glmnetã«ãŠã‘ã‚‹ç½°å‰‡é …ã¯ä»¥ä¸‹ã§å®šç¾©
### alphaã¯0~1ã§ã€1ãªã‚‰Lassoã€0ãªã‚‰Ridgeã«å¯¾å¿œ
if (alpha > 1) {
  warning("alpha >1; set to 1")
  alpha = 1
}
if (alpha < 0) {
  warning("alpha<0; set to 0")
  alpha = 0
}
alpha = as.double(alpha)

glmnet ã«ãŠã„ã¦ã“ã® alpha ã¯ã€å›žå¸°ä¿‚æ•°ã®L1ãŠã‚ˆã³L2ãƒŽãƒ«ãƒ ãã‚Œãžã‚Œã«å¯¾ã™ã‚‹ç½°å‰‡ã®å‰²åˆã‚’ã‚³ãƒ³ãƒˆãƒãƒ¼ãƒ«ã—ã¾ã™ã€‚ ã‚ˆã‚Šå…·ä½“çš„ã«ã¯ã€ glmnet ã§ã¯ç½°å‰‡é …ã¯ä»¥ä¸‹ã«ã‚ˆã£ã¦å®šç¾©ã•ã‚Œã¾ã™ï¼ˆhttps://cran.r-project.org/web/packages/glmnet/glmnet.pdf ã® P19ã‚ˆã‚Šï¼‰ï¼š

$(1 − \alpha)/2||\beta||^{2}_{2} + \alpha||\beta||_{1}$

å†’é ã®ã‚³ãƒ¼ãƒ‰ã§ã¯ alpha = 1 ã¾ãŸã¯ alpha = 0 ã¨ã—ã¾ã—ãŸãŒã€ä¸Šã®å¼ã‹ã‚‰ alpha = 1 ã®ã¨ãã«L2ãƒŽãƒ«ãƒ ã«å¯¾ã™ã‚‹ç½°å‰‡ãŒæ¶ˆãˆã¦L1ãƒŽãƒ«ãƒ ã®ã¿ãŒæ®‹ã‚Šï¼ˆLassoï¼‰ã€é€†ã« alpha = 0 ã¨ã™ã‚‹ã¨L1ãƒŽãƒ«ãƒ ã«å¯¾ã™ã‚‹ç½°å‰‡ãŒæ¶ˆãˆã¦L2ãƒŽãƒ«ãƒ ãŒæ®‹ã‚‹ï¼ˆRidgeï¼‰ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ã€‚ ã¾ãŸ alpha ã‚’ (0, 1) ã¨ã™ã‚‹ã¨ä¸¡è€…ãŒãã‚Œãžã‚Œã®å‰²åˆã§ãƒ–ãƒ¬ãƒ³ãƒ‰ã•ã‚Œã¾ã™ã€‚

ãªãŠã€ã“ã“ã§L2ãƒŽãƒ«ãƒ ã«å¯¾ã™ã‚‹ç½°å‰‡ãŒ1/2ã«ãªã£ã¦ã„ã‚‹ç†ç”±ã¯ã‚ˆãã‚ã‹ã‚Šã¾ã›ã‚“ã§ã—ãŸã€‚ glmnet ã® help ã§å¼•ç”¨ã•ã‚Œã¦ã„ã‚‹ã“ã¡ã‚‰ã®è«–æ–‡ã§ã¯ã™ã§ã« $(1-\alpha)1/2||\beta||^2_2$ ã¨ã—ã¦å®šç¾©ã•ã‚Œã¦ã„ã¾ã™ã€‚ ã¾ãŸscikit-learnã§ã‚‚åŒæ§˜ã«L2ãƒŽãƒ«ãƒ ã«å¯¾ã—ã¦ã¯0.5ã‚’ä¹—ã˜ã¦ã„ã‚‹ã‚ˆã†ã§ã™ï¼ˆhttps://scikit-learn.org/stable/modules/generated/sklearn.linear_model.ElasticNet.htmlï¼‰ã€‚ èª°ã‹ç†ç”±ã‚’æ•™ãˆã¦ãã ã•ã„ã€‚

ç¶šã„ã¦ match.call() ã‚’ç”¨ã„ã¦å¼•æ•°ã®æŒ‡å®šã‚’æ£å¼ãªã‚‚ã®ã«ç›´ã—ã¾ã™ï¼š

## match.call
this.call = match.call()

ã“ã‚Œã ã‘ã ã¨ä½•ã‚’è¨€ã£ã¦ã„ã‚‹ã‹ã¡ã‚‡ã£ã¨ã‚ã‹ã‚‰ãªã„ã¨æ€ã„ã¾ã™ã®ã§ã€ä»¥ä¸‹ã®ä¾‹ã§ç¢ºèªã—ã¦ã¿ã¾ã—ã‚‡ã†ï¼š

myfun <- function(abc, def, ghi) { 
  return(abc + 2*def + 3*ghi)
}

ä¸Šã®ã‚ˆã†ã«å¼•æ•°ã¨ã—ã¦ abc ã€ def ã€ ghi ã‚’å–ã‚‹é–¢æ•°ã‚’å®šç¾©ã—ã¾ã™ã€‚ ã“ã®ã¨ã R ã§ã¯ã€å¼•æ•°ã®æŒ‡å®šãŒãªã„å ´åˆã«ã¯é †ç•ªé€šã‚Šã«å…¥åŠ›ã•ã‚Œã¾ã™ï¼š

> myfun(1, 2, 3)
[1] 14

ä¸€éƒ¨ã®å¼•æ•°ã®ã¿æŒ‡å®šãŒã‚ã‚‹å ´åˆã§ã¯æŒ‡å®šã•ã‚ŒãŸå¼•æ•°ã ã‘ãŒãã®é€šã‚Šã«å…¥åŠ›ã•ã‚Œã€æ®‹ã‚Šã¯é †ç•ªé€šã‚Šã«å‰²ã‚Šå½“ã¦ã‚‰ã‚Œã‚‹ã‚ˆã†ã§ã™ã€‚

> myfun(def = 3, 4, 5)
[1] 25

ã¨ã“ã‚ã§ã“ã®å¼•æ•°ã®æŒ‡å®šã¯ã€ä¸€æ„ã«æ±ºã¾ã‚Œã°æŒ‡å®šã¯çœç•¥ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ï¼š

> myfun(d = 3, 4, 5)
[1] 25

ä¸€æ–¹ã€ä¾‹ãˆã°ä»¥ä¸‹ã®ã‚ˆã†ãªå‘¼ã³å‡ºã—ã§ã¯ g ã‹ã‚‰å§‹ã¾ã‚‹å¼•æ•°ãŒï¼’ã¤ã‚ã‚‹ãŸã‚ä¸€æ„ã«æ±ºã¾ã‚‰ãšã€ã‚¨ãƒ©ãƒ¼ã¨ãªã£ã¦ã—ã¾ã„ã¾ã™ã€‚

> myfun2 <- function(abc, def, ghi, gjk) {
+   return(abc + 2*def + 3*ghi + 4*gjk)
+ }
> myfun2(g = 3, 4, 5, 6)
 myfun2(g = 3, 4, 5, 6) ã§ã‚¨ãƒ©ãƒ¼:  å¼•æ•° 1 ãŒè¤‡æ•°ã®ä»®å¼•æ•°ã«ä¸€è‡´ã—ã¾ã™

ã§ã¯ match.call ã‚’ä½¿ã£ã¦é–¢æ•°ã‚’å‘¼ã³å‡ºã™ã¨ã©ã†ãªã‚‹ã‹ã¨è¨€ã†ã¨ï¼š

> match.call(myfun, call("myfun", 1, def = 3, ghi = 5))
myfun(abc = 1, def = 3, ghi = 5)

ã“ã®é€šã‚Šã€å„å¼•æ•°ã«å¯¾ã—ã¦ä½•ã‚’å‰²ã‚Šå½“ã¦ãŸã‹ã‚’å¾—ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚ ä¾¿åˆ©ã§ã™ãã€‚

ã•ã‚‰ã«ç¶šã„ã¦ã€ nlambda ã®æŒ‡å®šã§ã™ã€‚ ã“ã“ã§ã¯ $\lambda$ ï¼ˆç½°å‰‡ã®å¤§ãã•ï¼‰ãã®ã‚‚ã®ã§ã¯ãªãã€æ¤œè¨¼ã™ã‚‹ $\lambda$ ã®æ•°ï¼ˆnubmer of lambdaï¼‰ã‚’æŒ‡å®šã—ã¾ã™ï¼ˆãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã¯100ï¼‰ã€‚

## nlambda
nlam = as.integer(nlambda)

ã“ã“ã‹ã‚‰ã¯ y ã€ x ãŠã‚ˆã³ weight ã®ãƒã‚§ãƒƒã‚¯ã§ã™ï¼š

## drop
y = drop(y)

## x
### x ã¯ï¼’åˆ—ä»¥ä¸ŠæŒã¤å¿…è¦ãŒã‚ã‚‹ã®ã§ã€å˜å›žå¸°ã¯ã§ããªã„æ§˜å
np = dim(x)
if (is.null(np) | (np[2] <= 1)) 
  stop("x should be a matrix with 2 or more columns")
### x ã®ãƒ¬ã‚³ãƒ¼ãƒ‰æ•°
nobs = as.integer(np[1])

### weights
### æœªå…¥åŠ›ã®ã¨ãã¯ 1 ã‚’ä¸Žãˆã€weights ã¨ nobs ãŒä¸€è‡´ã—ãªã„ã¨ãã¯ã‚¨ãƒ©ãƒ¼
if (missing(weights)) 
  weights = rep(1, nobs)
else if (length(weights) != nobs) 
  stop(paste("number of elements in weights (", length(weights), 
             ") not equal to the number of rows of x (", nobs, 
             ")", sep = ""))

### å¤‰æ•°ã®æ•°
nvars = as.integer(np[2])

## y
dimy = dim(y)
### y ã®ãƒ¬ã‚³ãƒ¼ãƒ‰æ•° 
nrowy = ifelse(is.null(dimy), length(y), dimy[1])
### y ã¨ x ã§ãƒ¬ã‚³ãƒ¼ãƒ‰æ•°ãŒåˆã‚ãªã„ã¨ãã¯ã‚¨ãƒ©ãƒ¼
if (nrowy != nobs) 
  stop(paste("number of observations in y (", nrowy, ") not equal to the number of rows of x (", 
             nobs, ")", sep = ""))
## å¤‰æ•°å
vnames = colnames(x)
if (is.null(vnames)) 
  vnames = paste("V", seq(nvars), sep = "")

y ã«å¯¾ã™ã‚‹ drop ã§ã™ãŒã€ã“ã‚Œã¯ length ãŒ 1 ã§ã‚ã‚‹ã‚ˆã†ãªå†—é•·ãªæ¬¡å…ƒã‚’è½ã¨ã™é–¢æ•°ã§ã™ã€‚ ç¶šã„ã¦ x ã®è¡Œæ•°ãŒ weight ã‚„ y ã¨åˆã‚ãªã„å ´åˆã«ã‚¨ãƒ©ãƒ¼ã‚’è¿”ã—ã¦ã„ã¾ã™ã€‚

ä»¥ä¸‹ã§ã¯ãƒ¢ãƒ‡ãƒ«ã«å«ã‚ã‚‹å¤‰æ•°ã‚„éžã‚¼ãƒã¨ã™ã‚‹å¤‰æ•°ãªã©ã‚’æŒ‡å®šã—ã¾ã™ ï¼ˆ nx(=pmax) ã®æ–¹ã¯ã¡ã‚‡ã£ã¨ç†è§£ãŒã‚¢ãƒ¤ã‚·ã‚¤ã®ã§ help ã®èª¬æ˜Žã‚’æ›¸ã„ã¦ãŠãã¾ã™ï¼‰ï¼š

## è‡ªç”±åº¦
### ãƒ¢ãƒ‡ãƒ«ã«å«ã¾ã‚Œã‚‹å¤‰æ•°ã®ä¸Šé™ã‚’æŒ‡å®š
### dfmax = nvars + 1
ne = as.integer(dfmax)

### éžã‚¼ãƒã¨ã™ã‚‹å¤‰æ•°ã®æ•°ã®ä¸Šé™(?)
### Limit the maximum number of variables ever to be nonzero
### pmax = min(dfmax * 2 + 20, nvars)
nx = as.integer(pmax)

### é™¤å¤–å¯¾è±¡ã¨ãªã‚‹å¤‰æ•°ã®æŒ‡å®š
if (missing(exclude)) 
  exclude = integer(0)

æ¬¡ã«å¤‰æ•°ã”ã¨ã«ç•°ãªã‚‹ãƒšãƒŠãƒ«ãƒ†ã‚£ã‚’ä¸Žãˆã‚‹ãŸã‚ã« penalty.factor ã‚’æŒ‡å®šã—ã¾ã™ã€‚ ã“ã®æ•°å€¤ãŒ lambda ã«ä¹—ã˜ã‚‰ã‚Œã‚‹ãŸã‚ã€ä¾‹ãˆã°ç‰¹å®šã®å¤‰æ•°ã«å¯¾ã—ã¦ penalty.factor = 0 ã¨ã—ã¦ãŠã‘ã°ç½°å‰‡ã‚’ä¸Žãˆãªã„ã‚ˆã†ã«ã™ã‚‹ã“ã¨ãŒå¯èƒ½ã¨ãªã‚Šã¾ã™ï¼ˆçµæžœã¨ã—ã¦å¸¸ã«ãƒ¢ãƒ‡ãƒ«ã«æŽ¡ç”¨ã•ã‚Œã‚‹ã‚ˆã†ã«ãªã‚‹ï¼‰ï¼š

## å¤‰æ•°ã”ã¨ã«ç•°ãªã‚‹ãƒšãƒŠãƒ«ãƒ†ã‚£ã‚’ä¸Žãˆã‚‹
### ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã¯ 1 ãŒå…¥ã‚‹
### Inf ãŒæŒ‡å®šã•ã‚Œã¦ã„ã‚‹å¤‰æ•°ã¯ exclude ã¨ã—ã¦æ‰±ã‚ã‚Œã‚‹
if (any(penalty.factor == Inf)) {
  exclude = c(exclude, seq(nvars)[penalty.factor == Inf])
  exclude = sort(unique(exclude))
}
if (length(exclude) > 0) {
  jd = match(exclude, seq(nvars), 0)
  if (!all(jd > 0)) 
    stop("Some excluded variables out of range")
  penalty.factor[jd] = 1
  jd = as.integer(c(length(jd), jd))
}
else jd = as.integer(0)
vp = as.double(penalty.factor)

ã“ã‚Œã¯ã›ã£ã‹ããªã®ã§å®Ÿéš›ã«ã‚„ã£ã¦ã¿ã¾ã—ã‚‡ã†ã€‚ å†’é ã®ã‚³ãƒ¼ãƒ‰ã‚’æŒã£ã¦ãã¦ã€ä»¥ä¸‹ã®ã‚ˆã†ã« lambda ã‚’é©å½“ã«è¨å®šã—ã¦ã¿ã¾ã™ã€‚

x <- scale(LifeCycleSavings[, 2:5])
y <- LifeCycleSavings[, 1] - mean(LifeCycleSavings[, 1])

> coef(glmnet(x, y, family = "gaussian", alpha = 1, lambda = 0.3))
5 x 1 sparse Matrix of class "dgCMatrix"
                       s0
(Intercept)  1.182354e-15
pop15       -1.691002e+00
pop75        .           
dpi          .           
ddpi         9.816514e-01

ã“ã®ã¨ãã€2ãƒ»3ç•ªç›®ã®å¤‰æ•°ã§ã‚ã‚‹ pop75 ã¨ dpi ã¯ 0 ã¨æŽ¨å®šã•ã‚Œã¦ã—ã¾ã„ã¾ã—ãŸã€‚ ã“ã“ã§ã“ã‚Œã‚‰ã®å¤‰æ•°ã® penalty.factor ã‚’ 0 ã¨ã™ã‚‹ã¨

> coef(glmnet(x, y, family = "gaussian", alpha = 1, lambda = 0.3,
+             penalty.factor = c(1, 0, 0, 1)))
5 x 1 sparse Matrix of class "dgCMatrix"
                       s0
(Intercept)  9.523943e-16
pop15       -7.827680e-01
pop75        8.127991e-01
dpi         -1.560908e-01
ddpi         6.812498e-01

ã¡ã‚ƒã‚“ã¨æŽ¨å®šã•ã‚Œã‚‹ã‚ˆã†ã«ãªã£ã¦ã„ã¾ã™ã€‚ é€†ã« pop15 ã® penalty.factor ã‚’å¤§ããã™ã‚‹ã¨

> coef(glmnet(x, y, family = "gaussian", alpha = 1, lambda = 0.3,
+             penalty.factor = c(2, 0, 0, 1)))
5 x 1 sparse Matrix of class "dgCMatrix"
                      s0
(Intercept) 7.266786e-16
pop15       .           
pop75       1.374655e+00
dpi         2.586151e-02
ddpi        9.300500e-01

ã“ã®ã‚ˆã†ã«ãƒ¢ãƒ‡ãƒ«ã‹ã‚‰é™¤å¤–ã•ã‚Œã‚‹ã“ã¨ã«ãªã‚Šã¾ã™ã€‚ ã•ã‚‰ã« penalty.factor = Inf ã¨ã™ã‚‹ã¨ã€ãã®å¤‰æ•°ã¯ exclude ã¨ã—ã¦æ‰±ã‚ã‚Œã‚‹ã‚ˆã†ã«ãªã‚Šã¾ã™ã€‚

ç¶šã„ã¦ glmnet.control ã§æŒã£ã¦ã„ã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’æ¸¡ã—ã¾ã™ã€‚

## å†…éƒ¨ã§ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã§æŒã£ã¦ã„ã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ 
internal.parms = glmnet.control()
### ãƒ—ãƒã‚°ãƒ¬ã‚¹ãƒãƒ¼ã‚’è¡¨ç¤ºã™ã‚‹ï¼
if (internal.parms$itrace) 
  trace.it = 1
else {
  if (trace.it) {
    glmnet.control(itrace = 1)
    on.exit(glmnet.control(itrace = 0))
  }
}

æ¬¡ã«ã€å›žå¸°ä¿‚æ•°ã«å¯¾ã™ã‚‹ä¸Šé™ãƒ»ä¸‹é™ã‚’è¨å®šã—ã¾ã™ã€‚ ãªãŠä¸‹é™ã¯ non-positive ã€ä¸Šé™ã¯ non-negative ã—ã‹è¨å®šã§ããªã„ã‚ˆã†ã§ã™ãã€‚

## ä¸Šé™ãƒ»ä¸‹é™
### lower.limit ã¨ã—ã¦ã¯éžæ£ã®å€¤ã®ã¿æŒ‡å®šã§ãã‚‹
if (any(lower.limits > 0)) {
  stop("Lower limits should be non-positive")
}
### upper.limtit ã¯é€†ã«éžè² ã®å€¤ã®ã¿æŒ‡å®šã§ãã‚‹
if (any(upper.limits < 0)) {
  stop("Upper limits should be non-negative")
}
### Inf ï¼ˆãƒ‡ãƒ•ã‚©ãƒ«ãƒˆï¼‰ã«ãªã£ã¦ã„ã‚‹ã‚‚ã®ã«ã¤ã„ã¦ã¯ç‰¹å®šã®å€¤(9.9e35)ã«å·®ã—æ›¿ãˆ  
lower.limits[lower.limits == -Inf] = -internal.parms$big
upper.limits[upper.limits == Inf] = internal.parms$big

### nvars ã¨ã®æ•´åˆæ€§ãƒã‚§ãƒƒã‚¯
if (length(lower.limits) < nvars) {
  ### lower.limits ã¨ã—ã¦ã‚¹ã‚«ãƒ©ãŒæŒ‡å®šã•ã‚Œã¦ã„ã‚‹å ´åˆã¯ nvars å…¨ã¦ã«é©ç”¨
  if (length(lower.limits) == 1) 
    lower.limits = rep(lower.limits, nvars)
  else stop("Require length 1 or nvars lower.limits")
}
### lower.limits ãŒ nvars ã‚ˆã‚Šã‚‚é•·ã„å ´åˆã¯å‰ã‹ã‚‰åˆ©ç”¨ã™ã‚‹
else lower.limits = lower.limits[seq(nvars)]
### nvars ã¨ã®æ•´åˆæ€§ãƒã‚§ãƒƒã‚¯ï¼ˆlower.limits ã¨åŒæ§˜ï¼‰
if (length(upper.limits) < nvars) {
  if (length(upper.limits) == 1) 
    upper.limits = rep(upper.limits, nvars)
  else stop("Require length 1 or nvars upper.limits")
}
else upper.limits = upper.limits[seq(nvars)]
### ä¸Šé™ãƒ»ä¸‹é™
### coefficient limitï¼Ÿ
cl = rbind(lower.limits, upper.limits)

### lower ã¾ãŸã¯ upper ã« 0 ã‚’å«ã‚€å ´åˆ
### 0é™¤ç®—ãŒç™ºç”Ÿã™ã‚‹ã¨ãã®ã‚¨ãƒ©ãƒ¼å¯¾ç–ï¼Ÿ
if (any(cl == 0)) {
  ### fdev ã¯æœ€å°ã¨ãªã‚‹ãƒ‡ãƒ“ã‚¢ãƒ³ã‚¹ã®å¤‰åŒ–é‡(å‰²åˆ)
  ### minimum fractional change in deviance for stopping path; factory default = 1.0e5
  fdev = glmnet.control()$fdev
  if (fdev != 0) {
    glmnet.control(fdev = 0)
    on.exit(glmnet.control(fdev = fdev)) # é–¢æ•°çµ‚äº†æ™‚ã«å®Ÿè¡Œã•ã‚Œã‚‹å‡¦ç†
  }
}
storage.mode(cl) = "double"

æ¨™æº–åŒ–ã¨åˆ‡ç‰‡ã«å¯¾ã™ã‚‹æŒ‡å®šã§ã™ã€‚ æ¨™æº–åŒ–ã®å‡¦ç†ãã®ã‚‚ã®ã¯ä»¥é™ã®é–¢æ•°ã®å†…éƒ¨ã§å®Ÿè¡Œã•ã‚Œã‚‹ãŸã‚ã€ã“ã“ã§ã¯æŒ‡å®šã®ã¿ã‚’è¡Œã„ã¾ã™ã€‚

## æ¨™æº–åŒ–
### standardize ã¨ intercept ã¯ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã¯ TRUE ãªã®ã§ 1 ã«ãªã‚‹
isd = as.integer(standardize)
intr = as.integer(intercept)
### Coxå›žå¸°ã«ãŠã‘ã‚‹è¦å‘Š
if (!missing(intercept) && family == "cox") 
  warning("Cox model has no intercept")
### standardize.response ã¯ family="mgaussian" ã®ã¨ãã«ç›®çš„å¤‰æ•°ã‚’æ¨™æº–åŒ–ã™ã‚‹ã‹ã®æŒ‡å®š
jsd = as.integer(standardize.response)

åŽæŸã‚’åˆ¤å®šã™ã‚‹é–¾å€¤ã‚’æŒ‡å®šã—ã¾ã™ã€‚

## åŽæŸåˆ¤å®š
### coordinate descent ã«ãŠã‘ã‚‹åŽæŸã®é–¾å€¤
thresh = as.double(thresh)

æ¬¡ã«ã€ lambda ã«é–¢ã™ã‚‹æŒ‡å®šã¨ãªã‚Šã¾ã™ãŒã€ flmin ãŠã‚ˆã³ ulam ã®ä½¿ã‚ã‚Œæ–¹ãŒã‚ˆãç†è§£ã§ããªã‹ã£ãŸãŸã‚ã€ã“ã‚Œã‚‰ã®èª¬æ˜Žã¯çœç•¥ã—ã¾ã™ã€‚ ãªãŠ help ã«ã‚‚ã‚ã‚Šã¾ã™ãŒã€é€šå¸¸ã¯ lambda ã«ã¯å˜ä¸€ã®å€¤ã§ã¯ãªãã€å€™è£œã¨ãªã‚‹å€¤ã®ãƒ™ã‚¯ãƒˆãƒ«ã‚’ä¸Žãˆã¾ã™ã€‚

Avoid supplying a single value for lambda (for predictions after CV use predict() instead).

## lambda
### ãƒšãƒŠãƒ«ãƒ†ã‚£ã®å¤§ãã•
### æŒ‡å®šãŒãªã„å ´åˆã€flmin ã¨ ulam ã¯ lambda.min.ratio ãŠã‚ˆã³ 1 ã«æŒ‡å®šã•ã‚Œã‚‹
### lambda.min.ratio = ifelse(nobs < nvars, 0.01, 1e-04)
if (is.null(lambda)) {
  if (lambda.min.ratio >= 1) 
    stop("lambda.min.ratio should be less than 1")
  flmin = as.double(lambda.min.ratio)
  ulam = double(1)
}
### æŒ‡å®šãŒã‚ã‚‹å ´åˆã€flmin(ä¸‹é™ï¼Ÿ)ã¨ulam(ä¸Šé™ï¼Ÿ)ã¯ 1 ãŠã‚ˆã³ lambdaã®é™é † ã«æŒ‡å®šã•ã‚Œã‚‹
else {
  flmin = as.double(1)
  if (any(lambda < 0)) 
    stop("lambdas should be non-negative")
  ulam = as.double(rev(sort(lambda)))
  nlam = as.integer(length(lambda))
}

æ¬¡ã«ç–Žè¡Œåˆ—ã®æŒ‡å®šã§ã™ã€‚ å…¥åŠ› X ãŒç–Žè¡Œåˆ—ã§ã‚ã‚‹å ´åˆã€dgCMatrix å½¢å¼ã«å¤‰æ›ã•ã‚Œã¾ã™ã€‚ ã“ã“ã§ dgCMatrix ã¨ã¯åˆ—æ–¹å‘ã®å¿—å‘æ€§ã‚’æŒã¤ç–Žè¡Œåˆ—ã®å½¢å¼ã§ã™ã€‚

## sparse matrix 
### x ãŒ Matrix::sparseMatrix ã®å ´åˆã¯ Matrix::dgCMatrix ã«å¤‰æ›ã™ã‚‹
### dgCMatrix: cscé †ã«ä¸¦ã³æ›¿ãˆã¦(cscå½¢å¼)ã®ç–Žè¡Œåˆ—åœ§ç¸®ä¿ç®¡
is.sparse = FALSE
ix = jx = NULL
if (inherits(x, "sparseMatrix")) {
  is.sparse = TRUE
  x = as(x, "CsparseMatrix")
  x = as(x, "dgCMatrix")
  ### x@p ã¯å„åˆ—ã®éžã‚¼ãƒã®å€¤ã®å€‹æ•°ã‚’ç©ã¿ä¸Šã’ãŸã‚‚ã®ãŒæ ¼ç´ã•ã‚Œã¦ã„ã‚‹ï¼ˆåˆ—æ•° + 1ï¼‰
  ### diff(x@p + 1) ã™ã‚Œã°å„åˆ—ã®éžã‚¼ãƒã®å€¤ã®å€‹æ•°ãŒã‚ã‹ã‚‹
  ix = as.integer(x@p + 1)
  ### x@i ã¯å„åˆ—ã®éžã‚¼ãƒã®å€¤ã®è¡Œç•ªå·ãŒæ ¼ç´ã•ã‚Œã¦ã„ã‚‹ï¼ˆãªã®ã§ length(x@i) ãŒéžã‚¼ãƒã®å€¤ã®å€‹æ•°ã¨ä¸€è‡´ã™ã‚‹ï¼‰
  ### 0-index ãªã®ã§ R ã®ã‚¹ã‚¿ã‚¤ãƒ«ã¨åˆã‚ã›ã‚‹ãŸã‚ã« +1 ã—ã¦ã„ã‚‹ã®ã§ã—ã‚‡ã†
  jx = as.integer(x@i + 1)
  ### x@x ã¯éžã‚¼ãƒã§ã‚ã‚‹å€¤ãã®ã‚‚ã®ã®ãƒ™ã‚¯ãƒˆãƒ«
  x = as.double(x@x)
}

ã“ã“ã‚‚ã€ã›ã£ã‹ããªã®ã§ç–Žè¡Œåˆ—ã«ãŠã‘ã‚‹æ•°å€¤ã®æ ¼ç´æ–¹æ³•ã«ã¤ã„ã¦ã‚‚è¦‹ã¦ãŠãã¾ã—ã‚‡ã†ã€‚ ä»¥ä¸‹ã®ã‚ˆã†ã«ç–Žè¡Œåˆ—ã‚’ä½œæˆã—ã¾ã™ï¼š

set.seed(1234)
i <- c(1, 5, 18)
j <- c(4, 13, 19)
n <- rnorm(3)

m <- matrix(0, 20, 20)
for (k in 1:length(n)) {
  m[i[k], j[k]] <- n[k]
}

s_m <- as(m, "dgCMatrix")

ã“ã“ã§ s_m ã¯è¡Œåˆ— m ã‚’ç–Žè¡Œåˆ—ã¨ã—ã¦æ‰±ã£ãŸã‚‚ã®ã§ã™ã€‚ str() ã§ç¢ºèªã™ã‚‹ã¨ã€ s_m ã«ã¯

@ i ï¼šéžã‚¼ãƒã®è¦ç´ ã®å…¥ã£ã¦ã„ãŸè¡Œç•ªå·( 0-index ã§ã‚ã‚‹ã“ã¨ã«æ³¨æ„)
@ p ï¼šå„åˆ—ã«ãŠã‘ã‚‹éžã‚¼ãƒã®è¦ç´ ã®å€‹æ•°ã‚’ç©ã¿ä¸Šã’ãŸã‚‚ã®
@ Dim ï¼šè¡Œåˆ—ã®æ¬¡å…ƒ
@ Dimnames ï¼šè¡Œåˆ—ã®å„æ¬¡å…ƒã®åå‰
@ x ï¼šéžã‚¼ãƒã®è¦ç´ ã®æ•°å€¤
@ factors ï¼šï¼ˆã“ã‚Œã¯ã¡ã‚‡ã£ã¨ã‚ã‹ã‚Šã¾ã›ã‚“ã§ã—ãŸï¼‰

ãŒæ ¼ç´ã•ã‚Œã¦ã„ã¾ã™ã€‚

> str(s_m)
Formal class 'dgCMatrix' [package "Matrix"] with 6 slots
  ..@ i       : int [1:3] 0 4 17
  ..@ p       : int [1:21] 0 0 0 0 1 1 1 1 1 1 ...
  ..@ Dim     : int [1:2] 20 20
  ..@ Dimnames:List of 2
  .. ..$ : NULL
  .. ..$ : NULL
  ..@ x       : num [1:3] -1.207 0.277 1.084
  ..@ factors : list()

ã“ã“ã§ @ i ã«ã¯éžã‚¼ãƒã§ã‚ã‚‹å„è¦ç´ ã®è¡Œç•ªå·ãŒå…¥ã‚‹ãŸã‚è¡Œåˆ— m ã‚’ä½œã£ãŸã¨ãã®è¡Œç•ªå·ã®æŒ‡å®š i ã«å¯¾å¿œã—ã¾ã™ãŒã€0-index ã§ã‚ã‚‹ãŸã‚æ•°å—ã¯1ã¤ãšã¤å°ã•ããªã£ã¦ã„ã¾ã™ã€‚

> print(i- 1)
[1]  0  4 17
> print(s_m@i)
[1]  0  4 17

ã¡ã‚‡ã£ã¨ã‚ã‹ã‚Šã«ãã„ã®ãŒ @ p ã§ã€ã“ã“ã«ã¯å„åˆ—ã«ãŠã‘ã‚‹éžã‚¼ãƒã®è¦ç´ ã®å€‹æ•°ã®ç´¯ç©ãŒæ ¼ç´ã•ã‚Œã€åˆ—æ•°ã«å¯¾å¿œã—ã¾ã™ï¼ˆãŸã ã—æœ€åˆã« 0 ãŒè¿½åŠ ã•ã‚Œã‚‹ãŸã‚ã€åˆ—æ•° + 1 ã®é•·ã•ã«ãªã‚Šã¾ã™ï¼‰ã€‚ ä»Šå›žã®ä¾‹ã§ã¯è¡Œåˆ—ã®åˆ—æ•°ãŒ 20 ãªã®ã§ã€length ãŒ 21 ã¨ãªã‚Šã¾ã™ã€‚

> length(s_m@p)
[1] 21

ã“ã®ãƒ™ã‚¯ãƒˆãƒ«ã«ã¯éžã‚¼ãƒã®è¦ç´ ã®å€‹æ•°ã®ç´¯ç©ãŒå…¥ã£ã¦ã„ã‚‹ãŸã‚ã€å·®åˆ†ã‚’å–ã‚‹ã¨å…ƒã®è¡Œåˆ—ã§éžã‚¼ãƒã®è¦ç´ ãŒå…¥ã£ã¦ã„ãŸåˆ—ã‚’å¾—ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚

> diff(s_m@p)
 [1] 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0

åˆ—ç•ªå·ã‚’æŒ‡å®šã—ãŸ j ã¨æ¯”è¼ƒã—ã¦ã¿ã¾ã—ã‚‡ã†ï¼š

> which(diff(s_m@p) == 1)
[1]  4 13 19
> j
[1]  4 13 19

åˆã£ã¦ã„ã¾ã™ãã€‚ ç¶šãå‡¦ç†ã§ã¯ã€ ix ã«ã¯å„åˆ—ã«ãŠã‘ã‚‹éžã‚¼ãƒã®è¦ç´ ã®ç´¯ç©å€‹æ•°(+1)ã‚’ ã€ jx ã«ã¯è¡Œç•ªå·ã‚’ä»£å…¥ã—ã¦ã„ã¾ã™ã€‚ ã¾ãŸ x ã«ã¯å…ƒã®ç–Žè¡Œåˆ—ã«ãŠã‘ã‚‹éžã‚¼ãƒã®è¦ç´ ã®å€¤ãã®ã‚‚ã®ã‚’ãƒ™ã‚¯ãƒˆãƒ«ã¨ã—ã¦å…¥åŠ›ã—ã¦ãŠã‚Šã€èª¬æ˜Žå¤‰æ•°ã®è¡Œåˆ—ãŒç–Žè¡Œåˆ—ã§ã‚ã£ãŸå ´åˆã€ã“ã®æ™‚ç‚¹ã§è¡Œåˆ—ã§ã¯ãªããƒ™ã‚¯ãƒˆãƒ«ã¨ã—ã¦æ‰±ã‚ã‚Œã‚‹ã“ã¨ã«ãªã‚Šã¾ã™ã€‚

æ¬¡ã«ã€ãƒ—ãƒã‚°ãƒ¬ã‚¹ãƒãƒ¼ã®æŒ‡å®šã§ã™ï¼ˆå‡ºã›ã‚‹ã‚“ã§ã™ãï¼‰ã€‚

## ãƒ—ãƒã‚°ãƒ¬ã‚¹ãƒãƒ¼
if (trace.it) {
  if (relax) 
    cat("Training Fit\n")
  pb <- createPB(min = 0, max = nlam, initial = 0, style = 3)
}

ãã—ã¦æœ€å¾Œã«æœ€é©åŒ–ã®æ‰‹æ³•ã«ã¤ã„ã¦ã®æŒ‡å®šã§ã™ã€‚ family ãŒ `binomial ã¾ãŸã¯ multinomial ã®å ´åˆã€ glmnet ã®å¼•æ•°ã§ã‚ã‚‹ type.logistic ãŠã‚ˆã³ type.multinomial ãŒè©•ä¾¡ã•ã‚Œã€ï¼ˆå¾Œã®å·¥ç¨‹ã§ï¼‰ãã‚Œã«å¿œã˜ã¦å‘¼ã°ã‚Œã‚‹é–¢æ•°ãŒå¤‰ã‚ã‚Šã¾ã™ã€‚ å…·ä½“çš„ã«ã¯ lognet2m ã€ lognetn ãŠã‚ˆã³ multlognetn ã®ã©ã‚ŒãŒé¸ã°ã‚Œã‚‹ã‹ãŒæ±ºã¾ã‚Šã¾ã™ã€‚ ã“ã‚Œã¯åˆ¥ã®æ©Ÿä¼šã«è§£èª¬ã—ã¾ã™ï¼ˆäºˆå®šã§ã™ï¼‰ã€‚

## æœ€é©åŒ–ã®æ‰‹æ³•ï¼ˆãƒã‚¸ã‚¹ãƒ†ã‚£ãƒƒã‚¯ãŠã‚ˆã³å¤šé …ãƒã‚¸ã‚¹ãƒ†ã‚£ãƒƒã‚¯ã®æ™‚ï¼‰
### type.logistic = c("Newton", "modified.Newton")
### Newton ã‚’æŒ‡å®šãªã‚‰ 0ã€modified.Newton ã‚’æŒ‡å®šãªã‚‰ 1 ã‚’è¿”ã™
### If "Newton" then the exact hessian is used (default), while "modified.Newton" uses an upper-bound on the hessian, and can be faster.
kopt = switch(match.arg(type.logistic), Newton = 0, modified.Newton = 1)
### type.multinomial = c("ungrouped", "grouped")
### å¤šé …ãƒã‚¸ã‚¹ãƒ†ã‚£ãƒƒã‚¯ã§æ›´ã«groupedã®å ´åˆã¯ kopt ã¯ 2 ã¨ãªã‚‹
### If "grouped" then a grouped lasso penalty is used on the multinomial coefficients for a variable. This ensures they are all in our out together. 
### The default is "ungrouped"
if (family == "multinomial") {
  type.multinomial = match.arg(type.multinomial)
  if (type.multinomial == "grouped") 
    kopt = 2
}
kopt = as.integer(kopt)

æœ€åˆã®æ–¹ã§ family ã®ãƒã‚§ãƒƒã‚¯ã«ä½¿ã‚ã‚Œã€ã“ã“ã§ã‚‚ä½¿ã‚ã‚Œã¦ã„ã‚‹ match.arg ã§ã™ãŒã€ã›ã£ã‹ããªã®ã§æŒ™å‹•ã‚’ç¢ºèªã—ã¦ãŠãã¾ã—ã‚‡ã†ï¼š

### å¼•æ•°ã« type.logistic ã‚’æŒã¤é–¢æ•°ã‚’å®šç¾©
myfun <- function(a = "aaa", type.logistic = c("Newton", "modified.Newton")) {
  ### å‘¼ã³å‡ºã—å…ƒã®é–¢æ•°ã®å¼•æ•°ã‚’ãƒã‚§ãƒƒã‚¯ã—ã€ Newton ãªã‚‰ 0ã€modified.Newton ãªã‚‰ 1ã‚’å‰²ã‚Šå½“ã¦ã‚‹
  kopt <- switch(match.arg(type.logistic), Newton = 0, modified.Newton = 1)
  kopt
}

> myfun()
[1] 0
> myfun(type.logistic = "Newton")
[1] 0
> myfun(type.logistic = "modified.Newton")
[1] 1

2. ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°

ä»¥ä¸Šã§ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®è¨å®šã‚„å‰å‡¦ç†ãŒçµ‚ã‚ã‚Šã¾ã—ãŸã®ã§æ¬¡ã¯ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°ã§ã™ã€‚ ã¨ã„ã£ã¦ã‚‚ã“ã“ã§ã¯ family ã«å¿œã˜ã¦å‘¼ã³å‡ºã™é–¢æ•°ã‚’å¤‰ãˆã¦ã„ã‚‹ã ã‘ãªã®ã§ã€è©³ç´°ã¯ä¸€æ—¦ã‚¹ã‚ãƒƒãƒ—ã—ã¾ã—ã‚‡ã†ã€‚

# ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°
## family ã«å¿œã˜ã¦ãã®å¾Œã«å‘¼ã³å‡ºã™é–¢æ•°ã‚’å¤‰ãˆã‚‹
fit = switch(family,
             ### gaussian ã®ã¨ãã¯ elnet 
             gaussian = elnet(x, is.sparse, ix, jx, 
                              y, weights, offset, type.gaussian, alpha, nobs, nvars, 
                              jd, vp, cl, ne, nx, nlam, flmin, ulam, thresh, isd, intr, 
                              vnames, maxit), 
             ### poisson ã®ã¨ãã¯ fishnet
             poisson = fishnet(x, is.sparse, ix, jx, 
                               y, weights, offset, alpha, nobs, nvars, jd, vp, cl, ne, 
                               nx, nlam, flmin, ulam, thresh, isd, intr, vnames, maxit),
             ### binomial ã®ã¨ãã¯ lognet
             binomial = lognet(x, is.sparse, ix, jx, y, weights, offset, 
                               alpha, nobs, nvars, jd, vp, cl, ne, nx, nlam, flmin, 
                               ulam, thresh, isd, intr, vnames, maxit, kopt, family), 
             ### multinomial ã®ã¨ãã‚‚ lognet
             multinomial = lognet(x, is.sparse, ix, jx, y, weights, 
                                  offset, alpha, nobs, nvars, jd, vp, cl, ne, nx, nlam, 
                                  flmin, ulam, thresh, isd, intr, vnames, maxit, kopt, 
                                  family), 
             ### cox ã®ã¨ãã¯ coxnet
             cox = coxnet(x, is.sparse, ix, jx, y, weights, 
                          offset, alpha, nobs, nvars, jd, vp, cl, ne, nx, nlam, 
                          flmin, ulam, thresh, isd, vnames, maxit), 
             ### mgaussian ã®ã¨ãã¯ mrelnet
             mgaussian = mrelnet(x, 
                                 is.sparse, ix, jx, y, weights, offset, alpha, nobs, 
                                 nvars, jd, vp, cl, ne, nx, nlam, flmin, ulam, thresh, 
                                 isd, jsd, intr, vnames, maxit))
## ãƒ—ãƒã‚°ãƒ¬ã‚¹ãƒãƒ¼
if (trace.it) {
  utils::setTxtProgressBar(pb, nlam)
  close(pb)
}

ãªãŠã“ã“ã§ãã‚Œãžã‚Œã®é–¢æ•°ã«æ¸¡ã•ã‚Œã¦ã„ã‚‹å¼•æ•°ã‚’æ¯”è¼ƒã™ã‚‹ã¨ä»¥ä¸‹ã®ã‚ˆã†ã«ãªã‚Šã¾ã™ï¼ˆä¸€éƒ¨ã¯ã‚ˆãã‚ã‹ã‚Šã¾ã›ã‚“ã§ã—ãŸï¼‰ï¼š

å¼•æ•°	èª¬æ˜Ž	elnet	fishnet	lognet	coxnet	mrelnet
x	èª¬æ˜Žå¤‰æ•°ã®è¡Œåˆ—	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
is.sparse	ç–Žè¡Œåˆ—ã§ã‚ã‚‹ã‹ã®æŒ‡å®š	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
ix	ç–Žè¡Œåˆ—ã«ãŠã‘ã‚‹éžã‚¼ãƒã®è¦ç´ ã®ç´¯ç©å€‹æ•°	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
jx	ç–Žè¡Œåˆ—ã«ãŠã‘ã‚‹éžã‚¼ãƒã®è¦ç´ ã®è¡Œç•ªå·	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
y	ç›®çš„å¤‰æ•°ã®è¡Œåˆ—	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
weights	è¦³æ¸¬å€¤ã«å¯¾ã™ã‚‹é‡ã¿	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
offset	ã‚ªãƒ•ã‚»ãƒƒãƒˆ	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
type.gaussian	1:covariance, 2:naÃ¯ve	ã€‡	-	-	-	-
alpha	L1ã¨L2ã«å¯¾ã™ã‚‹é‡ã¿ã®èª¿æ•´ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
nobs	ãƒ¬ã‚³ãƒ¼ãƒ‰æ•°	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
nvars	èª¬æ˜Žå¤‰æ•°ã®æ•°	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
jd	?	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
vp	å„å¤‰æ•°ã«å¯¾ã™ã‚‹ç½°å‰‡ã®é‡ã¿ï¼ˆpenalty.factorï¼‰	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
cl	?	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
ne	ãƒ¢ãƒ‡ãƒ«ã«å«ã¾ã‚Œã‚‹å¤‰æ•°ã®ä¸Šé™ã€‚ne = dfmax = nvars + 1	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
nx	éžã‚¼ãƒã¨ã™ã‚‹å¤‰æ•°ã®å€‹æ•°ã®ä¸Šé™ï¼Ÿ	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
nlam	lambdaã®æ•°	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
flmin	?	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
ulam	?	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
thresh	åŽæŸåˆ¤å®šã®é–¾å€¤	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
isd	standardizeã™ã‚‹ã‹ã®æŒ‡å®š	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
jsd	?	-	-	-	-	ã€‡
intr	åˆ‡ç‰‡ï¼ˆInterceptï¼‰ã‚’å«ã‚ã‚‹ã‹ã®æŒ‡å®š	ã€‡	ã€‡	ã€‡	-	ã€‡
vnames	å¤‰æ•°å	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
maxit	åå¾©å›žæ•°ã®ä¸Šé™	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
kopt	æœ€é©åŒ–ã®æ‰‹æ³•	-	-	ã€‡	-	-
family	family	-	-	ã€‡	-	-

3. å¾Œå‡¦ç†

æœ€å¾Œã«å¾Œå‡¦ç†ã§ã™ã€‚

# å¾Œå‡¦ç†
## lambda ãŒæŒ‡å®šã•ã‚Œã¦ãŠã‚‰ãš fit$lambda ãŒ 3 ãƒ‘ã‚¿ãƒ¼ãƒ³ä»¥ä¸Šæ¤œè¨¼ã•ã‚Œã¦ã„ã‚‹å ´åˆã€å…ˆé ã‚’å·®ã—æ›¿ãˆã‚‹
## glmnet::fix.lam
## function (lam) {
## if (length(lam) > 2) {
##     llam = log(lam)
##     lam[1] = exp(2 * llam[2] - llam[3])
## }
## lam
## }
if (is.null(lambda)) 
  fit$lambda = fix.lam(fit$lambda)
## call
fit$call = this.call
## ãƒ¬ã‚³ãƒ¼ãƒ‰æ•°
fit$nobs = nobs
## class ã« glmnet ã‚’è¿½åŠ 
class(fit) = c(class(fit), "glmnet")

# ãƒªã‚¿ãƒ¼ãƒ³
## relax ãŒ TRUE ã®å ´åˆã€è§£ãƒ‘ã‚¹ã®å„ã‚»ãƒƒãƒˆã«ã¤ã„ã¦ç½°å‰‡ãªã—ã§ãƒ¢ãƒ‡ãƒ«ã‚’ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°ã™ã‚‹   
## If TRUE then for each active set in the path of solutions, the model is refit without any regularization. See details for more information. 
## This argument is new, and users may experience convergence issues with small datasets, especially with non-gaussian families. 
## Limiting the value of â€™maxpâ€™ can alleviate these issues in some cases.
if (relax) 
  relax.glmnet(fit, x = x, y = y, weights = weights, offset = offset, 
               lower.limits = lower.limits, upper.limits = upper.limits, 
               check.args = FALSE, ...)
else fit

ã“ã®å¾Œå‡¦ç†ã§ç›®ç«‹ã¤å·¥ç¨‹ã¨ã—ã¦ã¯ relax ã®éƒ¨åˆ†ã§ã—ã‚‡ã†ã€‚ ã“ã“ã§ relax ã¯ help ã«ã‚ˆã‚‹ã¨ã€

If relax=TRUE a duplicate sequence of models is produced, where each active set in the elastic-net path is refit without regularization. The result of this is a matching "glmnet" object which is stored on the original object in a component named "relaxed", and is part of the glmnet output.

ã¨ã„ã†ã“ã¨ã§ã€glmnet ã«ã‚ˆã£ã¦å¤‰æ•°é¸æŠžã•ã‚ŒãŸçµæžœã‚’ç”¨ã„ã¦ã€ç½°å‰‡ãªã—ã§å†åº¦ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°ã‚’è¡Œã†ã‚ªãƒ—ã‚·ãƒ§ãƒ³ã®ã‚ˆã†ã§ã™ã€‚ ã“ã‚Œã‚‚å®Ÿéš›ã«ã‚„ã£ã¦ã¿ã‚‹ã®ãŒæ—©ã„ã¨æ€ã„ã¾ã™ã®ã§ã€ä»¥ä¸‹ã®ã‚ˆã†ã«å®Ÿè¡Œã—ã¦ã¿ã¾ã™ï¼š

lasso_02 <- glmnet(x, y, family = "gaussian", relax = T)

ã™ã‚‹ã¨ã€å…ˆç¨‹ã®çµæžœï¼ˆ lasso ï¼‰ã«ã€ lasso_02$relaxed ã¨ã„ã†çµæžœãŒè¿½åŠ ã•ã‚Œã¦ã„ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ãŒã€å†…å®¹ã¯ lasso ã¨ã»ã¨ã‚“ã©åŒã˜ã§ã™ã€‚

> str(lasso)
List of 12
 $ a0       : Named num [1:68] 6.11e-16 6.71e-16 7.26e-16 7.76e-16 8.22e-16 ...
  ..- attr(*, "names")= chr [1:68] "s0" "s1" "s2" "s3" ...
 $ beta     :Formal class 'dgCMatrix' [package "Matrix"] with 6 slots
  .. ..@ i       : int [1:216] 0 0 0 0 0 3 0 3 0 3 ...
  .. ..@ p       : int [1:69] 0 0 1 2 3 4 6 8 10 12 ...
  .. ..@ Dim     : int [1:2] 4 68
  .. ..@ Dimnames:List of 2
  .. .. ..$ : chr [1:4] "pop15" "pop75" "dpi" "ddpi"
  .. .. ..$ : chr [1:68] "s0" "s1" "s2" "s3" ...
  .. ..@ x       : num [1:216] -0.181 -0.347 -0.497 -0.634 -0.757 ...
  .. ..@ factors : list()
 $ df       : int [1:68] 0 1 1 1 1 2 2 2 2 2 ...
 $ dim      : int [1:2] 4 68
 $ lambda   : num [1:68] 2.02 1.84 1.68 1.53 1.39 ...
 $ dev.ratio: num [1:68] 0 0.0352 0.0645 0.0888 0.1089 ...
 $ nulldev  : num 984
 $ npasses  : int 562
 $ jerr     : int 0
 $ offset   : logi FALSE
 $ call     : language glmnet(x = x, y = y, family = "gaussian", alpha = 1)
 $ nobs     : int 50
 - attr(*, "class")= chr [1:2] "elnet" "glmnet"

> str(lasso_02$relaxed)
List of 12
 $ a0       : Named num [1:68] 6.11e-16 1.29e-15 1.29e-15 1.29e-15 1.29e-15 ...
  ..- attr(*, "names")= chr [1:68] "s0" "s1" "s2" "s3" ...
 $ beta     :Formal class 'dgCMatrix' [package "Matrix"] with 6 slots
  .. ..@ i       : int [1:216] 0 0 0 0 0 3 0 3 0 3 ...
  .. ..@ p       : int [1:69] 0 0 1 2 3 4 6 8 10 12 ...
  .. ..@ Dim     : int [1:2] 4 68
  .. ..@ Dimnames:List of 2
  .. .. ..$ : chr [1:4] "pop15" "pop75" "dpi" "ddpi"
  .. .. ..$ : chr [1:68] "s0" "s1" "s2" "s3" ...
  .. ..@ x       : num [1:216] -2.04 -2.04 -2.04 -2.04 -1.98 ...
  .. ..@ factors : list()
 $ df       : int [1:68] 0 1 1 1 1 2 2 2 2 2 ...
 $ dim      : int [1:2] 4 68
 $ lambda   : num [1:68] 2.02 1.84 1.68 1.53 1.39 ...
 $ dev.ratio: num [1:68] 0 0.208 0.208 0.208 0.208 ...
 $ nulldev  : num 984
 $ npasses  : int 562
 $ jerr     : int 0
 $ offset   : logi FALSE
 $ call     : language glmnet(x = x, y = y, family = "gaussian", relax = T)
 $ nobs     : int 50
 - attr(*, "class")= chr [1:2] "elnet" "glmnet"

ã“ã“ã§ lasso_02$relaxed ã®ä¸èº«ã‚’å°‘ã—è¦‹ã¦ã¿ã‚‹ã¨ã€ä¾‹ãˆã° beta ã«ã¯ä»¥ä¸‹ã®ã‚ˆã†ãªæ•°å€¤ãŒå…¥ã£ã¦ã„ã¾ã™ã€‚

> lasso_02$relaxed$beta[, 1:6]
4 x 6 sparse Matrix of class "dgCMatrix"
      s0        s1        s2        s3        s4        s5
pop15  . -2.040996 -2.040996 -2.040996 -2.040996 -1.980216
pop75  .  .         .         .         .         .       
dpi    .  .         .         .         .         .       
ddpi   .  .         .         .         .         1.270865

ã“ã‚Œã¯ä½•ã‹ã¨è¨€ã†ã¨ã€å°‘ã—ãšã¤ç½°å‰‡ã®é‡ã¿ã‚’å¤‰ãˆãŸã“ã¨ã§å¤‰æ•°ãŒé¸æŠžã•ã‚ŒãŸçŠ¶æ…‹ã§é€šå¸¸ã®ç·šå½¢å›žå¸°ã‚’å½“ã¦ã¯ã‚ãŸã¨ãã®å›žå¸°ä¿‚æ•°ã¨ãªã£ã¦ã„ã¾ã™ã€‚ ä¾‹ãˆã° lasso_02$relaxed$beta[, 6] ã«ã¯ã€å¤‰æ•°ã¨ã—ã¦é¸æŠžã•ã‚ŒãŸ pop15 ã¨ ddpi ãã‚Œãžã‚Œã®å›žå¸°ä¿‚æ•°ãŒå…¥ã£ã¦ã„ã¾ã™ã€‚ å®Ÿéš›ã« lm ã®çµæžœã¨ä¸€è‡´ã™ã‚‹ã‹è¦‹ã¦ã¿ã¾ã—ã‚‡ã†ï¼š

> coef(lm(y ~ x[, c(1, 4)]))
      (Intercept) x[, c(1, 4)]pop15  x[, c(1, 4)]ddpi 
     1.364331e-15     -1.980216e+00      1.270865e+00

åˆã£ã¦ã„ã¾ã™ãã€‚ ã¨ã“ã‚ã§åˆ‡ç‰‡ã®æŽ¨å®šå€¤ãŒå…¥ã£ã¦ã„ã‚‹ lasso_02$relaxed$a0 ã®å€¤ã¯å°‘ã—ç•°ãªã‚‹ã‚ˆã†ã§ã™ï¼š

> lasso_02$relaxed$a0[6]
         s5 
1.28119e-15

ãªã‚“ã§ã‚„ã‚ã‹ã€‚ã€‚

ã‚‚ã—ã‹ã—ãŸã‚‰æ¨™æº–åŒ–ã®é•ã„ã‹ã¨ã‚‚æ€ã„ã¾ã—ãŸãŒãã‚Œã§ã‚‚ãªã„ã‚ˆã†ã§ã€ã“ã®ç†ç”±ã¯ã‚ã‹ã‚Šã¾ã›ã‚“ã§ã—ãŸã€‚

lasso_03 <- glmnet(x, y, family = "gaussian", relax = T, standardize = F)

> lasso_03$relaxed$a0[6]
         s5 
1.28119e-15

glmnet() ã®å®Ÿè£…ã¯ä»¥ä¸Šã¨ãªã‚Šã¾ã™ã€‚ æ¬¡å›žã¯ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°ã®éƒ¨åˆ†ã§å‘¼ã°ã‚Œã¦ã„ã‚‹ elnet ã‚’è©³ã—ãè¦‹ã¦ã„ãã¾ã—ã‚‡ã†ã€‚ ãªãŠ gam ã®ã¨ãã¨ã¯é•ã„ã€ glmnet ã§ã¯ library ã‚’ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã—ã¦ã‚‚ã‚½ãƒ¼ã‚¹ã‚³ãƒ¼ãƒ‰ã¯ä»˜ã„ã¦ãã¾ã›ã‚“ã§ã—ãŸã®ã§ã€ã“ã¡ã‚‰ã‚’å‚è€ƒã« fortran ã®ã‚½ãƒ¼ã‚¹ã‚³ãƒ¼ãƒ‰ã‚’å–å¾—ã—ã¾ã—ãŸã€‚

ã§ã¯ã¾ãŸæ¬¡å›žã€‚

èƒŒæ™¯

glmnet ã®å®Ÿè¡Œçµæžœ

glmnet ã®å®Ÿè£…

1. ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®è¨­å®šã€å‰å‡¦ç†ã€ã‚¨ãƒ©ãƒ¼ãƒã‚§ãƒƒã‚¯

2. ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°

3. å¾Œå‡¦ç†

`glmnet` ã®å®Ÿè¡Œçµæžœ

`glmnet` ã®å®Ÿè£…

1. ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®è¨å®šã€å‰å‡¦ç†ã€ã‚¨ãƒ©ãƒ¼ãƒã‚§ãƒƒã‚¯

3. å¾Œå‡¦ç†