2021-08-20

é›†å›£ã®ç¹æ „ã«å¿…è¦ãªåã©ã‚‚ã®æ•°ã«ã¤ã„ã¦è€ƒãˆã‚‹

â€»ä»Šå›žã®å†…å®¹ã¯Dr.STONEã¨ã„ã†æ¼«ç”»ã®ãƒã‚¿ãƒãƒ¬ã‚’å«ã¿ã¾ã™

å”çªã§ã™ãŒã€Dr.STONEã¨ã„ã†æ¼«ç”»ãŒå¥½ãã§ã™ã€‚

Dr.STONE 1 (ã‚¸ãƒ£ãƒ³ãƒ—ã‚³ãƒŸãƒƒã‚¯ã‚¹DIGITAL)

ä½œè€…:ç¨²åž£ç†ä¸€éƒŽ,Boichi
é›†è‹±ç¤¾

ç‰©ç†ã‚„åŒ–å¦ã«è©³ã—ããªã„ã®ã§å†…å®¹ã‚’ç†è§£ã—ãªãŒã‚‰èªã‚ã¦ã„ã‚‹ã‚ã‘ã§ã¯ãªã„ã®ã§ã™ãŒã€çŸ³åŒ–ã—ãŸä¸–ç•Œã§å°‘ã—ãšã¤æ–‡æ˜Žã®ãƒ¬ãƒ™ãƒ«ãŒä¸ŠãŒã£ã¦ã„ãã®ã‚’è¦‹ã¦ã„ã‚‹ã¨ã€ç§‘å¦ã£ã¦åœ°é“ã ã‘ã©é¢ç™½ã„ãªãƒ¼ã¨æ€ã£ã¦ã—ã¾ã„ã¾ã™ã€‚

ã—ã‹ã—èªã‚“ã§ã„ã¦ä¸€ç‚¹æ°—ã«ãªã‚‹ã¨ã“ã‚ãŒã‚ã‚Šã¾ã—ãŸã€‚ ç™½å¤œãŸã¡ãŒå®‡å®™ã‹ã‚‰åœ°çƒã«å¸°é‚„ã—ãŸå¾Œã€3çµ„ã®ã‚«ãƒƒãƒ—ãƒ«ã‹ã‚‰çŸ³ç¥žæ‘ãŒèª•ç”Ÿã—ãŸã“ã¨ã§ã™ã€‚

ã‚‚ã¡ã‚ã‚“ãã‚Œãžã‚Œã®ã‚«ãƒƒãƒ—ãƒ«ãŒéžå¸¸ã«ãŸãã•ã‚“ã®åã©ã‚‚ã‚’ç”£ã‚ã°å¯èƒ½ã§ã—ã‚‡ã†ã€‚ã—ã‹ã—ç¾ä»£äººãŒ10äººã‚‚20äººã‚‚åã©ã‚‚ã‚’ç”£ã‚ã‚‹ã®ã‹ã¨ã„ã†ã¨å°‘ã—é›£ã—ã„ã‚ˆã†ãªæ°—ã‚‚ã—ã¾ã™ã€‚ ã¾ãŸã‚«ãƒƒãƒ—ãƒ«ãŒ3çµ„ã—ã‹ã‚ã‚Šã¾ã›ã‚“ã®ã§ã€åã©ã‚‚ãŒå°‘ãªã‘ã‚Œã°ã‚ã£ã¨è¨€ã†é–“ã«ã€Œå…¨å“¡ãŒè¦ªæˆšåŒå£«ã€ã¿ãŸã„ãªã“ã¨ã¨ãªã‚Šã€æ–°ãŸãªã‚«ãƒƒãƒ—ãƒ«ã‚’ä½œã‚Œãªããªã‚Šãã†ãªæ°—ã‚‚ã—ã¾ã™ã€‚ãã†è€ƒãˆã‚‹ã¨å®Ÿéš›ã«ã©ã‚Œã ã‘åŽ³ã—ã„æ¡ä»¶ã ã£ãŸã‚“ã ã‚ã†ã‹ã¨æ°—ã«ãªã£ã¦ã—ã¾ã„ã¾ã—ãŸã€‚

ã¨ã„ã†ã‚ã‘ã§ä»Šå›žã¯ç™½å¤œãŸã¡ãŒå°†æ¥çš„ã«é›†å›£ã‚’ç¹æ „ã•ã›ã‚‹ãŸã‚ã«ã€ã©ã®ç¨‹åº¦ã®åã©ã‚‚ã‚’ã‚‚ã†ã‘ã‚‹å¿…è¦ãŒã‚ã£ãŸã‹ã‚’è€ƒãˆã¦ã¿ãŸã„ã¨æ€ã„ã¾ã™ã€‚

è€ƒãˆæ–¹

ä¸Šè¨˜ã‚’è€ƒãˆã‚‹ã«ã‚ãŸã‚Šã€ä»¥ä¸‹ã®ã‚ˆã†ãªæ¡ä»¶ã§ã‚·ãƒŸãƒ¥ãƒ¬ãƒ¼ã‚·ãƒ§ãƒ³ã‚’å®Ÿæ–½ã—ã¾ã™ï¼š

ã‚¹ã‚¿ãƒ¼ãƒˆã¯ç”·æ€§3äººå¥³æ€§3äººã¨ã™ã‚‹ï¼ˆç¬¬ä¸€ä¸–ä»£ï¼‰
å„ä¸–ä»£ã«ãŠã„ã¦ç”·å¥³1äººãšã¤ã§ã‚«ãƒƒãƒ—ãƒ«ã¨ãªã‚‹
ç”·å¥³ã®æ•°ãŒç•°ãªã‚‹å ´åˆã€ä½™ã£ãŸäººã¯åã©ã‚‚ã‚’æ®‹ã•ãªã„
å„ã‚«ãƒƒãƒ—ãƒ«ã¯ãã‚Œãžã‚Œ np äººã®åã©ã‚‚ã‚’ç”£ã‚€
np ã¯ä¸–ä»£ã‚’ã¾ãŸãå…¨ã¦ã®ã‚«ãƒƒãƒ—ãƒ«ã§å…±é€šã¨ã™ã‚‹
ç”Ÿã¾ã‚Œã¦ãã‚‹åã©ã‚‚ã®æ€§åˆ¥ã¯ç”·å¥³æ¯” 1:1 ã§ãƒ©ãƒ³ãƒ€ãƒ ã«æ±ºã¾ã‚‹
ã‚«ãƒƒãƒ—ãƒ«ã¯ä¸€å¤«ä¸€å¦»åˆ¶ã‚’å–ã‚Šã€ãƒ‘ãƒ¼ãƒˆãƒŠãƒ¼ä»¥å¤–ã®ç•°æ€§ã¨ã®åã©ã‚‚ã¯ç”£ã¾ãªã„
ä¸–ä»£ã‚’ã¾ãŸãŒã£ã¦ã‚«ãƒƒãƒ—ãƒ«ã‚’å½¢æˆã—ãªã„

ã‚·ãƒŸãƒ¥ãƒ¬ãƒ¼ã‚·ãƒ§ãƒ³ã—ã‚„ã™ã„ã‚ˆã†åŽ³ã—ã‚ã®æ¡ä»¶ã¨ã—ã¦ã„ã¾ã™ã€‚ãŸã ã—ã“ã®ã¾ã¾ã§ã¯è¿‘ç¸è€…ã¨ã®ã‚«ãƒƒãƒ—ãƒ«ãŒå‡ºæ¥ã¦ã—ã¾ã„ã¾ã™ã®ã§ã€ä»¥ä¸‹ã®æ¡ä»¶ã‚’è¿½åŠ ã—ã¾ã™ï¼š

åã©ã‚‚ã®è¿‘äº¤ä¿‚æ•°ãŒä¸€å®šã®å€¤ä»¥ä¸Šã¨ãªã‚‹ã‚«ãƒƒãƒ—ãƒ«ã¯å½¢æˆã—ãªã„

ã“ã“ã§è¿‘äº¤ä¿‚æ•°ã¨ã¯é›†å›£éºä¼å¦ãªã©ã§ä½¿ã‚ã‚Œã‚‹ç”¨èªžã§ã€è¿‘è¦ªäº¤é…ã®ç¨‹åº¦ã‚’è¡¨ã—ã¾ã™ã€‚æ—¥æœ¬ã§ã¯ã„ã¨ã“åŒå£«ã§ã®çµå©šãŒæ³•å¾‹ä¸Šèªã‚ã‚‰ã‚Œã¦ã„ã¾ã™ãŒã€ã„ã¨ã“åŒå£«ã®åã©ã‚‚ã®è¿‘äº¤ä¿‚æ•°ãŒ6.25%ã¨ãªã‚Šã¾ã™ã€‚ç¬¬ä¸€ä¸–ä»£ã®æ•°ãŒå°‘ãªã„ãŸã‚ã€ã“ã“ã‚’åŽ³ã—ãã™ã‚‹ã¨ã‚ã£ã¨è¨€ã†é–“ã«ã‚«ãƒƒãƒ—ãƒ«ãŒå‡ºæ¥ãªããªã‚‹ã“ã¨ãŒäºˆæƒ³ã•ã‚Œã¾ã™ã€‚

ä¸Šè¨˜ã®ã‚·ãƒŸãƒ¥ãƒ¬ãƒ¼ã‚·ãƒ§ãƒ³ã‚’å®Ÿè¡Œã™ã‚‹ãŸã‚ã®ãƒ—ãƒã‚°ãƒ©ãƒ ã¯ä»¥ä¸‹ã¨ã—ã¾ã—ãŸï¼š

generate_population <- function(np, # ã‚«ãƒƒãƒ—ãƒ«ãŒç”£ã‚€åã©ã‚‚ã®æ•°
                                n0 = 6, # ç¬¬ä¸€ä¸–ä»£ã®äººæ•°
                                num_column = 6, # çµæžœæ ¼ç´ç”¨ã®ãƒ†ãƒ¼ãƒ–ãƒ«ã®åˆ—æ•°
                                G = 5, # ã‚·ãƒŸãƒ¥ãƒ¬ãƒ¼ãƒˆã™ã‚‹ä¸–ä»£æ•°
                                random_seed = 42, # ä¹±æ•°å›ºå®šç”¨
                                rel_lim = 0.90 # è¡€ç¸ä¿‚æ•°ï¼ˆè¿‘äº¤ä¿‚æ•°ã¨ã¯ç•°ãªã‚‹ï¼‰
                                ) {

   
   set.seed(random_seed) # åã©ã‚‚æ€§åˆ¥ã‚’æ±ºã‚ã‚‹ã®ã«ä¹±æ•°ã‚’ä½¿ã†ãŸã‚
   pairs <- c() # ã‚«ãƒƒãƒ—ãƒ«ã‚’è¨˜éŒ²ã™ã‚‹ç”¨ã®ãƒ†ãƒ¼ãƒ–ãƒ«
  
   ### å€‹äººã”ã¨ã®è¨˜éŒ²ï¼ˆIDã€ä¸–ä»£ã€æ€§åˆ¥ã€è¿‘äº¤ä¿‚æ•°ã€çˆ¶ã€æ¯ï¼‰ã‚’æ ¼ç´ã™ã‚‹ãƒ†ãƒ¼ãƒ–ãƒ«
   res_mat <- matrix(0, n0, num_column)
   colnames(res_mat) <- c("ID", "Gen", "Sex", "Inbred", "Father", "Mother")
  
   ### ç¬¬ä¸€ä¸–ä»£ã®ç”Ÿæˆ 
   res_mat[, "ID"] <- 1:n0
   res_mat[, "Gen"] <- 1
   res_mat[, "Sex"] <- rep(c(1, 0), 3)
   
   ### ä»¥ä¸‹ã€å°†æ¥ä¸–ä»£ã‚’ç”Ÿæˆ
   for(g in 1:G) {
      
      ### ç¾åœ¨ä¸–ä»£ã®è¡€ç¸é–¢ä¿‚ã‚’è©•ä¾¡ã™ã‚‹
      rel_mat <- create_rel_mat(res_mat)

      ### ã‚«ãƒƒãƒ—ãƒ«ã‚’ä½œã‚‹ãƒšã‚¢ã‚’æ±ºã‚ã‚‹
      tmp_pairs <- make_pairs(g, res_mat, rel_mat, rel_lim)
      pairs <- rbind(pairs, tmp_pairs)
      
      ### npäººã®åã©ã‚‚ã‚’ç”Ÿæˆã™ã‚‹
      tmp_res_mat <- generate_progenies(tmp_pairs, res_mat, g, np, num_column)
      
      ### ãã‚Œãžã‚Œã®è¿‘äº¤ä¿‚æ•°ã‚’è¨ˆç®—ã™ã‚‹ï¼ˆè¿‘äº¤ä¿‚æ•°ã¯ä¸¡è¦ªé–“ã®è¡€ç¸ä¿‚æ•°*1/2ï¼‰
      tmp_res_mat <- calculate_inbred_coef(tmp_res_mat, rel_mat)
      res_mat <- rbind(res_mat, tmp_res_mat)
      
      # sprintf("The %d generation generated", g+1)
      print(g)
   }

   return(res_mat)
}

ãŠè©¦ã—

ã•ã¦ã€é–¢æ•°ã®è§£èª¬ã¯å¾Œå›žã—ã«ã—ã¦ã¾ãšã¯å®Ÿè¡Œã—ã¦ã¿ã¾ã—ã‚‡ã†ã€‚ã“ã®ãƒ—ãƒã‚°ãƒ©ãƒ ã‚’å®Ÿè¡Œã™ã‚‹ã¨ä»¥ä¸‹ã®ã‚ˆã†ãªçµæžœãŒå¾—ã‚‰ã‚Œã¾ã™ã€‚

source("/YourDirectory/my_functions.r") # é–¢æ•°ã‚’å®šç¾©ã—ãŸãƒ•ã‚¡ã‚¤ãƒ«
res_mat <- generate_population(np = 3, G = 15)

> calc_num_pop(res_mat)
   Gen Population
1    1          6
2    2          9
3    3          6
4    4          9
5    5          9
6    6         12
7    7         15
8    8         18
9    9         24
10  10         33
11  11         30
12  12         39
13  13         54
14  14         60
15  15         60
16  16         87

plot(calc_num_pop(res_mat), type = "l", xlab = "Generation g", 
     ylab = "Population size")

f:id:ushi-goroshi:20210820133619p:plain

ã“ã®è¡¨ã¨ã‚°ãƒ©ãƒ•ã¯å…ˆã®æ¡ä»¶ã§ã‚·ãƒŸãƒ¥ãƒ¬ãƒ¼ã‚·ãƒ§ãƒ³ã‚’å®Ÿæ–½ã—ãŸã¨ãã®ä¸–ä»£ã”ã¨ã®äººæ•°ã‚’é›†è¨ˆã—ã¦ã„ã¾ã™ã€‚

ç¬¬äº”ä¸–ä»£ã¾ã§ã¯ãªã‹ãªã‹äººæ•°ãŒå¢—ãˆã¦ã„ãã¾ã›ã‚“ãŒã€ç¬¬å…ä¸–ä»£ã‹ã‚‰å¾ã€…ã«äººæ•°ã‚’å¢—ã‚„ã›ã¦ã„ã¾ã™ãã€‚ã‚«ãƒƒãƒ—ãƒ«ã”ã¨ã®åã©ã‚‚ã®æ•°ãŒ3äººã¨ã„ã†ã®ã¯å°‘ã—å¤šã„ã‚ˆã†ã«ã‚‚æ€ãˆã¾ã™ãŒã€æ˜å’Œ24å¹´ã”ã‚ã®ç¬¬ä¸€æ¬¡ãƒ™ãƒ“ãƒ¼ãƒ–ãƒ¼ãƒ ã®åˆè¨ˆç‰¹æ®Šå‡ºç”ŸçŽ‡ãŒ4.32ã¨ã„ã†ã“ã¨ã‚‰ã—ã„ã®ã§*1ã€ã‚ã‚Šå¾—ãªã„æ•°å€¤ã§ã¯ãªã„ã§ã—ã‚‡ã†ã€‚ã‚€ã—ã‚æ»äº¡ã‚’ä¸€åˆ‡è€ƒæ…®ã—ã¦ã„ãªã„ã‚·ãƒŸãƒ¥ãƒ¬ãƒ¼ã‚·ãƒ§ãƒ³ãªã®ã§ã€ã‚‚ã£ã¨ç”£ã‚“ã§ã„ãªã„ã¨3äººã§ã‚‚æ€ªã—ããªã‚Šãã†ã§ã™ã€‚ã¨ã¯ã„ãˆã€ã“ã‚Œãªã‚‰çŸ³ç¥žæ‘ã‚‚å•é¡Œãªãèª•ç”Ÿã™ã‚‹ã§ã—ã‚‡ã†ã€ã‚ã§ãŸã—ã‚ã§ãŸã—â€¦

â€¦ã¨ã€è¨€ã„ãŸã„ã¨ã“ã‚ã§ã™ãŒã€çµè«–ã¥ã‘ã‚‹å‰ã«è¿‘äº¤ä¿‚æ•°ã‚’è¦‹ã¦ã¿ã¾ã—ã‚‡ã†ã€‚

> summary(res_mat[, "Inbred"])
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
 0.0000  0.2956  0.3209  0.3051  0.3377  0.4053

ãªã‚“ã¨è¿‘äº¤ä¿‚æ•°ãŒå¹³å‡ã§30%ã€æœ€å¤§ã§40%ã«ã‚‚ãªã£ã¦ã—ã¾ã£ã¦ã„ã¾ã™ã€‚è¿‘äº¤ä¿‚æ•°25%ã¯è¦ªåé–“ã§ã®ã‚«ãƒƒãƒ—ãƒ«ã¨ã„ã†ãƒ¬ãƒ™ãƒ«ãªã®ã§ã€ã“ã‚Œã¯å›°ã£ã¦ã—ã¾ã„ã¾ã™ã€‚

ã‚·ãƒŸãƒ¥ãƒ¬ãƒ¼ã‚·ãƒ§ãƒ³

ã¨ã„ã†ã‚ã‘ã§ã“ã“ã‹ã‚‰ãŒæœ¬é¡Œã§ã™ã€‚ã‚·ãƒŸãƒ¥ãƒ¬ãƒ¼ã‚·ãƒ§ãƒ³ã§ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã¨ã—ã¦æ¸¡ã—ã¦ã„ã‚‹ rel_lim ã‚’å¤‰æ›´ã™ã‚‹ã“ã¨ã§ã€è¿‘äº¤ãŒé«˜ã¾ã‚‹ã®ã‚’é¿ã‘ãªãŒã‚‰é›†å›£ã‚’ç¹æ „ã•ã›ã€ç„¡äº‹ã«çŸ³ç¥žæ‘ã‚’èª•ç”Ÿã•ã›ã‚‹ã“ã¨ãŒã§ãã‚‹ã‹è¦‹ã¦ã¿ã¾ã—ã‚‡ã†ã€‚

ã¾ãšã¯æ—¥æœ¬ã®æ³•å¾‹ã§èªã‚ã‚‰ã‚Œã¦ã„ã‚‹ã„ã¨ã“åŒå£«ã¾ã§è¨±å®¹ã™ã‚‹ï¼ˆè¿‘äº¤ä¿‚æ•°6.25%ã€ã™ãªã‚ã¡ä¸¡è¦ªé–“ã®è¡€ç¸ä¿‚æ•°12.5%ã®ã‚«ãƒƒãƒ—ãƒ«ã¾ã§èªã‚ã‚‹ï¼‰ã¨ã©ã†ãªã‚‹ã§ã—ã‚‡ã†ã‹ã€‚

> res_mat <- generate_population(np = 3, G = 15, rel_lim = 0.125)
[1] 1
[1] 2
[1] 3
 make_pairs(g, res_mat, rel_mat, rel_lim) ã§ã‚¨ãƒ©ãƒ¼: 
   Couldn't make any couple!

ãªã‚“ã¨ã€é€”ä¸ã§ã‚«ãƒƒãƒ—ãƒ«ã‚’ä½œã‚‹ã“ã¨ãŒã§ããªããªã£ã¦ã—ã¾ã„ã¾ã™â€¦ã€‚ã‚‚ã—ã‹ã—ã¦ seed ã«ã‚ˆã‚‹ã®ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ã®ã§ã€ã„ãã¤ã‹è©¦ã—ã¦ã¿ã¾ã—ã‚‡ã†ã€‚

> generate_population(np = 3, G = 15, rel_lim = 0.125, random_seed = 1)
[1] 1
[1] 2
[1] 3
 make_pairs(g, res_mat, rel_mat, rel_lim) ã§ã‚¨ãƒ©ãƒ¼: 
   Couldn't make any couple!

> generate_population(np = 3, G = 15, rel_lim = 0.125, random_seed = 2)
[1] 1
[1] 2
[1] 3
 make_pairs(g, res_mat, rel_mat, rel_lim) ã§ã‚¨ãƒ©ãƒ¼: 
   Couldn't make any couple!

> generate_population(np = 3, G = 15, rel_lim = 0.125, random_seed = 3)
[1] 1
[1] 2
[1] 3
 make_pairs(g, res_mat, rel_mat, rel_lim) ã§ã‚¨ãƒ©ãƒ¼: 
   Couldn't make any couple!

ãƒ€ãƒ¡ãªã‚ˆã†ã§ã™â€¦ã€‚

ã¡ãªã¿ã«ã§ã™ãŒã€è¿‘äº¤ã®åˆ¶é™ã‚’ãªãã—ã¦ã‚‚ï¼ˆåŒä¸–ä»£å†…ã®ã©ã‚“ãªè¿‘ç¸è€…ã¨ã®ã‚«ãƒƒãƒ—ãƒ«ã‚‚èªã‚ã¦ã‚‚ï¼‰ç”·å¥³ã®åã‚Šã«ã‚ˆã£ã¦é›†å›£ãŒå˜ç¶šã—ãªã„ã“ã¨ã‚‚ã‚ã‚Šã¾ã™ã€‚ä¾‹ãˆã°ä»¥ä¸‹ã®ã‚ˆã†ã«ã€ rel_lim ã‚’1ã¨ã—ã¦ã‚‚ seed ã«ã‚ˆã£ã¦ã¯é€”ä¸ã§æ¢ã¾ã£ã¦ã—ã¾ã„ã¾ã™ã€‚

> res_mat <- generate_population(np = 3, G = 15, rel_lim = 1.0, random_seed = 5)
[1] 1
[1] 2
[1] 3
[1] 4
[1] 5
 make_pairs(g, res_mat, rel_mat, rel_lim) ã§ã‚¨ãƒ©ãƒ¼: 
   Couldn't make any couple!

ç™½å¤œãŸã¡ã¯ã‚‚ã¨ã‚‚ã¨åŽ³ã—ã„æ¡ä»¶ã«ç½®ã‹ã‚Œã¦ã„ãŸã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ãã€‚

ãã‚Œã§ã¯é€†ã«ã€è¿‘äº¤ä¿‚æ•°ã®æ¡ä»¶ã‚’ä¿ã£ãŸå ´åˆã«å¿…è¦ã¨ãªã‚‹ np ã‚’è€ƒãˆã¦ã¿ã¾ã—ã‚‡ã†ã€‚4äººã‹ã‚‰é †ç•ªã«å¢—ã‚„ã—ã¦ã¿ã¾ã™ï¼š

> res_mat <- generate_population(np = 4, G =15, rel_lim = 0.125)
[1] 1
[1] 2
[1] 3
 make_pairs(g, res_mat, rel_mat, rel_lim) ã§ã‚¨ãƒ©ãƒ¼: 
   Couldn't make any couple!

ã€œã€œ ä»¥ä¸‹çœç•¥ ã€œã€œ

> res_mat <- generate_population(np = 8, G =15, rel_lim = 0.125)
[1] 1
[1] 2
[1] 3
 make_pairs(g, res_mat, rel_mat, rel_lim) ã§ã‚¨ãƒ©ãƒ¼: 
   Couldn't make any couple!

9äººã¾ã§å¢—ã‚„ã™ã¨è¨ˆç®—ãŒãªã‹ãªã‹çµ‚ã‚ã‚‰ãªã‹ã£ãŸãŸã‚æ‰“ã¡åˆ‡ã£ã¦ã—ã¾ã„ã¾ã—ãŸãŒã€ã“ã®æ¡ä»¶ï¼ˆæ—¥æœ¬ã®æ³•å¾‹ã«åˆã‚ã›ãŸã‚«ãƒƒãƒ—ãƒ«ï¼‰ã¯ã‹ãªã‚ŠåŽ³ã—ã„ã‚ˆã†ã§ã™ã€‚ãã‚‚ãã‚‚åã©ã‚‚ã‚’9äººç”£ã‚€ã¨ã„ã†ã®ã‚‚çµæ§‹é›£ã—ãã†ã§ã™ã—ãã€‚

è¿‘äº¤ä¿‚æ•°ã®æ¡ä»¶ã‚’ã‚‚ã†å°‘ã—ç·©ã‚ã€12.5%ã¾ã§èªã‚ã‚‹ã“ã¨ã«ã—ã¦ã¿ã¾ã—ã‚‡ã†ã€‚ã¡ãªã¿ã«ã“ã®12.5%ã¨ã„ã†ã®ã¯ãŠã˜ãƒ»å§ªã€ãŠã°ãƒ»ç”¥ã§ã®ã‚«ãƒƒãƒ—ãƒ«ã«ç›¸å½“ã—ã¾ã™ã€‚

> res_mat <- generate_population(np = 4, G = 15, rel_lim = 0.250)
[1] 1
[1] 2
[1] 3
[1] 4
[1] 5
 make_pairs(g, res_mat, rel_mat, rel_lim) ã§ã‚¨ãƒ©ãƒ¼: 
   Couldn't make any couple!

4äººã§ã¯ãƒ€ãƒ¡ã€‚5äººã§ã¯ï¼Ÿ

> res_mat <- generate_population(np = 5, G = 15, rel_lim = 0.25)
[1] 1
[1] 2
[1] 3
[1] 4
[1] 5
[1] 6
[1] 7

ä»Šåº¦ã¯è¨ˆç®—ãŒçµ‚ã‚ã‚Šã¾ã›ã‚“ã§ã—ãŸâ€¦ã€‚ä¸€æ™©å¾…ã£ãŸã®ã§ã™ãŒâ€¦ã€‚

ã—ã‹ã—ç¬¬å…«ä¸–ä»£ã¾ã§é€²ã‚€ã“ã¨ã¯ç¢ºèªã—ãŸã®ã§ã€ã“ã‚Œãªã‚‰å¯èƒ½æ€§ãŒã‚ã‚Šãã†ã§ã™ã€‚ã¤ã¾ã‚Šã€

å…¨ã¦ã®ã‚«ãƒƒãƒ—ãƒ«ãŒ5äººã®åã©ã‚‚ã‚’ç”£ã¿ç¶šã‘ã‚‹
å¤šå°‘ã®è¿‘äº¤ã‚’è¨±å®¹ã™ã‚‹ï¼ˆè¿‘ç¸ã®äººé–“ã¨ã‚‚ã‚«ãƒƒãƒ—ãƒ«ã‚’å½¢æˆã™ã‚‹ï¼‰

ã“ã¨ã§çŸ³ç¥žæ‘ã‚’ç„¡äº‹ã«èª•ç”Ÿã•ã›ã‚‹ã“ã¨ãŒã§ããã†ã§ã™ã€‚ã‚„ã£ãŸãç™½å¤œï¼ *2

ã“ã®ã¨ãã®è¿‘äº¤ä¿‚æ•°ãŒã©ã†ãªã£ã¦ã„ã‚‹ã‹ã‚‚ç¢ºèªã—ã¦ãŠãã¾ã—ã‚‡ã†ã€‚

### ç¬¬ä¸ƒä¸–ä»£ã¾ã§ã§æ¢ã‚ã‚‹
res_mat <- generate_population(np = 5, G = 7, rel_lim = 0.25)

> calc_inb(res_mat)
  Gen Inbred_Coef
1   1   0.0000000
2   2   0.0000000
3   3   0.0000000
4   4   0.0625000
5   5   0.0937500
6   6   0.1132812
7   7   0.1250000
8   8   0.1191406

è¿‘äº¤ä¿‚æ•°ã®å¹³å‡ã¯ç¬¬ä¸ƒä¸–ä»£ã§12.5%ã¨ä¸Šé™ã«é”ã—ã¦ã„ã¾ã™ãŒã€ç¬¬å…«ä¸–ä»£ã§ã¯ã‚ãšã‹ã«æ¸›å°‘ã—ã¦ã„ã¾ã™ã€‚

> calc_num_pop(res_mat)
  Gen Population
1   1          6
2   2         15
3   3         25
4   4         50
5   5        115
6   6        245
7   7        505
8   8       1195

ã¾ãŸã€ä¸–ä»£ã”ã¨ã®äººæ•°ã‚’è¦‹ã‚‹ã¨ç¬¬å…«ä¸–ä»£ã§å¤§å¹…ã«å¢—ãˆã¦ã„ã‚‹ã®ã§ã€ã“ã‚Œä»¥é™ã¯è¿‘äº¤ã‚’é«˜ã‚ã‚‹ã“ã¨ã®ãªã„ã‚«ãƒƒãƒ—ãƒ«ã‚’å®‰å®šã—ã¦ä½œã‚Œã‚‹ã“ã¨ãŒæœŸå¾…ã§ãã¾ã™ã€‚

ã‚‚ã†å°‘ã—ãƒ—ãƒã‚°ãƒ©ãƒ ã‚’ã†ã¾ãã‹ã‘ã‚Œã°ã“ã®è¾ºã‚Šã‚’è¿½ãˆã‚‹ã‹ã‚‚ã—ã‚Œãªã„ã®ã§ã™ãŒã€å®Ÿè£…åŠ›ã®ç„¡ã•ãŒæ¨ã‚ã—ã„â€¦ã€‚

çµ‚ã‚ã‚Šã«

ã¨ã„ã†ã‚ã‘ã§ã€åœ°çƒã«é™ã‚Šç«‹ã£ãŸ6äººã‚’å§‹ç¥–ã¨ã—ã¦é›†å›£ã‚’ç¹æ „ã•ã›ã‚‹ã“ã¨ãŒæœ¬å½“ã«ã§ãã‚‹ã®ã‹ã‚’æ¤œè¨¼ã—ã¦ã¿ãŸã‚ã‘ã§ã™ãŒã€çµæžœã¨ã—ã¦ã¯ã€ŒåŽ³ã—ã„æ¡ä»¶ãªãŒã‚‰ã‚‚ä¸å¯èƒ½ã§ã¯ãªã•ãã†ã€ã¨ã„ã†ã“ã¨ãŒè¦‹ãˆã¦ãã¾ã—ãŸã€‚

æ¬¡å›žã¯ã“ã®æ¤œè¨¼ã«ç”¨ã„ãŸé–¢æ•°ã®å…·ä½“çš„ãªè§£èª¬ã‚’ã—ãŸã„ã¨æ€ã„ã¾ã™ã€‚

*1:https://www8.cao.go.jp/shoushi/shoushika/meeting/taikou_4th/k_1/pdf/ref1.pdf

*2:æ¼«ç”»ã§ã¯ç™½å¤œä»¥å¤–ã®ãƒ¡ãƒ³ãƒãƒ¼ãŒå‰²ã¨ã™ãã«äº¡ããªã£ã¦ã„ã‚‹æ§˜åãªã®ã§ã€å®Ÿéš›ã«ã¯5äººã¨ã„ã†ã®ã‚‚é›£ã—ã„ã§ã—ã‚‡ã†ã‘ã©

2021-04-21

glmnetã‚’ã‚‚ã†å°‘ã—ç†è§£ã—ãŸã„â‘¤

R glmnet å¤‰æ•°é¸æŠž

ãã‚Œã§ã¯å‰å›žã®è¨˜äº‹ã«ç¶šã„ã¦elnet1ã®ç´¹ä»‹ã§ã™ã€‚å‰å›žã®è¨˜äº‹ã¯ã“ã¡ã‚‰ã§ã™ã€‚

ushi-goroshi.hatenablog.com

ãƒ«ãƒ¼ãƒ—â‘¢ï¼ˆå›žå¸°ä¿‚æ•°ã®æŽ¨å®šï¼‰

ä»¥ä¸Šã¾ã§ã§è¦‹ã¦ããŸé€šã‚Šã€ãƒ«ãƒ¼ãƒ—â‘ ãƒ»â‘¡ã§ã¯ almã™ãªã‚ã¡lambdaã‚’æ›´æ–°ã—ã¤ã¤ã€alphaï¼ˆalfï¼‰ã‚„penalty.factorï¼ˆvpï¼‰ã¨ã®ä¹—ç®—ã«ã‚ˆã£ã¦ç½°å‰‡ã‚’è¨ˆç®—ã—ã¦ã„ã¾ã—ãŸã€‚ ãƒ«ãƒ¼ãƒ—â‘¢ã§ã¯ãã®ç½°å‰‡ã‚’ç”¨ã„ã¦å›žå¸°ä¿‚æ•°ã‚’æ›´æ–°ã—ã¾ã™ã€‚ ãªã®ã§ã“ã®ãƒ«ãƒ¼ãƒ—ãŒglmnetã«ãŠã„ã¦ãƒ¡ã‚¤ãƒ³ã¨ãªã‚‹å‡¦ç†ã¨è¨€ã£ã¦è‰¯ã„ã¨æ€ã„ã¾ã™ã€‚

ãƒ«ãƒ¼ãƒ—â‘¢ã¯niã«å¯¾ã™ã‚‹ãƒ«ãƒ¼ãƒ—ã§ã™ã€‚ã“ã“ã§niã¯èª¬æ˜Žå¤‰æ•°ã®æ•°ã§ã™ãã€‚k ã‚’ã‚¤ãƒ³ãƒ‡ãƒƒã‚¯ã‚¹ã¨ã—ã¦å„èª¬æ˜Žå¤‰æ•°ã‚’ã•ã‚‰ã£ã¦ã„ãã¾ã™ã€‚

ã¾ãšjuã§ã™ãŒã€ã“ã‚Œã¯å„èª¬æ˜Žå¤‰æ•°åˆ—ã«ãŠã‘ã‚‹æ•°å€¤ã®ãƒãƒ©ã¤ãã®æœ‰ç„¡ã‚’ç¤ºã™ 1/0 ã®ãƒ™ã‚¯ãƒˆãƒ«ã§ã—ãŸã€‚ãƒãƒ©ã¤ããŒãªã„ã€ã™ãªã‚ã¡å…¨ã¦ã®æ•°å€¤ãŒåŒã˜ã§ã‚ã‚Œã°ï¼ˆju(k) == 0 ï¼‰ãƒ«ãƒ¼ãƒ—â‘¢ã‚’ã‚¹ã‚ãƒƒãƒ—ã—ã¾ã™ï¼ˆgotoã®å‘ã‹ã†å…ˆãŒ10371ã§ã€ãƒ«ãƒ¼ãƒ—ã®ç¯„å›²ã‚‚åŒã˜ã10371ã¨ãªã£ã¦ã„ã¾ã™ï¼‰ã€‚

do 10371 k=1,ni
if(ju(k).eq.0) goto 10371

æ¬¡ã«aã‹ã‚‰ k ç•ªç›®ã®å¤‰æ•°ã®å€¤ã‚’akã«æ ¼ç´ã—ã¾ã™ã€‚å‰å›žè¨˜äº‹ã§è¿½ã„ã‹ã‘ãŸé€šã‚Šã€ã“ã®aï¼ˆã¾ãŸã¯aoï¼‰ãŒæœ€çµ‚çš„ã«ã¯å›žå¸°ä¿‚æ•°ã¨ã—ã¦è¿”ã‚Šã¾ã™ã€‚

å‰å‡¦ç†ã«ãŠã„ã¦a = 0.0ã§åˆæœŸåŒ–ã•ã‚Œã¦ã„ã‚‹ã®ã§ãƒ«ãƒ¼ãƒ—ã® 1 å‘¨ç›®æ™‚ç‚¹ã§ã¯akã‚‚ 0 ã§ã™ãŒã€ãƒ«ãƒ¼ãƒ—â‘ ã® 2 å‘¨ç›®ä»¥é™ã¯ç¸®å°ã•ã‚ŒãŸå›žå¸°ä¿‚æ•°ãŒå…¥ã£ã¦ã„ã¾ã™ã€‚

ak=a(k) ! k ç•ªç›®ã®å¤‰æ•°ã® a ã®å€¤ã‚’ ak ã«ä»£å…¥ã€‚

ç¶šã„ã¦uã¨vã‚’è¨ˆç®—ã—ã¾ã™ã€‚ã“ã‚Œã‚‰ã¯å‰å›žã®è¨˜äº‹ã§å°‘ã—ç´¹ä»‹ã—ãŸé€šã‚Šã€æ¬¡ã®ãƒ–ãƒãƒƒã‚¯ã§å›žå¸°ä¿‚æ•°aã‚’æ›´æ–°ã™ã‚‹ãŸã‚ã®ã‚‚ã®ã§ã™ã€‚

uã¯g(k)ã«ak*xv(k)ã‚’åŠ ç®—ã—ã¦è¨ˆç®—ã—ã¾ã™ã€‚ã“ã“ã§g(k)ã¯standerdã«ãŠã„ã¦g(j)=dot_product(y,x(:,j))ã€ã¤ã¾ã‚Šyã¨xã®å†…ç©ã¨ã—ã¦å®šç¾©ã•ã‚ŒãŸã‚‚ã®ã§ã—ãŸï¼ˆyã¨xã¯ãã‚Œãžã‚Œæ¨™æº–åŒ–ã•ã‚Œã¦ã„ã¾ã™ï¼‰ã€‚ã‚‚ã—ã‚‚ç½°å‰‡ãŒä»˜ã„ã¦ã„ãªã‘ã‚Œã°ã“ã®å…±åˆ†æ•£ãŒ OLS ã«ã‚ˆã‚‹å›žå¸°ä¿‚æ•°ã¨ãªã‚‹ã¯ãšã§ã™ï¼ˆæ¨™æº–åŒ–ã•ã‚Œã¦ã„ã‚‹ã®ã§xã®æ¨™æº–åå·®ã¯ 1ï¼‰ã€‚

ã“ã®gã«xvã§é‡ã¿ã‚’ã¤ã‘ãŸakã‚’åŠ ç®—ã—ã¾ã™ã€‚ã“ã“ã§xvã¯ weight ã‚’ä¹—ã˜ãŸxã®äºŒä¹—å’Œã§ã™ã€‚ã—ã‹ã—ãƒ«ãƒ¼ãƒ—ã® 1 å‘¨ç›®ã§ã¯ak=0ã§ã‚ã‚‹ãŸã‚gãŒãã®ã¾ã¾åˆ©ç”¨ã•ã‚Œã‚‹ã“ã¨ã«ãªã‚Šã¾ã™ã€‚

ã“ã®ã‚ˆã†ã«ã—ã¦å®šç¾©ã•ã‚ŒãŸuã®çµ¶å¯¾å€¤ã‹ã‚‰ç½°å‰‡ã‚’æ¸›ã˜ãŸã‚‚ã®ãŒvã¨ãªã‚Šã¾ã™ã€‚

u=g(k)+ak*xv(k)
v=abs(u)-vp(k)*ab

ãã—ã¦ã•ã‚‰ã«vãŒ 0 ã‚ˆã‚Šã‚‚å¤§ãã„å ´åˆï¼ˆOLS ã«ã‚ˆã‚‹å›žå¸°ä¿‚æ•°ãŒç½°å‰‡ã‚ˆã‚Šã‚‚å¤§ãã„å ´åˆï¼‰ã€

ã€Œcl(2,k)ã€ã¨ã€Œsign(v,u)/(xv(k)+vp(k)*dem)ã€ã‚’æ¯”è¼ƒã—ã¦å°ã•ã„æ–¹ã‚’é¸ã¶
ãã‚Œã‚’ã€Œcl(1,k)ã€ã¨æ¯”è¼ƒã—ã¦å¤§ãã„æ–¹ã‚’é¸ã¶

ã¨ã„ã†å‡¦ç†ã‚’è¡Œã„ã€æ–°ãŸã«aã¨ã—ã¦æ ¼ç´ã—ã¾ã™ã€‚ ã“ã“ã§clã¯glmnet.rã§cl = rbind(lower.limits, upper.limits) ã¨ã—ã¦å®šç¾©ã•ã‚ŒãŸã‚‚ã®ãªã®ã§ã€æŽ¨å®šã•ã‚ŒãŸå€¤ã‚’ä¸Šé™ã¨ä¸‹é™ã®é–“ã«æŠ‘ãˆã‚ˆã†ã¨ã—ã¦ã„ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ã€‚ã¾ãŸvãŒ 0 ä»¥ä¸‹ã®å ´åˆã¯ 0 ã¨ãªã‚Šã¾ã™ã€‚

! a(k) ã‚’æ›´æ–°
a(k)=0.0
if(v.gt.0.0) a(k)=max(cl(1,k),min(cl(2,k),sign(v,u)/(xv(k)+vp(k)*dem)))

ä»¥ä¸ŠãŒå›žå¸°ä¿‚æ•°ã®æ›´æ–°ã‚’è¡Œã†å‡¦ç†ã«ãªã‚Šã¾ã™ã€‚ ã‚„ã‚„ã‚¢ãƒƒã‚µãƒªã—ã¦ã„ã¾ã™ãŒã€ã“ã“ã®å‡¦ç†ã¯ glmnet ã‚’ç†è§£ã™ã‚‹ä¸Šã§æ¥µã‚ã¦é‡è¦ãªã®ã§ã‚‚ã†å°‘ã—èª¬æ˜Žã—ã¾ã™ã€‚

ã¾ãšå‰æã¨ã—ã¦ã€ï¼ˆElastic Net ã§ã¯ãªãï¼‰Lasso ã§ã¯è»Ÿé–¾å€¤ä½œç”¨ç´ ã¨å‘¼ã°ã‚Œã‚‹å†™åƒã‚’ç”¨ã„ã¦è§£ã‚’æŽ¨å®šã—ã¦ã„ã¾ã™ã€‚ ã“ã“ã§è»Ÿé–¾å€¤ä½œç”¨ç´ ã¨ã¯ã€å®šæ•° $a$ ãŠã‚ˆã³ $\lambda (> 0)$ ã«ãŠã„ã¦ $a$ ã®çµ¶å¯¾å€¤ãŒ $\lambda$ ã‚ˆã‚Šã‚‚å¤§ãã‘ã‚Œã° $a-\lambda$ ã‚’ã€ãã†ã§ãªã‘ã‚Œã° 0 ã‚’è¿”ã™ä½œç”¨ç´ ã§ã™ï¼š

$S(a, \lambda) = \begin{cases} a - \lambda & (a > \lambda) \\ 0 & (|a| \le \lambda) \\ a + \lambda & (a < -\lambda) \end{cases}$

ã™ãªã‚ã¡ã€æŽ¨å®šã•ã‚ŒãŸå›žå¸°ä¿‚æ•°ï¼ˆã®çµ¶å¯¾å€¤ï¼‰ãŒç½°å‰‡ã‚ˆã‚Šã‚‚å°ã•ã‘ã‚Œã° 0 ã«ä¸¸ã‚ã¦ã—ã¾ã„ã€å¤§ããã¦ã‚‚ç½°å‰‡ã®åˆ†ã ã‘ä¿‚æ•°ã‚’ç¸®å°ã—ã¦ã—ã¾ã†ã€ã¨ã„ã†ã“ã¨ã§ã™ã€‚ ä¸€èˆ¬ã« Lasso ã¯åŠ¹æžœã®å°ã•ãªå¤‰æ•°ã®å›žå¸°ä¿‚æ•°ã‚’ 0 ã«ç¸®å°ã™ã‚‹æ–¹æ³•ã¨ã—ã¦çŸ¥ã‚‰ã‚Œã¦ã„ã¾ã™ãŒã€å®Ÿè£…ã¨ã—ã¦ã¯ã“ã®ã‚ˆã†ãªè»Ÿé–¾å€¤ä½œç”¨ç´ ãŒç”¨ã„ã‚‰ã‚Œã¦ãŠã‚Šã€ã“ã‚Œã‚’è¦‹ã‚‹ã¨ã€ŒLasso ã¯ã‚¹ãƒ‘ãƒ¼ã‚¹ãªè§£ã‚’æŽ¨å®šã§ãã‚‹ã€ã¨ã„ã†è¨€è‘‰ã®æ„å‘³ãŒã‚ã‹ã‚‹ã®ã§ã¯ãªã„ã§ã—ã‚‡ã†ã‹ã€‚æŽ¨å®šã—ãŸã‚‰ 0 ã«ãªã‚‹ã‚ã‘ã§ã¯ãªãã€æ˜Žç¤ºçš„ã« 0 ã«ã—ã¦ã„ã‚‹ã®ã ã¨ã€‚

ã“ã“ã§å°‘ã—ä½™è«‡ãªã®ã§ã™ãŒã€Lasso ã‚„ Ridge ã«é–¢ã™ã‚‹å‚è€ƒæ›¸ãªã©ã‚’èªã‚“ã§ã„ã‚‹ã¨ã€Œå¹¾ä½•å¦çš„ãªèª¬æ˜Žã€ã¨ã—ã¦ä»¥ä¸‹ã®ã‚ˆã†ãªã‚°ãƒ©ãƒ•ãŒæã‹ã‚Œã‚‹ã“ã¨ãŒã‚ˆãã‚ã‚‹ã¨æ€ã„ã¾ã™ï¼š

f:id:ushi-goroshi:20210421132013j:plain

ã“ã®ã‚°ãƒ©ãƒ•ã‚’è¦‹ã‚‹ãŸã³ã«ç§ã¯ç´å¾—ã„ã‹ãªã„æ°—åˆ†ã«ãªã£ã¦ã„ã¾ã—ãŸã€‚ã¨è¨€ã†ã®ã‚‚ã€Lasso ã®æ–¹ï¼ˆã‚°ãƒ©ãƒ•å·¦å´ï¼‰ã«ç€ç›®ã™ã‚‹ã¨ã€OLS ã«ã‚ˆã‚‹æŽ¨å®šå€¤ã®åº§æ¨™ï¼ˆã‚°ãƒ©ãƒ•ä¸ã®Ã—å°ã®ä½ç½®ï¼‰ã‚„æ¥•å††ã®åºƒãŒã‚Šæ–¹ã«ã‚ˆã£ã¦ã¯è±å½¢ã®é ‚ç‚¹ã§ã¯ãªãè¾ºã«æŽ¥ã™ã‚‹ã“ã¨ãŒæ™®é€šã«ã‚ã‚Šå¾—ãã†ã ã‹ã‚‰ã§ã™ã€‚ å°‘ãªãã¨ã‚‚ã“ã®ã‚°ãƒ©ãƒ•ã‚’ã‚‚ã£ã¦ã€ŒLasso ã¯è±å½¢ã®é ‚ç‚¹ã«æŽ¥ã—ã‚„ã™ã„ï¼ˆã‚†ãˆã«è§£ãŒ 0 ã¨æŽ¨å®šã•ã‚Œã‚„ã™ã„ï¼‰ã€ã¨ã„ã†ã®ã¯å…¨ãè‡ªæ˜Žã§ã¯ãªã„ã—ç›´æ„Ÿçš„ã§ã‚‚ãªã„ãªã€ã¨æ€ã£ã¦ã„ã¾ã—ãŸã€‚

ãã‚“ãªæ™‚ã«ã€Œæ©Ÿæ¢°å¦ç¿’ã®æ•°ç†100å•ã‚·ãƒªãƒ¼ã‚ºã€ã®ã€Œã‚¹ãƒ‘ãƒ¼ã‚¹æŽ¨å®š100å• with Rã€ã‚’èªã‚“ã§ã„ã‚‹ã¨ã€ã¾ãŸã‚‚ä¸Šè¨˜ã®ã‚ˆã†ãªã‚°ãƒ©ãƒ•ãŒå‡ºã¦ããŸã®ã§æ‚¶ã€…ã¨ã—ãŸã®ã§ã™ãŒã€æ¬¡ã®ãƒšãƒ¼ã‚¸ã«ã¯ä»¥ä¸‹ã®ã‚ˆã†ãªã‚°ãƒ©ãƒ•ãŒã‚ã‚Šã¾ã—ãŸï¼š

f:id:ushi-goroshi:20210421132410j:plain

ã¾ã•ã«ã“ã‚Œã§ã™ã€‚ã“ã®ã‚°ãƒ©ãƒ•ã«ãŠã„ã¦ç™½è‰²ã®éƒ¨åˆ†ã« OLS ã®æŽ¨å®šå€¤ãŒã‚ã‚‹å ´åˆã€é ‚ç‚¹ã§ã¯ãªãè¾ºã«æŽ¥ã™ã‚‹ã“ã¨ã«ãªã‚Šã¾ã™ã€‚ãã“ã‹ã‚‰å°‘ã—ãšã‚Œã¦ç·‘è‰²ã®éƒ¨åˆ†ã« OLS ã®æŽ¨å®šå€¤ãŒå˜åœ¨ã™ã‚‹å ´åˆã«ã¯è±å½¢ã®é ‚ç‚¹ã«æŽ¥ã™ã‚‹ã“ã¨ã¨ãªã‚‹ã€ã¤ã¾ã‚Šã„ãšã‚Œã‹é‡è¦ã§ãªã„æ–¹ã®è§£ãŒ 0 ã¨ã—ã¦æŽ¨å®šã•ã‚Œã‚‹ã‚ˆã†ã«ãªã‚Šã¾ã™ã€‚

ä¸Šã®ã‚°ãƒ©ãƒ•ã®ã‚ˆã†ãªã€Œå¹¾ä½•å¦çš„ãªèª¬æ˜Žã€ã¯æœ¬å½“ã«å¤šãã®æœ¬ãƒ»è¨˜äº‹ã§è¦‹ã‹ã‘ã‚‹ã®ã§ã™ãŒã€ä¸‹ã®ã‚°ãƒ©ãƒ•ã‚‚åˆã‚ã›ã¦èª¬æ˜Žã™ã‚‹ã“ã¨ã§ã‚ˆã‚Šç†è§£ãŒæ·±ã¾ã‚‹ã®ã§ã¯ã€ã¨æ€ã„ã¾ã—ãŸã€‚ ä½™è«‡ãŠã‚ã‚Šã€‚

ã•ã¦ã€ä¸Šè¨˜ã®ãƒ–ãƒãƒƒã‚¯ã§ã¯ã€å›žå¸°ä¿‚æ•°ãŒç½°å‰‡ã‚ˆã‚Šã‚‚å¤§ããã€ã‹ã¤ä¸Šé™ãƒ»ä¸‹é™ã®ç¯„å›²å†…ã§ã‚ã‚Œã°sign(v,u)/(xv(k)+vp(k)*dem)ã‚’æ–°ãŸãªaã¨ã™ã‚‹ã®ã§ã—ãŸã€‚ ã•ãã»ã©ã®è»Ÿé–¾å€¤ä½œç”¨ç´ ã®èª¬æ˜Žã«ãŠã„ã¦ã¯ã€Œç½°å‰‡ã‚’æ¸›ã˜ãŸå›žå¸°ä¿‚æ•°ã€ï¼ˆã¤ã¾ã‚Švï¼‰ã‚’LassoæŽ¨å®šå€¤ã¨ã—ã¦ã„ã¾ã—ãŸãŒã€ã“ã“ã§ã¯ãã‚Œã‚’xv(k)+vp(k)*demã§é™¤ã—ã¦ã„ã¾ã™ã€‚ ã“ã‚Œã¯ã€ã“ã“ã§å¾—ã‚ˆã†ã¨ã—ã¦ã„ã‚‹æŽ¨å®šå€¤ã¨ã„ã†ã®ãŒ Lasso ã§ã¯ãªã Elastic Net ã§ã‚ã‚‹ãŸã‚ã§ã‚ã‚Šã€ï¼ˆç¬¬ä¸€å›žã§ç´¹ä»‹ã—ãŸï¼‰æ•™ç§‘æ›¸ï¼ˆP36ï¼‰ã§ã¯ Elastic Net ã®æŽ¨å®šé‡ã‚’

$\hat{\beta}^{EN}_{j} = \begin{cases} (\hat{\beta}^{OLS}_{j} - \lambda_{1})/(1+\lambda_{2}) & (\hat{\beta}^{OLS}_{j} > \lambda_{1}) \\ 0 & (|\hat{\beta}^{OLS}_{j}| \le \lambda_{1}) \\ (\hat{\beta}^{OLS}_{j} + \lambda_{1})/(1+\lambda_{2}) & (\hat{\beta}^{OLS}_{j} < -\lambda_{1}) \end{cases}$

ã¨ã—ã¦ã„ã¾ã™ã€‚demã¯alm*(1-bta)ã§å®šç¾©ã•ã‚Œã¦ã„ãŸã“ã¨ã‚’æ€ã„å‡ºã™ã¨ã€ã“ã‚Œã¯ Ridge ï¼ˆL2ï¼‰ã«å¯¾ã™ã‚‹ç½°å‰‡ã§ã‚ã‚Šã€ä¸Šè¨˜ã®å¼ã§ã¯ $\lambda_{2}$ ã«è©²å½“ã—ã¾ã™ã€‚ ã¾ãŸxvã¯ X ã®äºŒä¹—å’Œã‚’åˆ†æ•£ã§é™¤ã—ã¦ 1 ã‚’åŠ ç®—ã—ãŸã‚‚ã®ã§ã€ã“ã‚ŒãŒä½•ã‚’æ„å‘³ã—ã¦ã„ã‚‹ã®ã‹ã¯ä»¥å‰ç´¹ä»‹ã—ãŸã¨ãã‚‚ã‚ã‹ã‚‰ãªã‹ã£ãŸã®ã§ã™ãŒã€ã‚µãƒ³ãƒ—ãƒ«ãƒ‡ãƒ¼ã‚¿ã‚’ä½¿ã£ã¦è¨ˆç®—ã—ã¦ã¿ã‚‹ã¨ãŠãŠã‚ˆã 1 ã«ãªã‚Šãã†ãªã®ã§ãã£ã¨ãã†ã„ã†æ•°å€¤ãªã‚“ã ã‚ã†ã¨æ€ã„ã¾ã™ï¼ˆé©å½“ï¼‰ã€‚

æ®‹ã‚‹å‡¦ç†ã§ã™ãŒã€ä¸Šè¨˜ã«ã‚ˆã£ã¦a(k)ãŒæ›´æ–°ã•ã‚Œãªã‘ã‚Œã°ãƒ«ãƒ¼ãƒ—ã‚’æŠœã‘ã¦æ¬¡ã®å¤‰æ•°ã«ç§»ã‚Šã¾ã™ï¼ˆgotoã®ç§»å‹•å…ˆ10371ã¯ãƒ«ãƒ¼ãƒ—â‘¢ã®çµ‚ç‚¹ã§ã—ãŸï¼‰ã€‚ ã¾ãŸmmãŒ 0 ã§ãªã‘ã‚Œã°10391ï¼ˆãƒ«ãƒ¼ãƒ—â‘£ã®å…ˆï¼‰ã«ç§»å‹•ã™ã‚‹ãŸã‚ã€ä»¥é™ã®å‡¦ç†ã‹ã‚‰æ¬¡ã«ç´¹ä»‹ã™ã‚‹ãƒ«ãƒ¼ãƒ—â‘£ã¾ã§ã‚’ã‚¹ã‚ãƒƒãƒ—ã™ã‚‹ã‚ˆã†ã§ã™ã€‚ ãªãŠã“ã®mmã¯ãƒ«ãƒ¼ãƒ—â‘ ã®ï¼‘å›žç›®ã§ã¯ 0 ãªã®ã§ï¼‘å›žç›®ã¯ç¢ºå®Ÿã«å‡¦ç†ãŒè¡Œã‚ã‚Œã‚‹ã‚ˆã†ã§ã™ãã€‚ ã¾ãŸnxã¯éžã‚¼ãƒã¨ã™ã‚‹å¤‰æ•°ã®æ•°ã®ä¸Šé™ãªã®ã§ã€æŽ¨å®šã—ãŸãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿æ•°ãŒãã‚Œã‚’è¶Šãˆã‚‹ã¨ï¼“ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—ã‚’æŠœã‘ã‚‹ã‚ˆã†ã§ã™ã€‚

if(a(k).eq.ak) goto 10371
if(mm(k) .ne. 0) goto 10391 
nin=nin+1                                                    
if(nin.gt.nx)goto 10372

ãƒ«ãƒ¼ãƒ—â‘£ï¼ˆåˆ†æ•£å…±åˆ†æ•£è¡Œåˆ—ã®è¨ˆç®—ï¼‰

ç¶šã„ã¦ãƒ«ãƒ¼ãƒ—â‘£ã§ã™ã€‚ ã“ã“ã§ã‚‚ãƒ«ãƒ¼ãƒ—ã®å¯¾è±¡ã¯èª¬æ˜Žå¤‰æ•°ï¼ˆniï¼‰ã§ã™ãŒã€ä»Šåº¦ã¯ã‚¤ãƒ³ãƒ‡ãƒƒã‚¯ã‚¹ã¨ã—ã¦jã‚’ç”¨ã„ã€åˆ†æ•£å…±åˆ†æ•£è¡Œåˆ—ï¼ˆã®ã‚ˆã†ãªã‚‚ã®ï¼‰ã‚’è¨ˆç®—ã—ã¦cã«æ ¼ç´ã™ã‚‹ã‚ˆã†ã§ã™ã€‚ ã“ã“ã§cã¯ni*nxã®ã‚µã‚¤ã‚ºã®è¡Œåˆ—ã§ã™ã€‚ ã“ã®ãƒ«ãƒ¼ãƒ—ã¯çŸã„ã®ã§ã¾ã¨ã‚ã¦è¦‹ã¦ã—ã¾ã„ã¾ã—ã‚‡ã†ã€‚

ã¾ãšã¯juã§å¤‰æ•°ã«ãƒãƒ©ãƒ„ã‚ãŒã‚ã‚‹ã‹ã‚’ç¢ºèªã—ã€ãªã‘ã‚Œã°æ¬¡ã®å¤‰æ•°ã«ã‚¹ã‚ãƒƒãƒ—ã—ã¾ã™ã€‚ ç¶šã„ã¦mmã‚’ãƒã‚§ãƒƒã‚¯ã—ã€mmãŒ 0 ã§ãªã‘ã‚Œã°cã«mmã‚’ä»£å…¥ã—ã¦æ¬¡ã®å¤‰æ•°ã«ã‚¹ã‚ãƒƒãƒ—ã—ã¾ã™ï¼ˆãªãŠã“ã®mmã«ã¯å¾Œç¶šã®å‡¦ç†ã§ninãŒä»£å…¥ã•ã‚Œã‚‹ã®ã§ã™ãŒã€ãã®ninã¯mmã‚’åŸºæº–ã«æ•°å€¤ãŒåŠ ç®—ã•ã‚Œã‚‹ã‚ˆã†ãªå¤‰æ•°ã¨ãªã£ã¦ãŠã‚Šäº’ã„ã«å…¥ã‚Šçµ„ã‚“ã§ã„ã¦ä½•ã‚’ã‚„ã£ã¦ã„ã‚‹ã®ã‹ã‚ˆãã‚ã‹ã‚Šã¾ã›ã‚“ã§ã—ãŸï¼‰ã€‚ ç¶šã„ã¦jã¨kã‚’æ¯”è¼ƒã—ã¦åŒä¸€ï¼ˆåŒã˜å¤‰æ•°ï¼‰ã ã£ãŸã‚‰cã«xvã‚’ã€åŒä¸€ã§ãªã‘ã‚Œã°xã®jã¨kã®å†…ç©ã‚’cã«ä»£å…¥ã—ã¾ã™ã€‚xvã¯å…ˆã»ã©å‡ºã¦ããŸxã®äºŒä¹—å’Œã§ã™ã®ã§ã€ã“ã®cã¯åˆ†æ•£å…±åˆ†æ•£è¡Œåˆ—ã®ã‚ˆã†ãªã‚‚ã®ã‚’è¨ˆç®—ã—ã¦ã„ã‚‹ã‚ˆã†ã§ã™ï¼ˆæ£æ–¹è¡Œåˆ—ã§ã¯ãªã„ã®ã§åˆ†æ•£å…±åˆ†æ•£è¡Œåˆ—ã¨ã¯è¨€ã‚ãªã„ã§ã—ã‚‡ã†ã‘ã©ã‚‚ï¼‰ã€‚

do 10401 j=1,ni
! ãƒãƒ©ãƒ„ã‚ãŒãªã‘ã‚Œã°ä»¥é™ã®å‡¦ç†ã‚’ã‚¹ã‚ãƒƒãƒ—
if(ju(j).eq.0)goto 10401

! mm ãŒ 0ï¼ˆãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ãŒ 0 ã§ãªã„ï¼‰ã§ãªã‘ã‚Œã°æ¬¡ã®ãƒ–ãƒãƒƒã‚¯ã‚’å®Ÿè¡Œã—ã¦æ¬¡ã®å¤‰æ•°ã¸ã‚¹ã‚ãƒƒãƒ—
if(mm(j) .eq. 0)goto 10421
c(j,nin)=c(k,mm(j))
goto 10401

10421 continue
if(j .ne. k)goto 10441  ! å¤‰æ•°ãŒåŒä¸€ã§ãªã‘ã‚Œã° 10441 ã«é£›ã¶
c(j,nin)=xv(j) ! åŒä¸€ã ã£ãŸã‚‰ã“ã“
goto 10401
10441 continue
c(j,nin)=dot_product(x(:,j),x(:,k)) ! åŒä¸€ã§ãªã‹ã£ãŸã‚‰ j ã¨ k ã®å†…ç©ã‚’ã¨ã‚‹
10401 continue ! ï¼”ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—ã¯ã“ã“ã¾ã§

ãƒ«ãƒ¼ãƒ—â‘£ãŒçµ‚ã‚ã£ãŸå¾Œã¯å°‘ã—ã ã‘å‡¦ç†ãŒå…¥ã‚Šã¾ã™ã€‚ mmã«ã¯ninãŒä»£å…¥ã•ã‚Œã¾ã™ã€‚ã¾ãŸiaã«ã¯kãŒå…¥ã‚Šã¾ã™ãŒã€ã“ã®kã¯ãƒ«ãƒ¼ãƒ—â‘¢ã®ã‚¤ãƒ³ãƒ‡ãƒƒã‚¯ã‚¹ã§ã€ãƒ«ãƒ¼ãƒ—â‘¢ã¯æ›´æ–°ãŒãªã‘ã‚Œã°ãƒ«ãƒ¼ãƒ—â‘£ã‚’ã‚¹ã‚ãƒƒãƒ—ã—ã¦ã—ã¾ã†ãŸã‚ã€ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã«æ›´æ–°ãŒã‚ã£ãŸå¤‰æ•°ã®ã‚¤ãƒ³ãƒ‡ãƒƒã‚¯ã‚¹ã‚’è¡¨ã™ã“ã¨ã«ãªã‚Šã¾ã™ã€‚ ãã®ä¸Šã§ã€æŽ¨å®šã•ã‚ŒãŸå›žå¸°ä¿‚æ•°ã®å·®åˆ†ã‚’è©•ä¾¡ã—ã€æ®‹å·®å¹³æ–¹å’Œã‚’æ›´æ–°ã—ã¾ã™ã€‚ ã“ã®ã¨ãg(k)ã¯ç¸®å°å‰ã®å›žå¸°ä¿‚æ•°ï¼ˆyã¨x(k)ã®å†…ç©ï¼‰ã§ã€ãã“ã‹ã‚‰ weightèª¿æ•´æ¸ˆã¿ã® x ã®äºŒä¹—å’Œ ã‚’æ¸›ã˜ãŸã‚‚ã®ã‚’æ®‹å·®å¹³æ–¹å’Œã‹ã‚‰æ¸›ã˜ã¦è¨ˆç®—ã—ã¦ã„ã¾ã™ã€‚

continue
! mm ã« nin ã‚’å…¥ã‚Œã‚‹
mm(k)=nin

! ia ã« k ã‚’æ ¼ç´
ia(nin)=k

10391 continue   
! a(k) ã®å·®åˆ†ã‚’ã¨ã‚‹ã€‚ a(k)ã€ ak ã¯æŽ¨å®šã•ã‚ŒãŸå›žå¸°ä¿‚æ•°ã€‚
del=a(k)-ak

! æ®‹å·®å¹³æ–¹å’Œã‚’æ›´æ–°ã™ã‚‹
rsq=rsq+del*(2.0*g(k)-del*xv(k))
dlx=max(xv(k)*del**2,dlx)

ãƒ«ãƒ¼ãƒ—â‘¤ï¼ˆå›žå¸°ä¿‚æ•°ã®æ›´æ–°ï¼‰

ã•ã‚‰ã«ç¶šã‘ã¦ãƒ«ãƒ¼ãƒ—â‘¤ã§ã™ã€‚ã“ã“ã¯ä¸€çž¬ã§çµ‚ã‚ã‚Šã€ã„ã¾è¨ˆç®—ã•ã‚ŒãŸdelã‚’ç”¨ã„ã¦g(j)ã¤ã¾ã‚Šç¸®å°å‰ã®å›žå¸°ä¿‚æ•°ã‚’æ›´æ–°ã—ã¾ã™ã€‚ã¨ã“ã‚ã§kã¯ãƒ«ãƒ¼ãƒ—â‘¢ã®ã‚¤ãƒ³ãƒ‡ãƒƒã‚¯ã‚¹ã§ã€ã“ã®ãƒ«ãƒ¼ãƒ—ã®ä¸ã§ã¯å›ºå®šã•ã‚Œã¦ã„ã¾ã™ã®ã§ã€å„å¤‰æ•°ã®å›žå¸°ä¿‚æ•°ã®ç¸®å°ã«åˆ¥ã®å¤‰æ•°ã¨ã®å…±åˆ†æ•£ã‚’åˆ©ç”¨ã—ã¦ã„ã‚‹ã‚ã‘ã§ã™ãã€‚ å…±åˆ†æ•£ãŒå¤§ãã„ã¨ã„ã†ã“ã¨ã¯äº’ã„ã®å¤‰æ•°é–“ã«ç›¸é–¢ãŒã‚ã‚‹ã¨ã„ã†ã“ã¨ã§ã‚ã‚Šã€ç›¸é–¢ãŒæ£ãªã‚‰å›žå¸°ä¿‚æ•°ãŒå°ã•ããªã‚‹ã‚ˆã†ã«åƒãã‚ˆã†ã§ã™ã€‚

! æŽ¢ç´¢ç¯„å›²ã¯ä¸‰åº¦èª¬æ˜Žå¤‰æ•°
do 10451 j=1,ni ! ã‚¤ãƒ³ãƒ‡ãƒƒã‚¯ã‚¹ã¯å†åº¦ j ã‚’ä½¿ã†
if(ju(j).ne.0) g(j)=g(j)-c(j,mm(k))*del                           
10451 continue ! ï¼•ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—ã¯ã“ã“ã¾ã§
continue

ãƒ«ãƒ¼ãƒ—â‘¤ã‚’æŠœã‘ã‚‹ã¨ã™ãã«ãƒ«ãƒ¼ãƒ—â‘¢ã‚‚çµ‚äº†ã§ã™ã€‚

10371 continue ! ï¼“ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—ã¯ã“ã“ã¾ã§

ç¶šã„ã¦ä»¥ä¸‹ã®ãƒ–ãƒãƒƒã‚¯ã§çµ‚äº†å‡¦ç†ã®åˆ¤å®šã‚’è¡Œã„ã¾ã™ã€‚10352ã¾ã§é£›ã¶ã¨ã€ã„ãã¤ã‹å‡¦ç†ã¯ã‚ã‚‹ã‚‚ã®ã®ãã®ã¾ã¾returnã¨ãªã‚Šã¾ã™ã€‚ã¤ã¾ã‚ŠdlxãŒthrã‚ˆã‚Šã‚‚å°ã•ã„ã€ã¾ãŸã¯ninãŒnxã‚ˆã‚Šã‚‚å¤§ãã„å ´åˆã«ã¯elnet1ã‚’æŠœã‘ã¾ã™ã€‚ ãã†ã§ã¯ãªã„å ´åˆã€ã‚‚ã†å°‘ã—å‡¦ç†ãŒç¶šãã¾ã™ã€‚

10372 continue
if(dlx.lt.thr)goto 10352
if(nin.gt.nx)goto 10352
if(nlp .le. maxit)goto 10471
jerr=-m
return
10471 continue
10360 continue
iz=1
da(1:nin)=a(ia(1:nin))
continue
10481 continue
nlp=nlp+1
dlx=0.0

ãƒ«ãƒ¼ãƒ—â‘¥ï¼ˆå›žå¸°ä¿‚æ•°ã®æŽ¨å®šãƒ»å†ï¼‰

ã•ã‚‰ã«ç¶šã„ã¦ãƒ«ãƒ¼ãƒ—â‘¥ã§ã™ã€‚å®Ÿã¯ã“ã®ãƒ«ãƒ¼ãƒ—ã€ä»¥ä¸‹ã®é€šã‚Šãƒ«ãƒ¼ãƒ—â‘¢ã¨å‡¦ç†ãŒã»ã¨ã‚“ã©åŒã˜ã§ã™ã€‚

! ï¼“ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—ï¼ˆä¸€éƒ¨çœç•¥ï¼‰
do 10371 k=1,ni
if(ju(k).eq.0)goto 10371
ak=a(k)
u=g(k)+ak*xv(k)
v=abs(u)-vp(k)*ab
a(k)=0.0
if(v.gt.0.0) a(k)=max(cl(1,k),min(cl(2,k),sign(v,u)/(xv(k)+vp(k)*dem)))
if(a(k).eq.ak)goto 10371
if(mm(k) .ne. 0)goto 10391
nin=nin+1
if(nin.gt.nx)goto 10372
continue
mm(k)=nin
ia(nin)=k
10391 continue
del=a(k)-ak
rsq=rsq+del*(2.0*g(k)-del*xv(k))
dlx=max(xv(k)*del**2,dlx)
do 10451 j=1,ni
if(ju(j).ne.0) g(j)=g(j)-c(j,mm(k))*del

! ï¼–ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—
do 10491 l=1,nin
k=ia(l)
ak=a(k)
u=g(k)+ak*xv(k)
v=abs(u)-vp(k)*ab
a(k)=0.0
if(v.gt.0.0) a(k)=max(cl(1,k),min(cl(2,k),sign(v,u)/(xv(k)+vp(k)*dem)))
if(a(k).eq.ak)goto 10491
del=a(k)-ak
rsq=rsq+del*(2.0*g(k)-del*xv(k))
dlx=max(xv(k)*del**2,dlx)
do 10501 j=1,nin
g(ia(j))=g(ia(j))-c(ia(j),mm(k))*del

ãƒ«ãƒ¼ãƒ—ã®å¯¾è±¡ãŒniã§ã¯ãªãninã«ãªã£ã¦ã„ã‚‹ç‚¹ãŒç•°ãªã‚Šã¾ã™ãŒã€å‡¦ç†ã¨ã—ã¦ã¯å¤§ä½“åŒã˜ãªã®ã§èª¬æ˜Žã¯çœç•¥ã—ã¾ã™ã€‚

do 10491 l=1,nin
k=ia(l) ! k ã‚’å–ã‚Šå‡ºã™ï¼ˆ ia ã«ã¯ 0 ã§ã¯ãªã„ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ãŒæŽ¨å®šã•ã‚ŒãŸå¤‰æ•°ã®åˆ—ãŒæ ¼ç´ã•ã‚Œã¦ã‚‹ï¼‰
ak=a(k) ! a ã‚’å–ã‚Šå‡ºã™
u=g(k)+ak*xv(k)
v=abs(u)-vp(k)*ab
a(k)=0.0
if(v.gt.0.0) a(k)=max(cl(1,k),min(cl(2,k),sign(v,u)/(xv(k)+vp(k)*dem)))
if(a(k).eq.ak)goto 10491
del=a(k)-ak
rsq=rsq+del*(2.0*g(k)-del*xv(k))
dlx=max(xv(k)*del**2,dlx)

ãƒ«ãƒ¼ãƒ—â‘¦ï¼ˆå›žå¸°ä¿‚æ•°ã®æ›´æ–°ãƒ»å†ï¼‰

ãƒ«ãƒ¼ãƒ—â‘¦ã‚‚åŒæ§˜ã«ãƒ«ãƒ¼ãƒ—â‘¤ã¨åŒã˜å‡¦ç†ã‚’ninã«å¯¾ã—ã¦è¡Œã£ã¦ã„ã¾ã™ã€‚

do 10501 j=1,nin
g(ia(j))=g(ia(j))-c(ia(j),mm(k))*del
10501 continue ! ï¼—ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—ã¯ã“ã“ã¾ã§

ãã—ã¦ãƒ«ãƒ¼ãƒ—â‘¥ãŒçµ‚äº†ã€‚

continue
10491 continue ! ï¼–ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—ã¯ã“ã“ã¾ã§

ã“ã“ã§çµ‚äº†åˆ¤å®šãŒè¡Œã‚ã‚Œã¾ã™ã€‚ nlpã¯ãƒ«ãƒ¼ãƒ—ã®ã‚«ã‚¦ãƒ³ã‚¿ãƒ¼ã¨ãªã£ã¦ã„ã‚‹ã‚ˆã†ã§ã€ä¸€å®šå›žæ•°ã‚’éŽãŽã¦ã„ãªã‘ã‚Œã°10481ã¾ã§æˆ»ã•ã‚Œã¾ã™ã€‚ ã“ã®10481ã¯ãƒ«ãƒ¼ãƒ—â‘¥ã®æ‰‹å‰ã§ã™ã®ã§ã€dlxãŒååˆ†ã«å°ã•ããªã‘ã‚Œã°å†åº¦ãƒ«ãƒ¼ãƒ—â‘¥ã‚’å®Ÿè¡Œã™ã‚‹ã‚ˆã†ãªæµã‚Œã«ãªã£ã¦ã„ã‚‹ã‚ˆã†ã§ã™ãã€‚

continue
if(dlx.lt.thr)goto 10482
if(nlp .le. maxit)goto 10521
jerr=-m
return
10521 continue
goto 10481  ! ãƒ«ãƒ¼ãƒ—â‘¥ã®æ‰‹å‰ã¾ã§æˆ»ã™
10482 continue
da(1:nin)=a(ia(1:nin))-da(1:nin)

ãƒ«ãƒ¼ãƒ—â‘§ï¼ˆå›žå¸°ä¿‚æ•°ã®æ›´æ–°ãƒ»å†ã€…ï¼‰

ãƒ«ãƒ¼ãƒ—â‘§ã§ã™ã€‚æ”¹ã‚ã¦ã€ninã§ã¯ãªãniã«å¯¾ã—ã¦å›žå¸°ä¿‚æ•°ã®æ›´æ–°ãŒè¡Œã‚ã‚Œã¾ã™ã€‚ ã“ã“ã§daã«ã¯ã™ãä¸Šã®ãƒ–ãƒãƒƒã‚¯ã§aã®å€¤ã‹ã‚‰daã®å€¤ã‚’æ¸›ã˜ã¦æ›´æ–°ã—ã¦ã„ã‚‹ã®ã§ã™ãŒã€ã‚‚ã†å°‘ã—ä¸Šã®æ–¹ã§daã«ã¯aã‚’æ¸¡ã—ã¦ã„ã¾ã™ã€‚ ã¤ã¾ã‚Šé †ç•ªã¨ã—ã¦ã¯ã€da <- a ã¨ã—ãŸä¸Šã§aã‚’æ›´æ–°ã—ã€æ›´æ–°å¾Œã®aã¨daï¼ˆã¤ã¾ã‚Šæ›´æ–°å‰ã®aï¼‰ã®å·®åˆ†ã‚’æ”¹ã‚ã¦daã¨ã™ã‚‹ã€ã¨ã„ã†æµã‚Œã§ã™ã€‚ ã“ã®æ›´æ–°å¾Œã®daã¨åˆ†æ•£å…±åˆ†æ•£è¡Œåˆ—ã®å†…ç©ã‚’å›žå¸°ä¿‚æ•°ã‹ã‚‰æ¸›ã˜ã‚‹ã‚ã‘ã§ã™ã®ã§ã€ã‚„ã£ã¦ã„ã‚‹ã“ã¨ã¯ãƒ«ãƒ¼ãƒ—â‘¤ã«ãŠã‘ã‚‹å›žå¸°ä¿‚æ•°ã®æ›´æ–°ã¨åŒã˜ã§ã™ãã€‚

do 10531 j=1,ni
if(mm(j).ne.0)goto 10531
if(ju(j).ne.0) g(j)=g(j)-dot_product(da(1:nin),c(j,1:nin))
10531 continue ! ï¼˜ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—ã¯ã“ã“ã¾ã§

ãƒ«ãƒ¼ãƒ—â‘§ã‚’æŠœã‘ã‚‹ã¨å¾Œã¯çµ‚äº†ã¾ã§ä¸€ç›´ç·šã§ã™â€¦ã¨è¨€ã„ãŸã„ã¨ã“ã‚ã§ã™ãŒã€ã“ã“ã§ãªã‚“ã¨è¡æ’ƒçš„ãªã“ã¨ã«ã€10351ã€ã¤ã¾ã‚Šãƒ«ãƒ¼ãƒ—â‘¢ã®é–‹å§‹ã¾ã§æˆ»ã•ã‚Œã¦ã—ã¾ã„ã¾ã™ã€‚ãªã‚“ã¦ã“ã£ãŸã€‚

å®Ÿã¯ãƒ«ãƒ¼ãƒ—â‘¢ã®é–‹å§‹ç›´å¾Œã«ã¯iz*jzã§å‡¦ç†ã‚’å¤‰ãˆã‚‹åˆ¤å®šãŒã‚ã‚Šã€ã¨ã‚‚ã« 1 ã§ã‚ã‚Œã°ãƒ«ãƒ¼ãƒ—â‘¢ã®çµ‚äº†æ™‚ç‚¹ã¾ã§ç§»å‹•ã™ã‚‹ã®ã§ã™ãŒã€ã“ã“ã§jzã‚’ 0 ã«ã—ã¦ã—ã¾ã£ã¦ã„ã‚‹ã®ã§æ„šç›´ã«ãƒ«ãƒ¼ãƒ—â‘¢ã‚’å†åº¦å®Ÿè¡Œã™ã‚‹ã“ã¨ã«ãªã‚Šã¾ã™ã€‚ ã—ã‹ã‚‚jzãŒ 1 ã«æ›´æ–°ã•ã‚Œã‚‹æ©Ÿä¼šãŒã‚ã‚‹ã®ã¯ãƒ«ãƒ¼ãƒ—â‘¢ã‚ˆã‚Šã‚‚å‰ã®æ®µéšŽãªã®ã§ã€ä¸€åº¦ã“ã®å‡¦ç†ã«å…¥ã£ãŸå ´åˆã«ã¯å¿…ãšãƒ«ãƒ¼ãƒ—â‘¢ã®å‡¦ç†ã‹ã‚‰å†é–‹ã—ãªã„ã¨ã„ã‘ãªã„ã€ã¨ã„ã†ã“ã¨ã§ã™ãã€‚

continue
jz=0
goto 10351  ! ãˆã£ï¼ï¼

ä¸Šã®gotoã‚’ç„¡äº‹ã«å›žé¿ã§ããŸå ´åˆã€æœ€å¾Œã®å‡¦ç†ã«å…¥ã‚Šã¾ã™ã€‚ ä»¥ä¸‹ã§ã¯å¿…è¦ãªå¤‰æ•°ã‚’æ ¼ç´ã—ã¦ã„ã¾ã™ã€‚

10352 continue
if(nin .le. nx)goto 10551  ! nin ãŒ nx ã‚’è¶…ãˆãŸå ´åˆã¯ã“ã“ã«ãã‚‹
jerr=-10000-m
goto 10282 ! jerr ã‚’ æ›´æ–°ã—ã¦ elnet1 ã‚’æŠœã‘ã‚‹
10551 continue
if(nin.gt.0) ao(1:nin,m)=a(ia(1:nin))
kin(m)=nin   ! m å›žç›®ã®ãƒ«ãƒ¼ãƒ—ã® nin ã‚’ kin[m] ã«æ ¼ç´ã™ã‚‹
rsqo(m)=rsq  ! m å›žç›®ã®ãƒ«ãƒ¼ãƒ—ã® rsq ã‚’ rsqo[m] ã«æ ¼ç´ã™ã‚‹
almo(m)=alm  ! m å›žç›®ã®ãƒ«ãƒ¼ãƒ—ã® alm ã‚’ almo[m] ã«æ ¼ç´ã™ã‚‹
lmu=m
if(m.lt.mnl)goto 10281
if(flmin.ge.1.0)goto 10281
me=0

ãƒ«ãƒ¼ãƒ—â‘¨ï¼ˆå›žå¸°ä¿‚æ•°ãŒæŽ¨å®šã•ã‚ŒãŸå¤‰æ•°ã®ã‚«ã‚¦ãƒ³ãƒˆï¼‰

ä»¥ä¸‹ã§ã¯elnet1ã®ã“ã“ã¾ã§ã®ãƒ«ãƒ¼ãƒ—ã«ã‚ˆã£ã¦æŽ¨å®šã•ã‚ŒãŸå›žå¸°ä¿‚æ•°ã‚’ç¢ºèªã—ã€0.0 ã§ã¯ãªã„å¤‰æ•°ã®æ•°ã‚’ã‚«ã‚¦ãƒ³ãƒˆã—ã¦ã„ã¾ã™ã€‚æ”¹ã‚ã¦ã€jã¯å¤‰æ•°ã€mã¯lambdaã®ã‚¤ãƒ³ãƒ‡ãƒƒã‚¯ã‚¹ã§ã™ã€‚

! ï¼™ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—
do 10561 j=1,nin
if(ao(j,m).ne.0.0) me=me+1
10561 continue ! ï¼™ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—ã“ã“ã¾ã§

æœ€å¾Œã«meã€rsqã€rsq0ã®ç¢ºèªã‚’ã—ã€å•é¡Œãªã‘ã‚Œã°æ¬¡ã®lambdaã«ç§»ã‚Šã¾ã™ã€‚

continue
if(me.gt.ne)goto 10282
if(rsq-rsq0.lt.sml*rsq)goto 10282
if(rsq.gt.rsqmax)goto 10282
10281 continue ! ï¼‘ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—ã¯ã“ã“ã¾ã§

10282 continue
deallocate(a,mm,c,da)
return
end

çµ‚ã‚ã‚Šã«

ä»¥ä¸Šã§elnet1ã¯çµ‚äº†ã§ã™ã€‚ ã“ã“ã¾ã§éšåˆ†ã¨ã‹ã‹ã‚Šã¾ã—ãŸãŒã€ãªã‚“ã¨ã‹{glmnet}ã®ãƒ¡ã‚¤ãƒ³ã®å‡¦ç†ã‚’æœ€å¾Œã¾ã§è¿½ã„ã‹ã‘ã‚‹ã“ã¨ãŒå‡ºæ¥ã¾ã—ãŸï¼ˆé€”ä¸ã§ã‚ã‹ã‚‰ãªã„éƒ¨åˆ†ã‚’é£›ã°ã—ãŸã‚Šã—ã¾ã—ãŸãŒï¼‰ã€‚

ä»Šå›žã®èª¿æŸ»ã§ã®ä¸€ç•ªã®ãƒã‚¤ãƒ³ãƒˆã¯ã‚„ã¯ã‚Šã€ã€ŒLassoã§ã¯æŽ¨å®šã•ã‚ŒãŸå›žå¸°ä¿‚æ•°ãŒç½°å‰‡ã‚ˆã‚Šã‚‚å°ã•ã‘ã‚Œã° 0 ã«ä¸¸ã‚ã¦ã—ã¾ã†ã€ã¨ã„ã†ã“ã¨ã‚’ç¢ºèªã§ããŸã“ã¨ã ã¨æ€ã„ã¾ã™ã€‚ ã€ŒLassoã¯ä¸è¦ãªå¤‰æ•°ã‚’0ã¨ã—ã¦æŽ¨å®šã™ã‚‹ã“ã¨ã§å¤‰æ•°é¸æŠžã§ãã‚‹ã€ã¨ã„ã†ã®ã¯é–“é•ã£ã¦ã¯ã„ãªã„ã®ã§ã™ãŒã€0ã¨ã—ã¦æŽ¨å®šã§ãã‚‹ã¨ã„ã†ã‚ˆã‚Šã‚‚æ˜Žç¤ºçš„ã«0ã«ã—ã¦ã—ã¾ã£ã¦ã„ã‚‹ã¨ã„ã†è¡¨ç¾ã®æ–¹ãŒæ£ã—ã„ã¨æ€ã„ã¾ã™ã€‚ ãªã®ã§ã€Œå¤‰æ•°é¸æŠžã§ãã‚‹ã€ã¨ã„ã†è¨€è‘‰ã‚‚æœ¬æ¥ã§ã‚ã‚Œã°ã€ŒåŠ¹æžœã®å°ã•ãªå¤‰æ•°ã‚’ç„¡è¦–ã™ã‚‹ã“ã¨ã§å¤‰æ•°é¸æŠžã—ã¦ã„ã‚‹ã€ã¨ã„ã†è¨€ã„æ–¹ã«ãªã‚‹ã®ã‹ãªã¨æ€ã„ã¾ã—ãŸã€‚

ã“ã†ã„ã£ãŸãƒ¢ãƒ‡ãƒ«ã«ãŠã‘ã‚‹é‡è¦ãªãƒã‚¤ãƒ³ãƒˆã‚’ã€ã‚½ãƒ¼ã‚¹ã‚³ãƒ¼ãƒ‰ã‚’è¿½ã„ã‹ã‘ãªãŒã‚‰ç†è§£ã™ã‚‹ã¨ã„ã†ã®ã¯æœ¬å½“ã«å¤§äº‹ãªã“ã¨ã ã¨æ”¹ã‚ã¦æ€ã„ã¾ã™ã€‚

ãã‚Œã§ã¯ã€‚

2020-11-09

glmnetã‚’ã‚‚ã†å°‘ã—ç†è§£ã—ãŸã„â‘£

R glmnet å¤‰æ•°é¸æŠž

ãã‚Œã§ã¯å‰å›žã®è¨˜äº‹ã«ç¶šã„ã¦elnet1ã®ç´¹ä»‹ã§ã™ã€‚éŽåŽ»ã®è¨˜äº‹ã¯ã“ã¡ã‚‰ã§ã™ã€‚

ushi-goroshi.hatenablog.com ushi-goroshi.hatenablog.com ushi-goroshi.hatenablog.com

elnet1ã®å®Ÿè£…

`elnet1`ã®å®Ÿè£…

å‰å›žã®è¨˜äº‹ã§æœ€å¾Œã«è§¦ã‚ŒãŸé€šã‚Šã€elnet1è‡ªä½“ã¯ 180 è¡Œç¨‹åº¦ã¨ãã‚Œã»ã©å¤§ããã¯ãªã„ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ãªã®ã§ã™ãŒã€å¤šæ•°ã®ãƒ«ãƒ¼ãƒ—ãŒè¾¼ã¿å…¥ã£ã¦ã„ã¾ã™ã€‚ å…·ä½“çš„ã«ã¯ä»¥ä¸‹ã®é€šã‚Š 9 ã¤ã®ãƒ«ãƒ¼ãƒ—å‡¦ç†ï¼ˆfortran ãªã®ã§ do æ–‡ï¼‰ãŒãƒã‚¹ãƒˆã—ãŸæ§‹é€ ã¨ãªã£ã¦ãŠã‚Šã€ ã—ã‹ã‚‚gotoã«ã‚ˆã£ã¦è¡Œãæ¥ã—ã¦ã„ã¾ã™ï¼ˆã‚ã‹ã‚Šã‚„ã™ã„ã‚ˆã†ã« R ã§æ›¸ã„ã¦ã‚ã‚Šã¾ã™ãŒã€æ·»å—ã¯çµ±ä¸€ã—ã¦ã‚ã‚Šã¾ã™ï¼‰ã€‚

# 1ç•ªç›®
for (m in 1:nlam) {
  # 2ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—
  for (j in 1:ni) {
  }
  # 3ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—
  for (k in 1:ni) {
    # 4ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—
    for (j in 1:ni) {
    }
    # 5ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—
    for (j in 1:ni) {
    }
  }
  # 6ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—
  for (l in 1:nin) {
    # 7ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—
    for (j in 1:nin) {
    }
  }
  # 8ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—
  for (j in 1:ni) {
  }
  # 9ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—
  for (j in 1:nin) {
  }
}

å‰å‡¦ç†

ã¾ãšã¯ã„ã¤ã‚‚ã®é€šã‚Šå¤‰æ•°ã®å®šç¾©ã§ã™ãŒã€ãã‚Œã«åŠ ãˆã¦åˆæœŸãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’å–å¾—ã™ã‚‹ã¨ã„ã†å‡¦ç†ãŒå…¥ã‚Šã¾ã™ã€‚

subroutine elnet1(beta,ni,ju,vp,cl,g,no,ne,nx,x,nlam,flmin,ulam,th
                  *r,maxit,xv,  lmu,ao,ia,kin,rsqo,almo,nlp,jerr)
implicit double precision(a-h,o-z)
double precision vp(ni),g(ni),x(no,ni),ulam(nlam),ao(nx,nlam)
double precision rsqo(nlam),almo(nlam),xv(ni)
double precision cl(2,ni)
integer ju(ni),ia(nx),kin(nlam)
double precision, dimension (:), allocatable :: a,da
integer, dimension (:), allocatable :: mm
double precision, dimension (:,:), allocatable :: c
allocate(c(1:ni,1:nx),stat=jerr)
if(jerr.ne.0) return;

! åˆæœŸãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’å–å¾—
call get_int_parms(sml,eps,big,mnlam,rsqmax,pmin,exmx,itrace)

! a, mm, da ã‚’ allocate
allocate(a(1:ni),stat=jerr)  ! a ã¯èª¬æ˜Žå¤‰æ•°ã®æ•°ã®æ¬¡å…ƒã‚’ã‚‚ã¤ãƒ™ã‚¯ãƒˆãƒ«

if(jerr.ne.0) return
allocate(mm(1:ni),stat=jerr) ! mm ã¯èª¬æ˜Žå¤‰æ•°ã®æ•°ã®æ¬¡å…ƒã‚’ã‚‚ã¤ãƒ™ã‚¯ãƒˆãƒ«

if(jerr.ne.0) return
allocate(da(1:ni),stat=jerr)
if(jerr.ne.0) return

ã“ã“ã§get_int_parmsã¯ãã‚Œã»ã©å¤§ãããªã„ã®ã§å…¨ä½“ã‚’è¦‹ã¦ã¿ã¾ã—ã‚‡ã†ã€‚ ä»¥ä¸‹ã®ã‚ˆã†ãªã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã§ã™ï¼š

subroutine get_int_parms(sml,eps,big,mnlam,rsqmax,pmin,exmx,itrace)
implicit double precision(a-h,o-z)                                
data sml0,eps0,big0,mnlam0,rsqmax0,pmin0,exmx0,itrace0  /1.0d-5,1.0d-6,9.9d35,5,0.999,1.0d-9,250.0,0/  
  sml=sml0                                                          
eps=eps0                                                          
big=big0                                                          
mnlam=mnlam0                                                      
rsqmax=rsqmax0                                                    
pmin=pmin0                                                        
exmx=exmx0                                                        
itrace=itrace0                                                    
return                                                            
entry chg_fract_dev(arg)                                          
sml0=arg                                                          
return                                                            
entry chg_dev_max(arg)                                            
rsqmax0=arg                                                       
return                                                            
entry chg_min_flmin(arg)                                          
eps0=arg                                                          
return                                                            
entry chg_big(arg)                                                
big0=arg                                                          
return                                                            
entry chg_min_lambdas(irg)                                        
mnlam0=irg                                                        
return                                                            
entry chg_min_null_prob(arg)                                      
pmin0=arg                                                         
return                                                            
entry chg_max_exp(arg)                                            
exmx0=arg                                                         
return                                                            
entry chg_itrace(irg)                                             
itrace0=irg                                                       
return                                                            
end

ä¸Šã‹ã‚‰3è¡Œç›®ã®dataæ–‡ã¯å¤‰æ•°ã«åˆæœŸå€¤ã‚’ä¸Žãˆã‚‹ fortran ã®è¨˜æ³•ã®ã‚ˆã†ã§ã€dataã«ç¶šã„ã¦å®£è¨€ã—ãŸå¤‰æ•°ã«å¯¾ã—ã¦/ã§æŒŸã‚“ã å€¤ã‚’åˆæœŸå€¤ã¨ã—ã¦ä¸Žãˆã‚‹ã‚ˆã†ã§ã™ã€‚ ãã®ãŸã‚sml0ã«ã¯ 1.0d-5 ãŒã€eps0ã«ã¯ 1.0d-6 ãŒå…¥åŠ›ã•ã‚Œã¾ã™ã€‚ ã“ã“ã§ d ã¯å€ç²¾åº¦ã®æŒ‡æ•°è¡¨è¨˜ã‚’è¡¨ã—ã¾ã™ã€‚13è¡Œç›®ã®entryä»¥é™ã¯å„å¤‰æ•°ã«ã¤ã„ã¦ç‰¹å®šã®å€¤ã‚’æŒ‡å®šã™ã‚‹ãŸã‚ã®ã‚‚ã®ã®ã‚ˆã†ã§ã™ï¼ˆentryã®ä½¿ã„æ–¹ãŒã‚ˆãã‚ã‹ã‚‰ãªã„â€¦ï¼‰ã€‚

ç¶šã‘ã¦ã„ãã¤ã‹å¤‰æ•°ã«å€¤ã‚’ä»£å…¥ã—ã¾ã™ã€‚ ã¾ãšã¯btaã§ã™ãŒã€ä»£å…¥ã—ã¦ã„ã‚‹betaã¯å…ƒã€…parmã¨ã—ã¦æ¸¡ã•ã‚ŒãŸã‚‚ã®ã§ã€ã“ã‚Œã¯elnet.rã§parm = alphaã¨ã—ã¦æ¸¡ã—ã¦ã„ãŸã‚‚ã®ã§ã—ãŸã€‚ã•ã‚‰ã«ã“ã®alphaã¯glmnet.rã§å®šç¾©ã•ã‚ŒãŸã‚‚ã®ã§ã€L1 ã¨ L2 ãã‚Œãžã‚Œã«å¯¾ã™ã‚‹ç½°å‰‡ã®é…åˆ†ã‚’æ±ºã‚ã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã§ã™ï¼š

ï¼ˆãªãœã‹ Tex ãŒè¡¨ç¤ºã•ã‚Œãªã„ã®ã§ã²ã¨ã¾ãšï¼‰

(1 âˆ’ \alpha)/2 ||\beta||^2_2 + \alpha||\beta||_1

      bta=beta

ã“ã®btaã‚’ 1 ã‹ã‚‰æ¸›ã˜ãŸã‚‚ã®ã‚’ombã¨ã—ã¾ã™ãŒã€ã“ã®ombã¯ã™ãä¸‹ã§å®šç¾©ã•ã‚Œã‚‹almã¨ã®ä¹—ç®—ã§demã‚’å®šç¾©ã™ã‚‹ï¼ˆã¤ã¾ã‚Šdem = alm * obmï¼‰ãŸã‚ã ã‘ã«ä½¿ã‚ã‚Œã¦ã„ã¾ã™ã€‚ ã•ã‚‰ã«almã¯ãƒ«ãƒ¼ãƒ—ã®ä¸ã§æ›´æ–°ã•ã‚ŒãªãŒã‚‰æœ€çµ‚çš„ã«ã¯btaã¨ã®ä¹—ç®—ã«ã‚ˆã£ã¦abã¨ãªã‚Šã€å›žå¸°ä¿‚æ•°ã®ç¸®å°ã«ä½¿ã‚ã‚Œã‚‹ã“ã¨ã«ãªã‚Šã¾ã™ã€‚ ã¾ãŸãã®æ¬¡ã®alfã¯almã®æ›´æ–°ã«ä½¿ã‚ã‚Œã¾ã™ã®ã§ã€ã“ã‚Œã‚‰ã®å¤‰æ•°ãŒãƒ«ãƒ¼ãƒ—ã®ä¸ã§æ›´æ–°ã•ã‚Œã¤ã¤å›žå¸°ä¿‚æ•°ã®ç¸®å°ã«åˆ©ç”¨ã•ã‚Œã‚‹ã¨ã„ã†ã“ã¨ã«ãªã‚Šã¾ã™ï¼ˆä»–ã«ã‚‚ã‚ã‚Šã¾ã™ï¼‰ã€‚

      omb=1.0-bta
      alm=0.0
      alf=1.0

ä»¥ä¸‹ã®ãƒ–ãƒãƒƒã‚¯ã§ã¯eqsã¨alfã‚’å®šç¾©ã—ã¾ã™ãŒã€flminãŒ 1.0ä»¥ä¸Šã§ã‚ã‚Œã°ã‚¹ã‚ãƒƒãƒ—ã•ã‚Œã‚‹ã‚ˆã†ã§ã™ã€‚ ã“ã®flminã¨ã„ã†ã®ã¯glmnet.rã«ãŠã„ã¦ç½°å‰‡lambdaãŒæŒ‡å®šã•ã‚Œã¦ã„ã‚Œã° 1 ãŒã€ã•ã‚Œã¦ã„ãªã„æ™‚ã«ã¯lambda.min.ratioãŒå…¥åŠ›ã•ã‚Œã‚‹å¤‰æ•°ã§ã—ãŸã€‚ lambda.min.ratioã¯ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã§ã¯lambda.min.ratio = ifelse(nobs < nvars, 0.01, 1e-04)ã¨ãªã£ã¦ã„ã¾ã™ã®ã§ 1 ã‚ˆã‚Šã¯å°ã•ã„å€¤ãŒå…¥ã‚Šãã†ã§ã™ã€‚ ã—ãŸãŒã£ã¦ä»¥ä¸‹ã®ãƒ–ãƒãƒƒã‚¯ã¯ã€ŒlambdaãŒæŒ‡å®šã•ã‚Œã¦ã„ãªã„ã¨ãã¯alfã‚’å®šç¾©ã—ã‚ˆã†ã€ã¨ã„ã†å‡¦ç†ã«ãªã£ã¦ã„ã¾ã™ï¼ˆeqsã¯ã“ã“ã—ã‹å‡ºã¦ãã¾ã›ã‚“ï¼‰ã€‚

ãã®å ´åˆã€epsã¨flminï¼ˆ=1ï¼‰ã®å¤§ãã„æ–¹ã‚’æ–°ãŸã«eqsã¨å®šç¾©ã—ã¾ã™ãŒã€ã“ã®eps ã¯get_int_parmsã§eps0ï¼ˆ1.0d-6 ã¨ã„ã†å°ã•ã„æ•°ï¼‰ã‚’å—ã‘å–ã£ã¦ã„ã¾ã—ãŸã€‚ ä¸€æ–¹lambda.min.ratioã¯å…ˆã»ã©è¿°ã¹ãŸã‚ˆã†ã«ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã§ã¯lambda.min.ratio = ifelse(nobs < nvars, 0.01, 1e-04)ã¨ãªã£ã¦ã„ã¾ã™ã®ã§ã€ã‚‚ã†å°‘ã—å¤§ãã„å€¤ã¨ãªã‚Šãã†ã§ã™ã€‚ ã—ãŸãŒã£ã¦eqsã¯ 0.01 or 1e-04 ã€alfã¯ãã®1/(nlam-1)ä¹—ã¨ãªã‚‹ã‚ˆã†ã§ã™ã€‚

      if(flmin .ge. 1.0)goto 10271
      eqs=max(eps,flmin)
      alf=eqs**(1.0/(nlam-1))  ! alf ã‚’ eqs ã® (1/(nlam-1)) ã§å®šç¾©ã™ã‚‹

flminãŒ 1 ä»¥ä¸Šã§ã‚ã‚‹ï¼ˆlambdaãŒæŒ‡å®šã•ã‚Œã¦ã„ã‚‹ï¼‰å ´åˆã¯ä¸Šè¨˜ã‚’ã‚¹ã‚ãƒƒãƒ—ã—ã¦ã“ã¡ã‚‰ã«ãã¾ã™ã€‚rsqã¯ãã®ã¾ã¾æ®‹å·®å¹³æ–¹å’Œã§ã™ãã€‚

ç¶šãaã¯elnet1ã®ä¸ã§é‡è¦ãªå½¹å‰²ã‚’æ‹…ã£ã¦ã„ã‚‹ã®ã§ã˜ã£ãã‚Šã¨è¦‹ã¦ã„ãã¾ã—ã‚‡ã†ã€‚ å®Ÿã¯ã“ã®aã¯ï¼ˆç¸®å°ã•ã‚ŒãŸï¼‰å›žå¸°ä¿‚æ•°ã‚’æ ¼ç´ã™ã‚‹å¤‰æ•°ã§ã™ã€‚

10271 continue
      ! ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®åˆæœŸåŒ–
      rsq=0.0 ! æ®‹å·®å¹³æ–¹å’Œ
      a=0.0

ã“ã®aãŒã©ã†ãªã‚‹ã®ã‹ã€ãƒ•ãƒ©ã‚¤ãƒ³ã‚°ã—ã¦å…ˆã®å‡¦ç†ã‚’è¦‹ã¦ã¿ã¾ã—ã‚‡ã†ã€‚ elnet1ã® 70 è¡Œç›®å‰å¾Œã«ä»¥ä¸‹ã®å‡¦ç†ãŒã‚ã‚Šã¾ã™ï¼š

      ak=a(k)                                                           
      u=g(k)+ak*xv(k)                                                   
      v=abs(u)-vp(k)*ab                                                 
      a(k)=0.0                                                          
      if(v.gt.0.0) a(k)=max(cl(1,k),min(cl(2,k),sign(v,u)/(xv(k)+vp(k)*dem)))
      if(a(k).eq.ak)goto 10371

akã¨ã„ã†å¤‰æ•°ã«aã® k ç•ªç›®ã®å€¤ã‚’æ¸¡ã—ã¦ãŠãã€uã¨vã‚’å®šç¾©ã—ã€aã® k ç•ªç›®ã®å€¤ã‚’ 0 ã«æ›´æ–°ã—ãŸä¸Šã§è‰²ã‚“ãªå€¤ã‚’å‚ç…§ã—ãªãŒã‚‰å†åº¦æ›´æ–°ã—ã¦ã„ã¾ã™ï¼ˆã“ã®uã‚„vã¯å¾Œã§ç¢ºèªã—ã¾ã™ï¼‰ã€‚ æœ€çµ‚çš„ã«aã¯ä»¥ä¸‹ã®ã‚ˆã†ã«aoã¨ã„ã†å¤‰æ•°ã«ä»£å…¥ã•ã‚Œã¾ã™ï¼ˆ154 è¡Œç›®ï¼‰ï¼š

      if(nin.gt.0) ao(1:nin,m)=a(ia(1:nin))

ã“ã®aoã§ã™ãŒã€elnetuã®ä¸ã§elnet1ã‚’å‘¼ã³å‡ºã™ã¨ãã«ã¯caã¨ã„ã†å¼•æ•°ã¨ã—ã¦æ¸¡ã•ã‚Œã¦ã„ã¾ã™ã€‚

! elnet1 ã§å—ã‘å–ã‚‹å¤‰æ•°
! lmu ã®æ¬¡ã« ao ãŒã‚ã‚‹
subroutine elnet1(beta,ni,ju,vp,cl,g,no,ne,nx,x,nlam,flmin,ulam,th
     *r,maxit,xv,  lmu,ao,ia,kin,rsqo,almo,nlp,jerr)

! elnetu ã§ elnet1 ã‚’ call ã™ã‚‹ã¨ãã®å¼•æ•°
! ã“ã¡ã‚‰ã¯ lmu ã®æ¬¡ã« ca ãŒã‚ã‚‹
call elnet1(parm,ni,ju,vp,cl,g,no,ne,nx,x,nlam,flmin,vlam,thr,maxi,xv,  lmu,ca,ia,nin,rsq,alm,nlp,jerr)

ã“ã®caã¯elnet.rã®ä¸ã§.Fortran("elnet", ...)ã¨ call ã•ã‚Œã‚‹éš›ã«å®šç¾©ã•ã‚Œã‚‹å¤‰æ•°ã§ã—ãŸï¼š

else .Fortran("elnet", ka, parm = alpha, nobs, nvars, as.double(x), 
              y, weights, jd, vp, cl, ne, nx, nlam, flmin, 
              ulam, thresh, isd, intr, maxit, lmu = integer(1), 
              a0 = double(nlam), 
              # ã“ã“ã§ ca ãŒå®šç¾©ã•ã‚Œã¦ã„ã‚‹
              ca = double(nx * nlam), 
              ia = integer(nx), 
              nin = integer(nlam),  rsq = double(nlam), alm = double(nlam), 
              nlp = integer(1), jerr = integer(1), PACKAGE = "glmnet")

ã“ã“ã§nxã¯èª¬æ˜Žå¤‰æ•°ã®æ•°ã€nlamã¯ç½°å‰‡lambdaã®æ•°ãªã®ã§ã€èª¬æ˜Žå¤‰æ•°ã®æ•° Ã— lambda ã®æ•°ã®ãƒ™ã‚¯ãƒˆãƒ«ã‚’å®šç¾©ã—ã¦ã„ã¾ã™ï¼ˆãã—ã¦ãã‚ŒãŒelnet1ã®ä¸ã§aoã¨ã—ã¦è©•ä¾¡ãƒ»æ ¼ç´ã•ã‚Œã‚‹ï¼‰ã€‚

ã“ã®caã¯elnet.rã®å¾Œç¶šã®å‡¦ç†ã«ãŠã„ã¦ä»¥ä¸‹ã®ç®‡æ‰€ã§æŠ½å‡ºã•ã‚Œã¾ã™ï¼š

outlist = getcoef(fit, nvars, nx, vnames)

ã“ã“ã§glmnet:::getcoefã¯ä»¥ä¸‹ã®é€šã‚Šã§ã€fitã¨ã—ã¦è¿”ã£ã¦ããŸã‚ªãƒ–ã‚¸ã‚§ã‚¯ãƒˆã®caãã®ã‚‚ã®ã‚’betaã«æ ¼ç´ã—ã¦ã„ã¾ã™ï¼ˆninmaxãŒ 0 ã®å ´åˆã¯ 0 ã®ãƒ™ã‚¯ãƒˆãƒ«ãŒè¿”ã‚‹ï¼‰ã€‚

# glmnet:::getcoef
function (fit, nvars, nx, vnames) {
  # ã“ã“ã¾ã§çœç•¥
  nin = fit$nin[seq(lmu)]
  ninmax = max(nin)
  # ã“ã“ã¾ã§çœç•¥
  if (ninmax > 0) {
    # ã“ã“ã§ ca ã‚’æŠ½å‡ºã—ã¦ã„ã‚‹ 
    ca = matrix(fit$ca[seq(nx * lmu)], nx, lmu)[seq(ninmax), 
                                                , drop = FALSE]
    df = apply(abs(ca) > 0, 2, sum)
    ja = fit$ia[seq(ninmax)]
    oja = order(ja)
    ja = rep(ja[oja], lmu)
    ia = cumsum(c(1, rep(ninmax, lmu)))
    # beta ã«æ ¼ç´ã™ã‚‹
    beta = drop0(new("dgCMatrix", Dim = dd, Dimnames = list(vnames, 
                                                            stepnames), x = as.vector(ca[oja, ]), p = as.integer(ia - 
                                                                                                                   1), i = as.integer(ja - 1)))
  }
  else {
    beta = zeromat(nvars, lmu, vnames, stepnames)
    df = rep(0, lmu)
  }
  # ã“ã“ã‚‚çœç•¥
  list(a0 = a0, beta = beta, df = df, dim = dd, lambda = lam)
}

ã“ã‚Œã«ã„ãã¤ã‹ã®æƒ…å ±ã‚’è¿½åŠ ã—ãŸã‚‚ã®ãŒglmnetã®è¿”ã‚Šå€¤ã§ã™ã€‚elnet1ã«ãŠã„ã¦è©•ä¾¡ã•ã‚ŒãŸaãŒaoã«æ ¼ç´ã•ã‚Œã€elnetã«caã¨ã—ã¦æ¸¡ã•ã‚Œã€elnet.rã§betaã«æŠ½å‡ºãƒ»æ ¼ç´ã•ã‚Œã‚‹æµã‚ŒãŒä¼ã‚ã‚Šã¾ã—ãŸã§ã—ã‚‡ã†ã‹ã€‚

é‡è¦ãªå¤‰æ•°ã‚’èª¬æ˜Žã—ãŸã¨ã“ã‚ãªã®ã§ã€ä»¥ä¸‹ãƒ–ãƒãƒƒã‚¯ã§åˆæœŸåŒ–ã—ã¦ã„ã‚‹å¤‰æ•°ã®è©³ç´°ã¯å‡ºã¦ããŸã¨ãã«èª¬æ˜Žã™ã‚‹ã¨ã—ã¦ã€ã•ã£ã•ã¨æ¬¡ã«é€²ã‚“ã§ã—ã¾ã„ã¾ã—ã‚‡ã†ã€‚

      mm=0
      nlp=0
      nin=nlp
      
      iz=0
      mnl=min(mnlam,nlam)

ãƒ«ãƒ¼ãƒ—â‘ ï¼ˆ`alm`ã®æ›´æ–°ï¼‰

ä¸Šè¨˜ã¾ã§ã§å¿…è¦ãªå¤‰æ•°ã®åˆæœŸåŒ–ãŒå®Œäº†ã—ãŸã®ã§ã€ä»¥ä¸‹ã‚ˆã‚Šãƒ«ãƒ¼ãƒ—ã«å…¥ã‚Šã¾ã™ã€‚ ä¸€ç•ªå¤–å´ã®ãƒ«ãƒ¼ãƒ—ã¯lambdaã®å€‹æ•°ï¼ˆnlamï¼‰ã«å¯¾ã—ã¦å®Ÿè¡Œã•ã‚Œã¾ã™ãŒã€nlamã®ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã¯ 100 ã¨ãªã£ã¦ã„ã¾ã™ï¼ˆglmnet.rï¼‰ã€‚

ä»¥ä¸‹ã§ã¯ãŠãŠã‚ˆãalmã‚’æ›´æ–°ã™ã‚‹å‡¦ç†ã‚’è¡Œã†ã®ã§ã™ãŒã€lambdaã®æŒ‡å®šã®æœ‰ç„¡ã‚„ã€ãƒ«ãƒ¼ãƒ—ã®å›žæ•°ã«ã‚ˆã£ã¦almã«å…¥åŠ›ã™ã‚‹å€¤ã‚’å¤‰ãˆã¦ã„ã¾ã™ã€‚

ã¾ãšã¯lambdaã®æŒ‡å®šã®æœ‰ç„¡ã§å‡¦ç†ã‚’åˆ†ã‘ã¾ã™ã€‚ä»¥ä¸‹ã®ã¾ã¨ã¾ã‚Šã¯flminãŒ 1.0 ã‚ˆã‚Šå°ã•ã„å ´åˆã«ã‚¹ã‚ãƒƒãƒ—ã•ã‚Œã¾ã™ãŒã€å…ˆã»ã©è¿°ã¹ãŸã‚ˆã†ã«ã€flminã¯glmnet.rã«ãŠã„ã¦lambdaã®æŒ‡å®šãŒãªã„å ´åˆã«ç›¸å½“ã—ã¾ã™ã€‚ lambdaã®æŒ‡å®šãŒã‚ã‚‹å ´åˆã«ã¯alm = ulam(m)ã¨ã—ã¦almã‚’æ›´æ–°ã—ãŸä¸Šã§ã€10291 ã¾ã§ã‚¹ã‚ãƒƒãƒ—ã™ã‚‹ã®ã§ã™ãŒã€ã“ã® 10291 ã¯ 2 ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—ã®ä¸ã«ã‚ã‚Šã¾ã™ã®ã§ã€å°‘ã—å¤§ãã‚ã®ã‚¹ã‚ãƒƒãƒ—ã¨ãªã‚‹ã‚ˆã†ã§ã™ã€‚ ãªãŠulamã¯lambdaãŒæŒ‡å®šã•ã‚Œã¦ã„ã‚‹å ´åˆã€lambdaã®é™é †ã«ãªã£ã¦ã„ã‚‹ãŸã‚ã€ãƒ«ãƒ¼ãƒ—ã® 1 å›žç›®ã§ã‚ã‚Œã°lambdaã®æœ€å¤§å€¤ãŒå…¥ã‚Šã¾ã™ã€‚

      do 10281 m=1,nlam ! nlambda ãªã®ã§ lambda ã®å€‹æ•°ã ã‘ãƒ«ãƒ¼ãƒ—

      if(itrace.ne.0) call setpb(m-1)  ! ãƒ—ãƒã‚°ãƒ¬ã‚¹ãƒãƒ¼
      if(flmin .lt. 1.0)goto 10301
      alm=ulam(m) ! flmin ãŒ 1.0 ä»¥ä¸Šã®å ´åˆã¯ alm = ulam(m) ã¨ã™ã‚‹
      goto 10291

lambdaã®æŒ‡å®šãŒãªã‘ã‚Œã°ä»¥ä¸‹ã®å‡¦ç†ã«å…¥ã‚‹ã®ã§ã™ãŒã€ã“ã“ã§ã¯ãƒ«ãƒ¼ãƒ—ã®å›žæ•°ã«ã‚ˆã£ã¦almã«å…¥åŠ›ã™ã‚‹å€¤ã‚’å¤‰ãˆã¦ã„ã¾ã™ã€‚ å…·ä½“çš„ã«ã¯ã€ãƒ«ãƒ¼ãƒ—ã® 1 å›žç›®ã«ã¯bigï¼ˆ9.9d35ï¼‰ã¨ã„ã†æ¥µç«¯ã«å¤§ããªå€¤ã‚’å…¥åŠ›ã—ã€ 2 å›žç›®ã«ã¯ 0.0 ã‚’ã€3 å›žç›®ä»¥é™ã¯ å…ƒã®å€¤ã«alfã‚’ä¹—ã˜ãŸã‚‚ã®ã‚’å…¥åŠ›ã—ã¾ã™ã€‚

10301 if(m .le. 2)goto 10311 ! ãƒ«ãƒ¼ãƒ—ã®ï¼‘å›žç›®ã¨ï¼’å›žç›®ã¯ã“ã“ã‚’ã‚¹ã‚ãƒƒãƒ—
      alm=alm*alf ! ãƒ«ãƒ¼ãƒ—ã®ï¼“å›žç›®ã‹ã‚‰ã¯ alm ã‚’ alf ã‚’ä¹—ã˜ã‚‹
      goto 10291
10311 if(m .ne. 1)goto 10321 ! ãƒ«ãƒ¼ãƒ—ã®ï¼’å›žç›®ã¯ã“ã“ã‚’ã‚¹ã‚ãƒƒãƒ—
      alm=big     ! ãƒ«ãƒ¼ãƒ—ã®ï¼‘å›žç›®ã¯ alm = big(9.9d35) ã«ã™ã‚‹ 
      goto 10331
10321 continue
      alm=0.0     ! ãƒ«ãƒ¼ãƒ—ã®ï¼’å›žç›®ã¯ alm ã‚’ ã„ã£ãŸã‚“ 0 ã«ã™ã‚‹

ã“ã®alfã¯å…ˆã»ã©èª¬æ˜Žã—ãŸé€šã‚Šeqs^(1.0/(nlam-1))ã¨ã—ã¦å®šç¾©ã•ã‚Œã¾ã™ãŒã€eqsãŒ 0.01 or 1e-4 ã¨ã™ã‚‹ã¨ã€nlambdaã‚’ 10 ã¨ã—ãŸå ´åˆã«ã¯ä»¥ä¸‹ã®ã‚ˆã†ãªæ•°å€¤ã«ãªã‚Šã¾ã™ï¼š

0.01^(1/(10-1))
# [1] 0.5994843
1e-4^(1.0/(10-1))
# [1] 0.3593814

ã¤ã¾ã‚Šalmã¯ã ã‚“ã ã‚“çµ¶å¯¾å€¤ãŒå°ã•ããªã‚‹ã‚ã‘ã§ã™ãã€‚

ãƒ«ãƒ¼ãƒ—â‘¡ï¼ˆç½°å‰‡ã®å®šç¾©ï¼‰

ç¶šã„ã¦ 2 ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—ã«å…¥ã‚Šã¾ã™â€¦ã¨è¨€ã„ã¤ã¤ 2 ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—ã¯ä¸€çž¬ã§çµ‚ã‚ã‚Šã¾ã™ã€‚ å…ˆã»ã©æ›´æ–°ã—ãŸalmã«ã¤ã„ã¦å¤‰æ•°ã”ã¨ã®å†…ç©ã¨æ¯”è¼ƒã—ã€å¤§ãã„æ–¹ã‚’æŽ¡ç”¨ã—ã¾ã™ã€‚ ã—ãŸãŒã£ã¦ã“ã“ã§ã¯å„å¤‰æ•°ã«å¯¾ã™ã‚‹ãƒ«ãƒ¼ãƒ—ã¨ãªã‚Šã¾ã™ã€‚

ã¾ãšjuã¨vpã§ã™ãŒã€juã¯å‰å›žè¨˜äº‹ã§ç¢ºèªã—ãŸé€šã‚Šã€chkvarsã«ã‚ˆã£ã¦å„å¤‰æ•°åˆ—ã®å†…å®¹ãŒå…¨ãåŒã˜ã§ãªã„ã‹ã‚’ç¢ºèªã—ãŸã‚‚ã®ã§ã—ãŸã€‚ ã‚ã‚‹å¤‰æ•°åˆ—ã®ä¸èº«ãŒå…¨ãåŒã˜ã§ã‚ã‚Œã° 0 ã§ã‚ã£ãŸãŸã‚ã€ã“ã“ã§æ¬¡ã®å¤‰æ•°ã«ã‚¹ã‚ãƒƒãƒ—ã•ã‚Œã¾ã™ã€‚ æ¬¡ã«vpã§ã™ãŒã€ã“ã‚Œã¯ 1 å›žç›®ã®è¨˜äº‹ã§ç¢ºèªã—ãŸé€šã‚Šglmnet.rã«ãŠã„ã¦å„å¤‰æ•°ã«å¯¾ã™ã‚‹ç½°å‰‡ã®é‡ã¿ï¼ˆãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã¯ 1ï¼‰ ãŒå…¥ã£ãŸãƒ™ã‚¯ãƒˆãƒ«ã¨ã—ã¦å®šç¾©ã•ã‚ŒãŸã‚‚ã®ã§ã™ï¼ˆvp = as.double(penalty.factor)ï¼‰ã€‚ ç½°å‰‡ã‚’ã‹ã‘ãªã„å ´åˆã¯ 0 ã¨ãªã‚Šã€ã‚¹ã‚ãƒƒãƒ—ã•ã‚Œã‚‹ã‚ˆã†ã§ã™ã€‚

å¤‰æ•°ã«ãƒãƒ©ã¤ããŒã‚ã‚Šã€ç½°å‰‡ã‚’æ¤œè¨Žã™ã‚‹å ´åˆã«ã¯ã“ã“ã§å†åº¦almã‚’æ›´æ–°ã—ã¾ã™ã€‚ ã“ã“ã§å‡ºã¦ãã‚‹gã¯standardã®ä¸ã§yã¨xã®å†…ç©ï¼ˆå…±åˆ†æ•£ï¼‰ã‚’æ ¼ç´ã—ãŸã‚‚ã®ã¨ã—ã¦å®šç¾©ã•ã‚ŒãŸã‚‚ã®ã§ã—ãŸã€‚ ãã‚Œã‚’ç½°å‰‡ã®å¤§ãã•ã§é™¤ã—ã¦ã„ã‚‹ãŸã‚ã€penalty.factorã‚’å°ã•ãã™ã‚‹ï¼ˆåˆ†æ¯ãŒå°ã•ããªã‚‹ï¼‰ã¨å…±åˆ†æ•£ãŒå¤§ãããªã‚Šå¤‰æ•°ã¨ã—ã¦æ®‹ã‚Šã‚„ã™ã„ã€ã¨ã„ã†ãƒã‚¸ãƒƒã‚¯ã«ãªã£ã¦ã„ã‚‹ã‚ˆã†ã§ã™ãã€‚

ã¡ãªã¿ã«ãƒ«ãƒ¼ãƒ—â‘ ã® 1 å›žç›®ã®ãƒ«ãƒ¼ãƒ—ã¯almã« 9.9d35 ã¨ã„ã†æ•°å€¤ãŒå…¥ã‚‹ã®ã§å¿…ãšã“ã®æ•°å€¤ãŒæŽ¡ç”¨ã•ã‚Œã‚‹ã¨æ€ã„ã¾ã™ã€‚ã¾ãŸãƒ«ãƒ¼ãƒ— 2 å›žç›®ã¯ä»Šåº¦ã¯almãŒ 0.0 ã«ãªã‚‹ãŸã‚ã€ä»Šåº¦ã¯å¿…ãšå¤‰æ•°ã®å…±åˆ†æ•£å´ã®æ•°å€¤ãŒalmã«ãªã‚‹ã¨æ€ã‚ã‚Œã¾ã™ã€‚

      ! ï¼’ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—
      ! alm ã®æ›´æ–°
      do 10341 j=1,ni  ! ni ã¯å¤‰æ•°ã®æ•°
      if(ju(j).eq.0) goto 10341
      if(vp(j).le.0.0) goto 10341
      alm=max(alm,abs(g(j))/vp(j))
10341 continue  ! ï¼’ç•ªç›®ã®ãƒ«ãƒ¼ãƒ—ã“ã“ã¾ã§

ä¸Šè¨˜ã®å‡¦ç†ã§å¤‰æ•°ã‚’æ¨ªæ–ã—ã¦almã‚’æ›´æ–°ã—ãŸã®ã¡ã€ä»¥ä¸‹ã§ã•ã‚‰ã«almã‚’æ›´æ–°ã—ã¾ã™ã€‚ ã“ã“ã§ã¯btaï¼ˆalpha; L1 ã¨ L2 ã¸ã®é‡ã¿ã®é…åˆ†ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ï¼‰ã¨ 0.001 ã® max ã§ alm ã‚’é™¤ã—ã€alfã‚’ä¹—ã˜ã¦ã„ã¾ã™ã€‚ ä¸€å¿œã“ã“ã§å¼ã‚’ç¢ºèªã—ã¦ãŠãã¨ä»¥ä¸‹ã®ã‚ˆã†ã«ãªã‚Šã¾ã™ï¼š

$alm = alf * alm/max(bta, 1.0d-3) = eqs^{(1.0/(nlam-1))} * alm/max((1-alpha), 0.001)$

ä¸€ä½“ã“ã‚Œã¯ä½•ã‚’ã‚„ã£ã¦ã„ã‚‹ã‚“ã§ã—ã‚‡ã†ã‹â€¦ã€‚

      continue
      alm=alf*alm/max(bta,1.0d-3)

ç¶šã„ã¦ã„ãã¤ã‹ã®å¤‰æ•°ã‚’æ›´æ–°ã—ã¾ã™ã€‚ demã¯alm * ombã¨ã—ã¦å®šç¾©ã•ã‚Œã¾ã™ãŒã€ã“ã“ã§ombã¯ (1-bta)ã§ã—ãŸã€‚ ã¾ãŸabã¯almã«btaã‚’ä¹—ã˜ãŸã‚‚ã®ã§ã™ã®ã§ã€ã“ã‚Œã‚‰ã¯ãã‚Œãžã‚Œã€ŒlambdaÃ—(1-alpha)ã€ãŠã‚ˆã³ã€ŒlambdaÃ—alphaã€ã¨ã„ã†ã“ã¨ã«ãªã‚Šã€demã¨abãŒå®Ÿè³ªçš„ãªç½°å‰‡ã®å¤§ãã•ã‚’è¡¨ã™ã“ã¨ã«ãªã‚Šãã†ã§ã™ãã€‚

10331 continue
10291 continue
      dem=alm*omb ! dem = alm * (1-bta)
      ab=alm*bta  ! ab = alm * bta

ã“ã‚Œã‚‰ãŒã©ã®ã‚ˆã†ã«ä½¿ã‚ã‚Œã¦ã„ã‚‹ã‹å°‘ã—å…ˆã‚’è¦‹ã¦ã¿ã¾ã—ã‚‡ã†ã€‚

! ab
u=g(k)+ak*xv(k)   ! L69ï¼ˆãƒ«ãƒ¼ãƒ—â‘¢ã®ä¸ï¼‰ã€L119ï¼ˆãƒ«ãƒ¼ãƒ—â‘¥ã®ä¸ï¼‰
v=abs(u)-vp(k)*ab ! L70ã€L120ï¼ˆã¨ã‚‚ã«ä¸Šã«åŒã˜ï¼‰

! dem
a(k)=0.0 ! L71ã€L121
if(v.gt.0.0) a(k)=max(cl(1,k),min(cl(2,k),sign(v,u)/(xv(k)+vp(k)*dem))) ! L72ã€L122

ä¸¡æ–¹ã¨ã‚‚vpã«ä¹—ã˜ã¦ãŠã‚Šã€abã¯abs(u)ã‹ã‚‰ã®æ¸›ç®—ã€demã¯xv(k)ã¨ã®åŠ ç®—ã®å¾Œã«sign(v,u)ã¨é™¤ç®—ã—ã€clã¨ã® max/min ã‚’å–ã£ã¦ã„ã¾ã™ã€‚ vpã¯ç½°å‰‡ã®é‡ã¿ã‚’å®šç¾©ã—ãŸã‚‚ã®ã§ã—ãŸã®ã§ã€alphaã¨lambdaã§æ±ºã¾ã‚‹ç½°å‰‡ã®å¤§ãã•ã‚’ãã®ã¾ã¾ä½¿ã†ã‹å¼±ãã™ã‚‹ã‹ã‚’æ±ºã‚ã¦ã„ã¾ã™ã€‚ demã®æ–¹ã¯æ¼”ç®—ã®çµæžœã‚’aã«æ ¼ç´ã—ã¦ã„ã¾ã™ãŒã€å‰è¿°ã®é€šã‚Šaã¯å›žå¸°ä¿‚æ•°ã‚’ä¿å˜ã™ã‚‹å¤‰æ•°ã§ã—ãŸã®ã§ã€sign(v,u)/(xv(k)+vp(k)*dem)ãŒcl(1,k)ã‚ˆã‚Šã‚‚å¤§ãã‘ã‚Œã°aã€ã™ãªã‚ã¡å›žå¸°ä¿‚æ•°ãŒæ›´æ–°ã•ã‚Œã‚‹ã¨ã„ã†ã“ã¨ã«ãªã‚Šã¾ã™ãã€‚

ã¾ãŸã“ã®æ¼”ç®—ãŒå®Ÿè¡Œã•ã‚Œã‚‹ã‹ã®åŸºæº–ã¨ã—ã¦vãŒä½¿ã‚ã‚Œã¦ãŠã‚Šã€ã“ã®vã‚’è¨ˆç®—ã™ã‚‹ãŸã‚ã«abãŒä½¿ã‚ã‚Œã¦ã„ã‚‹ã€ã¨ã„ã†ã“ã¨ã®ã‚ˆã†ã§ã™ã€‚ ã˜ã‚ƒã‚ã“ã®uã¨ã‹vã£ã¦ä½•ãªã®ï¼Ÿã¨ã„ã†è©±ãªã®ã§ã™ãŒã€ã“ã‚Œã¯æ¬¡ã®ãƒ«ãƒ¼ãƒ—ã®è©±ãªã®ã§å°‘ã—ãŠå¾…ã¡ãã ã•ã„ã€‚

æ®‹ã‚‹å¤‰æ•°ã®ã†ã¡rsq0ã¯æ®‹å·®å¹³æ–¹å’Œã§ã™ãã€‚ã¾ãŸjzã¯izã¨çµ„ã¿åˆã‚ã›ã¦ä½¿ã‚ã‚Œã¦ã„ã¾ã™ãŒã€ã“ã®æ¡ä»¶åˆ†å²ãŒã¡ã‚‡ã£ã¨ç†è§£å‡ºæ¥ãªã‹ã£ãŸã®ã§ã‚¹ã‚ãƒƒãƒ—ã—ã¾ã™ã€‚ ä¸€å¿œã€izã¯ãƒ«ãƒ¼ãƒ—â‘ ã®é€”ä¸ï¼ˆãƒ«ãƒ¼ãƒ—â‘¢ãŒçµ‚äº†ã—ãŸæ™‚ç‚¹ï¼‰ã§ 1 ã«ãªã‚‹ãŸã‚ã€iz * jzãŒ 0 ã«ãªã‚‹ã®ã¯ã»ã¼jzãŒ 0 ã®æ™‚ã«é™ã‚‹ã¨è¨€ãˆãã†ã§ã™ã€‚ nlpã¯ iteration ã®ã‚«ã‚¦ãƒ³ã‚¿ãƒ¼ã¨ã—ã¦ä½¿ã‚ã‚Œã¦ãŠã‚Šã€dlxã¯å›žå¸°ä¿‚æ•°ã®æ›´æ–°å‰å¾Œã®å·®åˆ†ã‚’è¦‹ã¦ã„ã¾ã™ã€‚ ã©ã¡ã‚‰ã‚‚ãƒ«ãƒ¼ãƒ—ã‚’æŠœã‘ã‚‹ãŸã‚ã®åŸºæº–ã¨ã—ã¦ä½¿ã‚ã‚Œã¦ã„ã¾ã™ã€‚

      rsq0=rsq 
      jz=1
      continue
10351 continue
      if(iz*jz.ne.0) goto 10360   ! iz = 0, jz = 1
      nlp=nlp+1 
      dlx=0.0

ã¡ã‚‡ã£ã¨é•·ããªã£ã¦ã—ã¾ã£ãŸã®ã§ä¸€åº¦ãã‚Šã¾ã™ã€‚ æ¬¡å›žã¯ãƒ«ãƒ¼ãƒ—â‘¢ã‹ã‚‰å§‹ã‚ã¾ã™ã€‚

2020-08-24

glmnetã‚’ã‚‚ã†å°‘ã—ç†è§£ã—ãŸã„â‘¢

R glmnet å¤‰æ•°é¸æŠž

å‰å›žã®è¨˜äº‹ã§ã¯ R ã®é–¢æ•° elnet ã®ä¸ã§ elnet ã¨ã„ã† Fortran ã®ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ãŒå‘¼ã°ã‚Œï¼ˆã‚„ã£ã±ã‚Šã‚„ã‚„ã“ã—ã„ã§ã™ãï¼‰ã€ã•ã‚‰ã« type.gaussian ã®å€¤ï¼ˆ covariance ã¨ naive ï¼‰ã«ã‚ˆã£ã¦ elnetu ã¨ elnetn ã®ã„ãšã‚Œã‹ãŒå‘¼ã°ã‚Œã‚‹ã¨ã“ã‚ã¾ã§ç¢ºèªã—ã¾ã—ãŸã€‚ ä»Šå›žã¯ elnetu ã®ä¸èº«ã‚’è¦‹ã¦ã„ãã¾ã™ã€‚ éŽåŽ»ã®è¨˜äº‹ã¯ã“ã¡ã‚‰ã§ã™ã€‚

ushi-goroshi.hatenablog.com

elnetu ã®å®Ÿè£…

`elnetu` ã®å®Ÿè£…

ãã‚Œã§ã¯æ—©é€Ÿ elnetu ã‚’è¦‹ã¦ã„ãã¾ã—ã‚‡ã†ã€‚ elnetu ã¯ elnet ã¨åŒæ§˜ã«ãã‚Œã»ã©å¤§ãããªã„ã®ã§ã„ããªã‚Šå†…å®¹ã®ç¢ºèªã«å…¥ã‚Šã¾ã™ãŒã€å‡¦ç†ã¨ã—ã¦ã¯ä»¥ä¸‹ã®æ‰‹é †ã«ãªã£ã¦ã„ã‚‹ã‚ˆã†ã§ã™ï¼š

å‰å‡¦ç†
æ¨™æº–åŒ–
ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°
å¾Œå‡¦ç†

ã¾ãšã¯å‰å‡¦ç†ã§ã™ãŒã€ãƒ¡ãƒ¢ãƒªã®å‰²ã‚Šä»˜ã‘ã®ã‚ã¨ã« chkvars ã¨ã„ã†ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã‚’å‘¼ã³å‡ºã—ã¦ã„ã¾ã™ã€‚

      subroutine elnetu(parm,no,ni,x,y,w,jd,vp,cl,ne,nx,nlam,  flmin,ulam,thr,isd,intr,maxit,  lmu,a0,ca,ia,nin,rsq,alm,nlp,jerr)
      implicit double precision(a-h,o-z)                                
      double precision x(no,ni),y(no),w(no),vp(ni),ulam(nlam),cl(2,ni)  
      double precision ca(nx,nlam),a0(nlam),rsq(nlam),alm(nlam)         
      integer jd(*),ia(nx),nin(nlam)                                    
      double precision, dimension (:), allocatable :: xm,xs,g,xv,vlam   
      integer, dimension (:), allocatable :: ju                         
      allocate(g(1:ni),stat=jerr)              
      if(jerr.ne.0) return                                              
      allocate(xm(1:ni),stat=jerr)                                      
      if(jerr.ne.0) return                                              
      allocate(xs(1:ni),stat=jerr)                                      
      if(jerr.ne.0) return                                              
      allocate(ju(1:ni),stat=jerr)                                     
      if(jerr.ne.0) return                                              
      allocate(xv(1:ni),stat=jerr)                                    
      if(jerr.ne.0) return                                              
      allocate(vlam(1:nlam),stat=jerr)                                  
      if(jerr.ne.0) return

      ! 1. å‰å‡¦ç†
      call chkvars(no,ni,x,ju)

      if(jd(1).gt.0) ju(jd(2:(jd(1)+1)))=0
      if(maxval(ju) .gt. 0)goto 10071                                   
      jerr=7777                                                         
      return                                                            
10071 continue

ã“ã® chkvars ã§ã¯ x ã®å„å¤‰æ•°ã«ã¤ã„ã¦ä¸€è¡Œç›®ã®å€¤ã¨ç•°ãªã‚‹å€¤ãŒäºŒè¡Œç›®ä»¥é™ã«ã‚ã‚‹ã‹ã‚’ç¢ºèªã—ã€ ju ã«æ ¼ç´ã—ã¦ã„ã¾ã™ã€‚

      subroutine chkvars(no,ni,x,ju)
      implicit double precision(a-h,o-z)
      double precision x(no,ni)
      integer ju(ni)
      
      ! ã“ã“ã‹ã‚‰å„å¤‰æ•°ã®ãƒã‚§ãƒƒã‚¯ã‚’é–‹å§‹
      do 11061 j=1,ni
      ju(j)=0
      t=x(1,j) ! 1è¡Œç›®ã®å€¤ã‚’å–å¾—

      ! ã“ã“ã‹ã‚‰2è¡Œç›®ã®å€¤ã‚’ç¢ºèªã™ã‚‹
      do 11071 i=2,no
      ! t ã¯ x(1, j) ãªã®ã§ã€å„å¤‰æ•° j ã«ã¤ã„ã¦ 1 è¡Œç›®ã®å€¤ã¨ç‰ã—ã„ã‹ã‚’ç¢ºèªã—ã¦ã„ã‚‹
      if(x(i,j).eq.t) goto 11071 ! ç‰ã—ã‘ã‚Œã°æ¬¡ã®è¡Œã¸
      ju(j)=1 ! ç‰ã—ããªã„æ•°å€¤ãŒã‚ã‚Œã° ju ã‚’ 1 ã«ã—ã¦æ¬¡ã®å¤‰æ•°ã¸
      goto 11072
11071 continue
11072 continue
11061 continue
      continue
      return
      end

ç•°ãªã‚‹å€¤ãŒãªã‘ã‚Œã°å…¨ã¦ã®å€¤ã¯åŒã˜ã¨ã„ã†ã“ã¨ã«ãªã‚Šã¾ã™ã®ã§ã€ä¾‹ãˆã°å›žå¸°ä¿‚æ•°ã‚’æŽ¨å®šã™ã‚‹æ„å‘³ã¯ã‚ã‚Šã¾ã›ã‚“ã€‚ å¾Œç¶šã®å‡¦ç†ã§ã¯ã“ã® ju ã‚’å‚ç…§ã—ã¦ã‚¹ã‚ãƒƒãƒ—ã™ã‚‹ã‹ã‚’æ±ºã‚ã¦ã„ã‚‹ç®‡æ‰€ãŒå¤šã€…å‡ºã¦ãã¾ã™ã€‚

ç¶šã„ã¦ standard ã¨ã„ã†ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã‚’å‘¼ã³å‡ºã—ã¦æ¨™æº–åŒ–ã‚’è¡Œã„ã¾ã™ã€‚

      ! 2. æ¨™æº–åŒ–
      call standard(no,ni,x,y,w,isd,intr,ju,g,xm,xs,ym,ys,xv,jerr)

ã“ã® standard ã¨ã†ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã¯çµæ§‹å¤§ããè¦‹ãˆã¾ã™ãŒã€åˆ‡ç‰‡ã®æœ‰ç„¡ã§å‡¦ç†ã‚’åˆ†ã‘ã¦ã„ã‚‹ãŸã‚é‡è¤‡éƒ¨åˆ†ãŒã‚ã‚Šã¾ã™ã€‚ å‡¦ç†ã®å†…å®¹ã¨ã—ã¦ã¯ï¼š

é‡ã¿ã®å¤‰æ›
y ã¨ x ã®æ›´æ–°
y ã¨ x ã®å†…ç©ï¼ˆå…±åˆ†æ•£ï¼‰ã‚’è¨ˆç®—

ã¨ãªã£ã¦ã„ã¾ã™ã€‚

ã¾ãšã¯é‡ã¿ã®å¤‰æ›ã‚’ç¢ºèªã—ã¦ã¿ã‚‹ã¨ã€é‡ã¿ w ã‚’ã€Œé‡ã¿ã®ç·å’Œã‚ãŸã‚Šã®é‡ã¿ã€ã«å¤‰æ›ã—ã€ ã•ã‚‰ã«ãã®å¹³æ–¹æ ¹ã‚’ã¨ã£ãŸã‚‚ã®ã‚’ v ã¨ã—ã¦å®šç¾©ã—ã¦ã„ã¾ã™ã€‚ ã¾ãŸãã®æ¬¡ã‹ã‚‰ã€å…ˆã«è¿°ã¹ãŸã‚ˆã†ã«åˆ‡ç‰‡ã®æœ‰ç„¡ã«ã‚ˆã£ã¦å‡¦ç†ã‚’åˆ†ã‘ã¦ã„ã¾ã™ã€‚

      subroutine standard(no,ni,x,y,w,isd,intr,ju,g,xm,xs,ym,ys,xv,jerr)
      implicit double precision(a-h,o-z)                                
      double precision x(no,ni),y(no),w(no),g(ni),xm(ni),xs(ni),xv(ni)  
      integer ju(ni)                                                    
      double precision, dimension (:), allocatable :: v                 
      allocate(v(1:no),stat=jerr)                                       
      if(jerr.ne.0) return
      
      ! 1. é‡ã¿ã®å¤‰æ›
      w=w/sum(w)
      v=sqrt(w) 

      ! intr ã¯ intercept ãªã®ã§åˆ‡ç‰‡ãŒ 0 ã§ã‚ã‚‹ã‹ã§åˆ¤å®š
      ! åˆ‡ç‰‡ãŒ 0 ã§ãªã„å ´åˆã¯ 10141 ã«é£›ã°ã•ã‚Œã‚‹
      if(intr .ne. 0) goto 10141

ä»¥é™ã®å‡¦ç†ã§ã¯ã“ã® v ã‚’ y ã‚„ x ã«å¯¾ã—ã¦æŽ›ã‘åˆã‚ã›ã‚‹ã®ã§ã™ãŒã€å…¨ã¦ã®è¦³æ¸¬å€¤ã®é‡ã¿ãŒç‰ã—ã„å˜ç´”ãªãƒ‘ã‚¿ãƒ¼ãƒ³ã‚’æƒ³å®šã™ã‚‹ã¨ w ã«ã¯ $1/n$ ã€v ã«ã¯ãã®å¹³æ–¹æ ¹ãŒå…¥ã‚Šã¾ã™ã€‚ ä¾‹ãˆã°è¦³æ¸¬å€¤ã®æ•°ãŒ 100 ã§ã‚ã‚Œã° $w = 1/100 = 0.01$ ã€$v = sqrt(1/100) = 0.1$ ã¨ãªã‚Šã¾ã™ã€‚

ã§ã¯ã“ã®ã‚ˆã†ãª w ã‚„ v ã‚’ä½¿ã£ã¦ä½•ã‚’ã‚„ã£ã¦ã„ã‚‹ã‹ã¨ã„ã†ã¨ã€ y ã«å¯¾ã—ã¦ã¯ï¼š

y ã« v ã‚’ä¹—ã˜ãŸã‚‚ã®ã‚’æ–°ãŸã« y ã¨ã™ã‚‹
ãã® y ã®å†…ç©ï¼ˆäºŒä¹—å’Œï¼‰ã‹ã‚‰ v ã¨ y ã®å†…ç©ã®äºŒä¹—ã‚’æ¸›ã˜ã€å¹³æ–¹æ ¹ã‚’ã¨ã‚‹ï¼ˆysï¼‰
y ã‚’ ys ã§å‰²ã‚‹

ã¨ã„ã†ã“ã¨ã‚’ã—ã¦ã„ã¾ã™ã€‚

      ! 2. y ã¨ x ã®æ›´æ–°
      ! ä»¥ä¸‹ã®ã‚»ã‚¯ã‚·ãƒ§ãƒ³ã§ã¯ y ã¨ x ãã‚Œãžã‚Œã«ã¤ã„ã¦è¦³æ¸¬å€¤ã®é‡ã¿ã‚’ä½¿ã£ã¦è‰²ã€…ã¨èª¿æ•´ã™ã‚‹
      ! ã¾ãšã¯ y      
      ym = 0.0
      y  = v*y 
      ys = sqrt(dot_product(y,y)-dot_product(v,y)**2)
      y  = y/ys

ãŸã ã“ã®èª¬æ˜Žã ã‘ã§ã¯æ„å‘³ãŒåˆ†ã‹ã‚‰ãªã„ã¨æ€ã„ã¾ã™ã®ã§å°‘ã—å¼ã‚’æ•´ç†ã—ã¦ã¿ã¾ã—ã‚‡ã†ã€‚ ã‚‚ã¨ã® y ãŠã‚ˆã³ w ã‚’ $y0$ ã€ $w0$ ã¨ãŠãã¨ã€

$y_{i} = v_{i} * y0_{i} = \sqrt{w_{i}} * y0 = \sqrt{\frac{w0_{i}}{\sum{w0_{i}}}}y0_{i}$

ã¨ãªã‚Šã¾ã™ã€‚ ã¾ãŸ ys ã®äºŒä¹—ï¼ˆå¹³æ–¹æ ¹ã‚’å–ã‚‹å‰ï¼‰ $ (ys)^{2} $ ã¯ï¼š

$(ys)^{2} = \sum{y_{i}^{2}} - (\sum{v_{i}y_{i}})^2 = \sum{\frac{w_{i}}{\sum{w_{i}}}y0_{i}^{2}} - (\sum{\frac{w_{i}}{\sum{w_{i}}}}y0_{i})^{2}$

ã¨æ›¸ã‘ã¾ã™ã€‚ ã“ã“ã§ $w$ ã¯è¦³æ¸¬å€¤ã«å¯¾ã™ã‚‹é‡ã¿ $w0$ ã‚’ãã®ç·å’Œã§é™¤ã—ãŸå½¢ï¼ˆå˜ç´”ãªãƒ‘ã‚¿ãƒ¼ãƒ³ã§ã¯ $\frac{1}{n}$ ï¼‰ã¨ãªã£ã¦ã„ã‚‹ã“ã¨ã‚’æ€ã„å‡ºã™ã¨ã€ã“ã‚Œã‚’ä¹—ã˜ãŸã‚‚ã®ã®ç·å’Œã¯é‡ã¿ä»˜ãå¹³å‡ã¨ãªã‚Šã¾ã™ã€‚ ãã†ã™ã‚‹ã¨å³è¾ºã®ç¬¬ä¸€é …ã¯ã‚‚ã¨ã‚‚ã¨ã® y ï¼ˆ$y0$ï¼‰ã®äºŒä¹—ã®é‡ã¿ä»˜ãå¹³å‡ã€ç¬¬äºŒé …ã¯é‡ã¿ä»˜ãå¹³å‡ã®äºŒä¹—ãŒå¾—ã‚‰ã‚Œã¦ã„ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ã€‚ äºŒä¹—ã®å¹³å‡ã‹ã‚‰å¹³å‡ã®äºŒä¹—ã‚’å¼•ã„ãŸã‚‚ã®ã¨è¨€ãˆã°åˆ†æ•£ã§ã™ã®ã§ã€ãã®å¹³æ–¹æ ¹ã‚’ã¨ã£ãŸ ys ã¯ $y0$ ã®é‡ã¿ä»˜ãæ¨™æº–åå·®ã‚’å¾—ã¦ã„ã‚‹ã‚ˆã†ã§ã™ ï¼ˆã¨ã“ã‚ã§ $w$ã€$w0$ ã¯æ·»å— $i$ ã‚’ä»˜ã‘ã‚‹ã¹ãã§ã™ãŒã€ã¯ã¦ãªãƒ–ãƒã‚°ã® LaTeX ãŒãªãœã‹å´©ã‚Œã‚‹ã®ã§çœç•¥ã—ã¦ã„ã¾ã™ï¼‰ã€‚

å®Ÿéš›ã«ã‚µãƒ³ãƒ—ãƒ«ãƒ‡ãƒ¼ã‚¿ã§è¨ˆç®—ã—ã¦ã¿ã¾ã—ã‚‡ã†ã€‚ ã¾ãšã¯ä»¥ä¸‹ã®ã‚ˆã†ãªç°¡å˜ãªãƒ‡ãƒ¼ã‚¿ã§äºŒä¹—ã®å¹³å‡ã‹ã‚‰å¹³å‡ã®äºŒä¹—ã‚’å¼•ã„ãŸã‚‚ã®ãŒåˆ†æ•£ã«ãªã‚‹ã“ã¨ã‚’ç¢ºèªã—ã¾ã™ã€‚

# é©å½“ãªãƒ‡ãƒ¼ã‚¿
a <- c(5, 5, 6, 7, 9)

# ä¸€èˆ¬çš„ãªåˆ†æ•£ã®è¨ˆç®—
mean((a - mean(a))^2)
# äºŒä¹—ã®å¹³å‡ã‹ã‚‰å¹³å‡ã®äºŒä¹—ã‚’å¼•ã„ã¦ã¿ã‚‹
mean(a^2) - mean(a)^2
# R ã® var ã‚’ä½¿ã†
var(a) * 4 / 5

[1] 2.24
[1] 2.24
[1] 2.24

ä¸Šã®ä¾‹ã§ã¯ã„ãšã‚Œã‚‚åŒã˜å€¤ã‚’è¿”ã—ã¦ã„ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ã€‚ ãªãŠ var ã‚’ä½¿ã£ãŸè¨ˆç®—ã§ã¯ä¸ååˆ†æ•£ã§ã¯ãªãæ¨™æœ¬åˆ†æ•£ã«ä¿®æ£ã—ã¾ã—ãŸã€‚

ç¶šã„ã¦å…ˆã®è¨ˆç®—ã«ã—ãŸãŒã£ãŸå ´åˆã«ã€ã‚„ã¯ã‚ŠåŒã˜ã‚ˆã†ã«åˆ†æ•£ãƒ»æ¨™æº–åå·®ãŒå¾—ã‚‰ã‚Œã‚‹ã‹ã‚’è¦‹ã¦ã¿ã¾ã™ã€‚

set.seed(123)
n <- 10
y0 <- rnorm(n)
w0 <- rep(1, n)

w <- w0/sum(w0)
v <- sqrt(w)

y <- v*y0
ys <- sqrt(y %*% y - (v %*% y)^2)
y_new <- y/ys[1]

> mean((y0 - mean(y0))^2) # ä¸€èˆ¬çš„ãªåˆ†æ•£ã®è¨ˆç®—
[1] 0.8187336
> mean(y0^2) - mean(y0)^2 # äºŒä¹—ã®å¹³å‡ã‹ã‚‰å¹³å‡ã®äºŒä¹—ã‚’å¼•ã
[1] 0.8187336
> var(y0) * (n-1) / n # R ã® var ã‚’ä½¿ã£ã¦
[1] 0.8187336
> (ys^2)[1] # è¨ˆç®—ã—ãŸå€¤
[1] 0.8187336

$(ys)^{2}$ ãŒ $y0$ ã®åˆ†æ•£ã«ãªã£ã¦ã„ã‚‹ã“ã¨ãŒç¢ºèªã§ãã¾ã™ãã€‚ ã¨ã„ã†ã“ã¨ã§ã€å…ˆã»ã©ã®å‡¦ç†ã§ã¯ w ã‚„ v ã‚’ä½¿ã£ã¦ã‚‚ã¨ã‚‚ã¨ã® y ã®é‡ã¿ä»˜ãæ¨™æº–åå·®ã‚’è¨ˆç®—ã—ã€ãã®å€¤ã§é‡ã¿ä»˜ãã® y ã‚’é™¤ã—ã¦ã„ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã—ãŸã€‚ ã“ã®ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã®åå‰ãŒ standard ãªã®ã§å½“ç„¶ã§ã™ãŒã€æ¨™æº–åŒ–ã‚’ã—ã¦ã„ã‚‹ã‚ˆã†ã§ã™ã€‚

x ã«ã¤ã„ã¦ã‚‚åŸºæœ¬çš„ã«åŒæ§˜ã®å‡¦ç†ã‚’è¡Œã£ã¦ãŠã‚Šã€v ã‚’ä½¿ã£ã¦é‡ã¿ä»˜ãæ¨™æº–åå·®ã‚’è¨ˆç®—ãƒ»æ¨™æº–åŒ–ã‚’ã—ã¦ã„ã¾ã™ã€‚ ãŸã ã—æœ€å¾Œã«é‡ã¿ä»˜ãå¹³å‡ã®äºŒä¹— / åˆ†æ•£ ã« 1 ã‚’åŠ ç®—ã—ãŸã‚‚ã®ã‚’ xv ã«æ ¼ç´ã—ã¦ãŠã‚Šã€ã“ã‚Œã‚’ x ã®åˆ†æ•£ã¨ã—ã¦ã„ã‚‹ã‚ˆã†ãªã®ã§ã™ãŒã€ã“ã‚ŒãŒè‰¯ãã‚ã‹ã‚Šã¾ã›ã‚“ã§ã—ãŸã€‚

ã¡ãªã¿ã« ju ã¯å…ˆã»ã©èª¬æ˜Žã—ãŸã‚ˆã†ã«å„å¤‰æ•°ã«ç•°ãªã‚‹æ•°å€¤ãƒ»ãƒãƒ©ã¤ããŒã‚ã‚‹ã‹ã‚’ç¤ºã™ã‚‚ã®ã§ã€ãƒãƒ©ã¤ããŒãªã‘ã‚Œã°ã•ã£ã•ã¨ãƒ«ãƒ¼ãƒ—ã‚’æŠœã‘ã¦æ¬¡ã®å¤‰æ•°ã«ç§»ã£ã¦ã„ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ã€‚

      ! x
      do 10151 j=1,ni ! ni ã¯ nvars
      if(ju(j).eq.0)goto 10151
      xm(j) = 0.0 
      x(:,j) = v*x(:,j) ! x ã«ã‚‚é‡ã¿ã‚’ä¹—ã˜ã‚‹
      xv(j) = dot_product(x(:,j),x(:,j)) ! x ã®äºŒä¹—ã®é‡ã¿ä»˜ãå¹³å‡

      ! isd ã¯æ¨™æº–åŒ–ã™ã‚‹ã‹ã®æŒ‡å®šã§ã€æ¨™æº–åŒ–ã™ã‚‹å ´åˆã¯ 1 ãŒå…¥ã£ã¦ãŠã‚Š 10171 ã«é£›ã°ã•ã‚Œãªã„
      if(isd .eq. 0) goto 10171 
      xbq = dot_product(v, x(:,j))**2 ! x ã®é‡ã¿ä»˜ãå¹³å‡ã®äºŒä¹—
      vc = xv(j)-xbq ! é‡ã¿ä»˜ãåˆ†æ•£
      xs(j) = sqrt(vc) ! é‡ã¿ä»˜ãæ¨™æº–åå·®ã€‚ ys ã¨å¯¾å¿œã—ã¦ã„ã‚‹ã€‚
      x(:,j) = x(:,j)/xs(j) ! æ¨™æº–åå·®ã§å‰²ã£ã¦æ¨™æº–åŒ–ã€‚ y/ys ã¨å¯¾å¿œã—ã¦ã„ã‚‹ã€‚
      
      ! ã“ã‚Œã¯ã‚ˆãã‚ã‹ã‚‰ãªã„
      xv(j) = 1.0 + xbq/vc ! é‡ã¿ä»˜ãå¹³å‡ã®äºŒä¹— / åˆ†æ•£ ã« 1 ã‚’åŠ ç®—
      goto 10181 
10171 continue
      xs(j)=1.0
10181 continue
      continue
10151 continue
      continue
      goto 10191

åˆ‡ç‰‡ãŒ 0 ã§ãªã„å ´åˆã¯ã“ã¡ã‚‰ã«ãã¾ã™ï¼ˆåŸºæœ¬ã¯ã“ã£ã¡ï¼‰ãŒã€å‡¦ç†ã¯ä¸Šè¨˜ã¨å¤§ä½“åŒã˜ã§ã™ã€‚ yã€x ã¨ã‚‚ã«å€¤ã‚’æ›´æ–°ã™ã‚‹å‰ã«é‡ã¿ä»˜ãå¹³å‡ã‚’å¼•ã„ã¦ã„ã‚‹ã¨ã“ã‚ãŒé•ã†ç‚¹ã§ã™ãã€‚

      ! åˆ‡ç‰‡ãŒ 0 ã§ãªã„å ´åˆã“ã“ã«æ¥ã‚‹
      ! åŸºæœ¬ã¯ã“ã£ã¡
10141 continue
      ! x
      do 10201 j=1,ni
      if(ju(j).eq.0)goto 10201 
      xm(j) = dot_product(w,x(:,j)) ! x ã®é‡ã¿ä»˜ãå¹³å‡
      x(:,j) = v*(x(:,j)-xm(j))  ! é‡ã¿ä»˜ãå¹³å‡ã‚’å¼•ã„ã¦ã‹ã‚‰é‡ã¿ã‚’ä¹—ã˜ã‚‹
      xv(j) = dot_product(x(:,j),x(:,j)) ! äºŒä¹—ã®é‡ã¿ä»˜ãå¹³å‡
      if(isd.gt.0) xs(j) = sqrt(xv(j)) ! é‡ã¿ä»˜ãæ¨™æº–åå·®
10201 continue
      continue
      if(isd .ne. 0)goto 10221
      xs = 1.0
      goto 10231
10221 continue
      do 10241 j=1,ni
      if(ju(j).eq.0)goto 10241
      x(:,j) = x(:,j)/xs(j) ! æ¨™æº–åŒ–ã¯ã“ã“ã§å®Ÿè¡Œ
10241 continue
      continue
      xv=1.0
10231 continue
      continue
      ym = dot_product(w,y) ! y ã®é‡ã¿ä»˜ãå¹³å‡ 
      y  = v*(y-ym)          ! y ã‹ã‚‰é‡ã¿ä»˜ãå¹³å‡ã‚’å¼•ã„ãŸã‚‚ã®ã«é‡ã¿ã‚’ä¹—ã˜ã‚‹
      ys = sqrt(dot_product(y,y)) ! äºŒä¹—å’Œï¼ˆåˆ†æ•£ï¼‰ã®å¹³æ–¹æ ¹ï¼ˆSDï¼‰
      y  = y/ys ! æ¨™æº–åŒ–

æ¬¡ã®å‡¦ç†ã¯å…±é€šã®ã‚‚ã®ã§ã€y ã¨ x ã®å†…ç©ã‚’è¨ˆç®—ã—ã€ g ã«æ ¼ç´ã—ã¾ã™ã€‚ å˜ç´”ã« y ã¨ x ã®å†…ç©ã‚’è¨ˆç®—ã—ã¦ã„ã‚‹ã‚ˆã†ã«è¦‹ãˆã¾ã™ãŒã€ã“ã“ã§ã® y ã¯

$\frac{\sqrt{\frac{w_{i}}{\sum{w_{i}}}}y0_{i}}{SD(y0)}$

ã€x ã¯

$\frac{\sqrt{\frac{w_{i}}{\sum{w_{i}}}}x0_{i}}{SD(x0)}$

ã¨ãªã£ã¦ã„ã‚‹ã®ã§ã€ãã®å†…ç©ã¯é‡ã¿ä»˜ãå…±åˆ†æ•£ã‚’ãã‚Œãžã‚Œã®æ¨™æº–åå·®ã®ç©ã§é™¤ã—ãŸã‚‚ã®ã€ã¤ã¾ã‚Šé‡ã¿ä»˜ãã®ç›¸é–¢ä¿‚æ•°ã¨ãªã£ã¦ã„ã‚‹ã¯ãšã§ã™ã€‚

      ! 3. å†…ç©ï¼ˆé‡ã¿ä»˜ãç›¸é–¢ä¿‚æ•°ï¼‰ã‚’æ ¼ç´
10191 continue                                                          
      continue                                                          
      g = 0.0                                                             
      do 10251 j=1,ni 
      ! j ç•ªç›®ã®å¤‰æ•°ã«ãƒãƒ©ãƒ„ã‚ãŒã‚ã‚‹ãªã‚‰ g ã« y ã¨ x ã®å†…ç©ï¼ˆå…±åˆ†æ•£ï¼‰ã‚’æ ¼ç´ã™ã‚‹
      ! ãŸã ã—ã“ã®æ™‚ç‚¹ã§ã® y ã¨ x ã¯ãã‚Œãžã‚Œæ¨™æº–åå·®ã§é™¤ã—ãŸã‚‚ã®ã¨ãªã£ã¦ã„ã‚‹
      if(ju(j).ne.0) g(j) = dot_product(y, x(:,j))                          
10251 continue 
      continue 
      deallocate(v) 
      return
      end

å…ˆã®ã‚µãƒ³ãƒ—ãƒ«ãƒ‡ãƒ¼ã‚¿ã§ç¢ºã‹ã‚ã¦ã¿ã¾ã—ã‚‡ã†ã€‚ é‡ã¿ãŒå…¨ã¦ç‰ã—ã„ã¨ã„ã†å˜ç´”ãªãƒ‘ã‚¿ãƒ¼ãƒ³ã§ã¯ã€æ›´æ–°ã•ã‚ŒãŸ y ã¨ x ã®å†…ç©ãŒç›¸é–¢ä¿‚æ•°ã«ãªã£ã¦ã„ã‚‹ã“ã¨ãŒç¢ºèªã§ãã¾ã™ã€‚

set.seed(123)
n <- 10
y0 <- rnorm(n)
x0 <- rnorm(n)
w0 <- rep(1, n)

w <- w0/sum(w0)
v <- sqrt(w)

y <- v*(y0 - (w %*% y0)[1])
ys <- sqrt(y %*% y)
y_new <- y/ys[1]

x <- v*(x0 - (w %*% x0)[1])
xs <- sqrt(x %*% x)
x_new <- x/xs[1]

> (y_new %*% x_new)[1] # å†…ç©
[1] 0.5776151
> cor(y_new, x_new) # æ›´æ–°å¾Œã® y ã¨ ï½˜ã®ç›¸é–¢ä¿‚æ•°
[1] 0.5776151
> cor(y0, x0) # å…ƒã®å€¤ã®ç›¸é–¢ä¿‚æ•°
[1] 0.5776151

ä¸€æ–¹é‡ã¿ãŒè¦³æ¸¬å€¤ã«ã‚ˆã£ã¦ç•°ãªã‚‹å ´åˆã¯ã¨ã„ã†ã¨ã€ã“ã‚Œã¯è¿‘ã„å€¤ã«ãªã‚‹ã‚‚ã®ã®å®Œå…¨ã«ä¸€è‡´ã¯ã—ã¾ã›ã‚“ã§ã—ãŸï¼ˆã§ã‚‚ã“ã‚Œãªã‚“ã§ã ã‚ã†ã€ä¸€è‡´ã™ã‚‹ã‚ˆã†ãªæ°—ãŒã™ã‚‹ã‚“ã ã‘ã©ï¼‰ã€‚

set.seed(123)
n <- 10
y0 <- rnorm(n)
x0 <- rnorm(n)
w0 <- rep(1, n) - 0.5 * ifelse(runif(n) > 0.8, 1, 0) # ä¸€éƒ¨ã®ãƒ‡ãƒ¼ã‚¿ã«å¯¾ã—ã¦é‡ã¿ã‚’å°ã•ãã—ã¦ã„ã‚‹

w <- w0/sum(w0)
v <- sqrt(w)

y <- v*(y0 - (w %*% y0)[1])
ys <- sqrt(y %*% y)
y_new <- y/ys[1]

x <- v*(x0 - (w %*% x0)[1])
xs <- sqrt(x %*% x)
x_new <- x/xs[1]

> (y_new %*% x_new)[1]
[1] 0.5687947
> cor(y_new, x_new)
[1] 0.5687133
> cor(y0, x0)
[1] 0.5776151

ã¨ã“ã‚ã§é‡ã¿èª¿æ•´å¾Œã® y ã¨ x ã®å†…ç©ãŒç›¸é–¢ä¿‚æ•°ã¨è¿‘ä¼¼ï¼ˆä¸€è‡´ï¼Ÿï¼‰ã™ã‚‹ãªã‚‰ã€å€‹åˆ¥ã®ãƒ‡ãƒ¼ã‚¿ã®ãƒšã‚¢ãŒç›¸é–¢ã«å¯¾ã—ã¦ã©ã®ã‚ˆã†ãªå½±éŸ¿ã‚’æŒã£ã¦ã„ã‚‹ã‹ã‚’è©•ä¾¡ã§ãã‚‹ã®ã§ã¯ãªã„ã§ã—ã‚‡ã†ã‹ã€‚

å†…ç©ã§ã¯ãªãå„ãƒšã‚¢ã®æŽ›ã‘ç®—èªžã®å€¤ã‚’è¦‹ã¦ã¿ã‚‹ã¨ã€6 ç•ªç›®ã¨ 8 ç•ªç›®ã®å€¤ãŒé«˜ã„å€¤ã‚’ç¤ºã—ã¦ã„ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ã€‚ ã“ã®ãƒ‡ãƒ¼ã‚¿ã®é‡ã¿ä»˜ãç›¸é–¢ä¿‚æ•°ã¯ 0.568 ãã‚‰ã„ã ã£ãŸã®ã§ã€ã“ã® 2 ã¤ã®è¦³æ¸¬å€¤ã®å½±éŸ¿ãŒå¤§ããã†ã§ã™ã€‚

> cbind(1:n, y_new * x_new)
      [,1]          [,2]
 [1,]    1 -0.0744142551
 [2,]    2 -0.0043928887
 [3,]    3  0.0261049036
 [4,]    4  0.0004833048
 [5,]    5 -0.0025033504
 [6,]    6  0.2852904868
 [7,]    7  0.0104270429
 [8,]    8  0.3466035906
 [9,]    9 -0.0413263433
[10,]   10  0.0225221645

å®Ÿéš›ã«ãƒ‡ãƒ¼ã‚¿ã‚’è¦‹ã¦ã¿ã‚‹ã¨ã€ 6 ç•ªã¨ 8 ç•ªã®ãƒ‡ãƒ¼ã‚¿ã¯ä»–ã®è¦³æ¸¬å€¤ã¨æ¯”ã¹ã¦é–¢é€£æ€§ãŒå¼·ãã†ã«è¦‹ãˆã¾ã™ã€‚

> cbind(y_new, x_new)
             y_new       x_new
 [1,] -0.233569767  0.31859541
 [2,] -0.117117800  0.03750829
 [3,]  0.513582873  0.05082900
 [4,] -0.011106121 -0.04351698
 [5,]  0.009617489 -0.26029149
 [6,]  0.568708951  0.50164585
 [7,]  0.126538479  0.08240215
 [8,] -0.481982832 -0.71912020
 [9,] -0.278126098  0.14858851
[10,] -0.136535493 -0.16495465

6 ã¨ 8 ç•ªç›®ã®ãƒ‡ãƒ¼ã‚¿ã‚’å¡—ã‚Šåˆ†ã‘ã¦ã¿ã‚‹ã¨ã‚ã‹ã‚Šã‚„ã™ã„ã§ã™ãã€‚

cols <- c(1, 1, 1, 1, 1, 3, 1, 3, 1, 1) + 1
plot(y ~ x, col = cols, pch = 16)

f:id:ushi-goroshi:20200824113309p:plain

ä»¥ä¸Šã§ y ã¨ x ã«ã¤ã„ã¦æ¨™æº–åŒ–ãŒçµ‚ã‚ã£ãŸã®ã§standard ã‹ã‚‰ elnet ã«å¸°ã£ã¦ãã‚‹ã¨ä»Šåº¦ã¯å›žå¸°ä¿‚æ•°ã®ä¸Šé™ãƒ»ä¸‹é™ã«ã¤ã„ã¦ã‚‚æ¨™æº–åŒ–ã‚’è¡Œã„ã¾ã™ã€‚ ã¾ãŸ flmin ãŒ 1 ä»¥ä¸Šã®å ´åˆã¯ vlam ã‚’æ›´æ–°ã™ã‚‹ã®ã§ã™ãŒã€ flmin ã¯ lambda ãŒæŒ‡å®šã•ã‚ŒãŸå ´åˆã« 1 ãŒå…¥ã‚Šã€ãã†ã§ãªã‘ã‚Œã° $[0, 1)$ ã®å®Ÿæ•°ãŒæœŸå¾…ã•ã‚Œã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã§ã—ãŸã€‚ ãªã®ã§ lambba ãŒæŒ‡å®šã•ã‚ŒãŸå ´åˆï¼ˆ= flmin ãŒ 1 ã®ã¨ãï¼‰ã« vlam ãŒ y ã®é‡ã¿ä»˜ãæ¨™æº–åå·®ã§èª¿æ•´ã•ã‚Œã‚‹äº‹ã«ãªã‚Šã¾ã™ã€‚ ã“ã® vlam ã¯å¾Œç¶šã®å‡¦ç†ï¼ˆãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°ï¼‰ã§ã¯ ulam ã¨ã—ã¦æ¸¡ã•ã‚Œã‚‹ã‚‚ã®ã§ã™ãŒã€ulam ã¯ lambda ã®æŒ‡å®šãŒãªã‘ã‚Œã° 1 ã€æŒ‡å®šãŒã‚ã‚Œã°ãã®é™é †ã¨ãªã‚‹ã‚‚ã®ã§ã—ãŸã€‚ è¦ã™ã‚‹ã« lambda ã®å¤§ãã•ã«ã¤ã„ã¦ã‚‚æ¨™æº–åŒ–ã™ã‚‹ã‚ˆã€ã¨ã„ã†äº‹ã®ã‚ˆã†ã§ã™ãã€‚

      ! jerr ã« 0 ã§ãªã„å€¤ãŒå…¥ã£ã¦ã„ã‚‹ã¨ return
      if(jerr.ne.0) return

      ! cl ã¯ glmnet ã§ cl = rbind(lower.limits, upper.limits) ã¨å®šç¾©ã•ã‚Œã‚‹
      ! å›žå¸°ä¿‚æ•°ã®ä¸Šé™ãƒ»åŠ æ¸›
      cl=cl/ys

      ! æ¨™æº–åŒ–ã®æŒ‡å®šãŒ 0 ã§ã‚ã‚Œã°ä»¥ä¸‹ã¯ã‚¹ã‚ãƒƒãƒ—                     
      if(isd .le. 0) goto 10091
      
      ! èª¬æ˜Žå¤‰æ•°ã”ã¨ã«æ¨™æº–åå·®ã‚’ä¹—ã˜ã‚‹
      do 10101 j=1,ni
      cl(:,j)=cl(:,j)*xs(j)
10101 continue                                                          
      continue                                                          
10091 continue                                                          
      
      ! flmin ã¯ glmnet ã®ãªã‹ã§ flmin = as.double(lambda.min.ratio) ã§å®šç¾©ã•ã‚Œã‚‹
      ! ã“ã“ã§ lambda.min.ratio = ifelse(nobs < nvars, 0.01, 1e-04)
      if(flmin.ge.1.0) vlam=ulam/ys

ã§ã¯ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°ã§ã™ã€‚ ã“ã“ã§å‘¼ã°ã‚Œã‚‹ elnet1 ã“ããŒ {glmnet} ã®æœ¬ä½“ã¨ãªã‚Šã€å›žå¸°ä¿‚æ•°ã®è¨ˆç®—ã¯ã“ã“ã§è¡Œã‚ã‚Œã¾ã™ã€‚ ã“ã®ä¸ã§ã¯ã‚‚ã†ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã¯ã»ã¨ã‚“ã©å‘¼ã°ã‚Œãšã€åˆæœŸãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’å–ã£ã¦ãã‚‹ã‚‚ã®ã¨ãƒ—ãƒã‚°ãƒ¬ã‚¹ãƒãƒ¼ã‚’è¡¨ç¤ºã™ã‚‹ãŸã‚ã®ã‚‚ã®ã ã‘ã§ã™ã€‚ ã‚ˆã†ã‚„ããŸã©ã‚Šç€ãã¾ã—ãŸã€ä»Šå›žã‚‚é•·ã‹ã£ãŸã§ã™ãã€‚

      ! 3. ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°
      ! æœ¬ä½“ã§ã‚ã‚‹ elnet1 ã®å‘¼ã³å‡ºã—
      call elnet1(parm,ni,ju,vp,cl,g,no,ne,nx,x,nlam,flmin,vlam,thr,maxi,xv,  lmu,ca,ia,nin,rsq,alm,nlp,jerr)

ã“ã®ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã¯é‡ã¯ãã“ãã“ï¼ˆ180è¡Œç¨‹åº¦ï¼‰ãªã®ã§ã™ãŒã€ãƒ«ãƒ¼ãƒ—ãŒè¾¼ã¿å…¥ã£ã¦ã„ã¦ç´¹ä»‹ãŒé•·ããªã‚‹ã®ã§ä»Šå›žã¯ã“ã“ã¾ã§ã§ã™ã€‚ ã¾ãŸæ¬¡å›žã€‚

2020-06-12

glmnetã‚’ã‚‚ã†å°‘ã—ç†è§£ã—ãŸã„â‘¡

R glmnet å¤‰æ•°é¸æŠž

å‰å›žã®è¨˜äº‹ã§ã¯ glmnet ã®ä¸èº«ã‚’ç¢ºèªã—ã€å¼•æ•°ã® family ã«ã‚ˆã£ã¦å‘¼ã³å‡ºã™é–¢æ•°ã‚’å¤‰ãˆã¦ã„ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã—ãŸã€‚ ä»Šå›žã¯ãã®ãªã‹ã§ã‚‚ gaussian ãŒæŒ‡å®šã•ã‚ŒãŸå ´åˆã®é–¢æ•°ã§ã‚ã‚‹ elnet ã‚’è¦‹ã¦ã„ãã¾ã—ã‚‡ã†ã€‚ ãªãŠå‰å›žã®è¨˜äº‹ã¯ã“ã¡ã‚‰ã§ã™ã€‚

ushi-goroshi.hatenablog.com

`elnet` ã®å®Ÿè£…

ãã‚Œã§ã¯æ—©é€Ÿ elnet ã¨ã„ã†é–¢æ•°ã‚’è¦‹ã¦ã„ãã¾ã—ã‚‡ã†ã€‚ ã¡ãªã¿ã«ã“ã“ã§ã® elnet ã¯ã‚³ãƒ³ã‚½ãƒ¼ãƒ«ã§ elnet ã¨æ‰“ã£ã¦ã‚‚è¡¨ç¤ºã•ã‚Œã¾ã›ã‚“ãŒã€C ã‚„ Fortran ã§æ›¸ã‹ã‚ŒãŸã‚‚ã®ã§ã¯ãªãã¦å˜ã« glmnet ã‹ã‚‰ã‚¨ã‚¯ã‚¹ãƒãƒ¼ãƒˆã•ã‚Œã¦ã„ãªã„é–¢æ•°ãªã®ã§ glmnet:::elnet ã§ä¸èº«ã‚’è¦‹ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚

ã“ã®é–¢æ•°ã¯ãã‚Œã»ã©é•·ããªã„ã®ã§ã„ããªã‚Šå†…å®¹ã®ç¢ºèªã«å…¥ã‚Šã¾ã™ãŒã€ä»–ã®å¤šãã®é–¢æ•°åŒæ§˜ã« elnet ã§ã‚‚æœ€åˆã¯ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®å—ã‘å–ã‚Šãƒ»ç¢ºèªã‚’è¡Œã„ã¾ã™ã€‚ ä¸‹ã®ãƒ–ãƒãƒƒã‚¯ã§ã¯åå¾©å›žæ•°ï¼ˆ maxit ï¼‰ã€è¦³æ¸¬å€¤ã®é‡ã¿ï¼ˆ weights ï¼‰ã‚’å—ã‘å–ã£ãŸå¾Œã€ type.gaussian ã®æŒ‡å®šå†…å®¹ã«ã‚ˆã£ã¦ ka ã¨ã„ã†ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã«æ ¼ç´ã™ã‚‹å€¤ã‚’å¤‰ãˆã¦ã„ã¾ã™ã€‚

function (x, is.sparse, ix, jx, y, weights, offset, type.gaussian = c("covariance", 
    "naive"), alpha, nobs, nvars, jd, vp, cl, ne, nx, nlam, flmin, 
    ulam, thresh, isd, intr, vnames, maxit) 
{
    # 1. ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®å—ã‘å–ã‚Š
    ### maxit
    maxit = as.integer(maxit)
    ### weights
    weights = as.double(weights)
    ### type.gaussian
    type.gaussian = match.arg(type.gaussian)
    ka = as.integer(switch(type.gaussian, covariance = 1, naive = 2, 
        ))

ka ã¯ã•ã‚‰ã«å…ˆã®å‡¦ç†ã§ elnetu ã¨ elnetn ã¨ã„ã†ï¼’ã¤ã®ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã®ã©ã¡ã‚‰ã‚’å‘¼ã¶ã‹ã‚’æ±ºã‚ã¦ã„ã¾ã™ã®ã§ã€ type.gaussian ã®æŒ‡å®šã«åˆã‚ã›ã¦ã‚µãƒ–ãƒ«ãƒ¼ãƒãƒ³ã‚’å¤‰æ›´ã—ã¦ã„ã‚‹ã¨ã„ã†ã“ã¨ã§ã™ãã€‚

ä»¥ä¸‹ã§ã¯ y ãŠã‚ˆã³ offset ï¼ˆå˜åœ¨ã™ã‚‹å ´åˆï¼‰ã‚’ double ã«å¤‰æ›ã—ã¦ã„ã¾ã™ã€‚ ã¾ãŸ y ã®é‡ã¿ä»˜ãå¹³å‡ã‚’ä½¿ã£ã¦ Null Deviance ï¼ˆæ®‹å·®é€¸è„±åº¦ï¼‰ã‚’è¨ˆç®—ã—ã¦ã„ã¾ã™ã€‚

### y ã® storage.mode
storage.mode(y) = "double"
### offset
if (is.null(offset)) {
  is.offset = FALSE
}
else {
  storage.mode(offset) = "double"
  is.offset = TRUE
  y = y - offset
}
### é‡ã¿ä»˜ãå¹³å‡
ybar = weighted.mean(y, weights)
### Null Devianceï¼ˆå¸°ç„¡ãƒ¢ãƒ‡ãƒ«ã®æ®‹å·®é€¸è„±åº¦ï¼‰
nulldev = sum(weights * (y - ybar)^2)
if (nulldev == 0) 
  stop("y is constant; gaussian glmnet fails at standardization step")

æ¬¡ã®ãƒ–ãƒãƒƒã‚¯ã§æ—©é€Ÿãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°ã«å…¥ã‚Šã¾ã™ã€‚ is.sparse ãŒæŒ‡å®šã•ã‚Œã¦ã„ã‚‹ã‹å¦ã‹ã§ spelnet ã¨ elnet ã®ã©ã¡ã‚‰ãŒå‘¼ã°ã‚Œã‚‹ã‹ãŒæ±ºã¾ã‚Šã¾ã™ãŒã€å¼•æ•°ã®é•ã„ã¨ã—ã¦ã¯ spelnet ã«ãŠã„ã¦ x ãŒ as.double ã¨ã•ã‚Œã¦ãŠã‚Šã€ ix ã¨ jx ï¼ˆã„ãšã‚Œã‚‚ç–Žè¡Œåˆ—ã«ãŠã„ã¦éžã‚¼ãƒã®è¦ç´ ã®åº§æ¨™ã‚’ç‰¹å®šã™ã‚‹ãŸã‚ã®æ•°å€¤ï¼‰ãŒè¿½åŠ ã•ã‚Œã¦ã„ã¾ã™ã€‚

# 2. ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°
## ç–Žè¡Œåˆ—ã§ã‚ã‚‹ã‹ã§é–¢æ•°ã‚’å¤‰ãˆã‚‹
fit = if (is.sparse) 
  .Fortran("spelnet", ka, parm = alpha, nobs, nvars, x, 
           # ç–Žè¡Œåˆ—ã§ã‚ã‚‹å ´åˆã€ä»¥ä¸‹ã® ix, jx ãŒå¼•æ•°ã¨ã—ã¦è¿½åŠ ã•ã‚Œã‚‹
           # ix, jx ã¯ç–Žè¡Œåˆ—ã«ãŠã‘ã‚‹éžã‚¼ãƒã®è¦ç´ ã®ç´¯ç©å€‹æ•°ã¨è¡Œç•ªå·
           ix, jx, 
           y, weights, jd, vp, cl, ne, nx, nlam, flmin, 
           ulam, thresh, isd, intr, maxit, lmu = integer(1), 
           a0 = double(nlam), ca = double(nx * nlam), ia = integer(nx), 
           nin = integer(nlam), rsq = double(nlam), alm = double(nlam), 
           nlp = integer(1), jerr = integer(1), PACKAGE = "glmnet")
else .Fortran("elnet", ka, parm = alpha, nobs, nvars, as.double(x), 
              y, weights, jd, vp, cl, ne, nx, nlam, flmin, 
              ulam, thresh, isd, intr, maxit, lmu = integer(1), 
              a0 = double(nlam), ca = double(nx * nlam), ia = integer(nx), 
              nin = integer(nlam),  rsq = double(nlam), alm = double(nlam), 
              nlp = integer(1), jerr = integer(1), PACKAGE = "glmnet")
# nx ã¯ éžã‚¼ãƒã®å¤‰æ•°ã®å€‹æ•°
# nlam ã¯æ¤œè¨¼ã™ã‚‹ lambda ã®å€‹æ•°
# ãªã®ã§ ca ã¯å¤‰æ•°ã®æ•° * lambda ã®æ•°

å‡¦ç†ã‚’æŠœã‘ãŸã‚ã¨ã¯ã€ã‚¨ãƒ©ãƒ¼ã‚’ãƒã‚§ãƒƒã‚¯ã—ãŸä¸Šã§å¿…è¦ãªãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã‚’å–å¾—ã—ã¾ã™ã€‚

# 3. å¾Œå‡¦ç†
## ã‚¨ãƒ©ãƒ¼ãƒã‚§ãƒƒã‚¯
if (fit$jerr != 0) {
  errmsg = jerr(fit$jerr, maxit, pmax = nx, family = "gaussian")
  if (errmsg$fatal) 
    stop(errmsg$msg, call. = FALSE)
  else warning(errmsg$msg, call. = FALSE)
}
## ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ï¼ˆåˆ‡ç‰‡ã€å›žå¸°ä¿‚æ•°ã€è‡ªç”±åº¦ã€æ¬¡å…ƒã€lambdaï¼‰ã‚’å–ã£ã¦ãã‚‹
outlist = getcoef(fit, nvars, nx, vnames)

## ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ï¼ˆxxxxxxxxxxï¼‰ã‚’å–ã£ã¦ãã¦ outlist ã«çµåˆã™ã‚‹
dev = fit$rsq[seq(fit$lmu)]

outlist = c(outlist, list(dev.ratio = dev, nulldev = nulldev, 
                          npasses = fit$nlp, jerr = fit$jerr, offset = is.offset))
## elnet ã‚¯ãƒ©ã‚¹ã‚’ä»˜ä¸Žã™ã‚‹
class(outlist) = "elnet"
outlist
}

ãã‚Œã§ã¯æ¬¡ã« elnet ã®æœ¬ä½“ã§ã‚ã‚‹ elnetï¼ˆã‚„ã‚„ã“ã—ã„ã§ã™ãï¼‰ ã®ä¸èº«ã‚’è¦‹ã¦ã„ãã¾ã—ã‚‡ã†ã€‚

`elnet`ï¼ˆäºŒåº¦ç›®ï¼‰ã®å®Ÿè£…

ä¸Šè¨˜ã®ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°ã®ã‚»ã‚¯ã‚·ãƒ§ãƒ³ã§ elnet ã¯ .Fortran("elnet") ã¨ã—ã¦å‘¼ã°ã‚Œã¦ã„ã¾ã—ãŸã€‚ã“ã‚Œã¾ã§ glm ã‚„ GAM ã§è¦‹ã¦ããŸã¨ãã¨åŒã˜ã‚ˆã†ã«ã€ glmnet ã§ã‚‚ã‚„ã¯ã‚Š fortran ã«è¡Œãç€ãã‚ˆã†ã§ã™ãã€‚

ã¨è¨€ã£ã¦ã‚‚ã“ã“ã§ã¯ã¾ã é–¢æ•°è‡ªä½“ã¯å¤§ãããªãã€ä¸‹ã®ã‚ˆã†ã«ï¼ˆã‚³ãƒ¡ãƒ³ãƒˆæŠœãã§ï¼‰30è¡Œç¨‹åº¦ã§æ›¸ã‹ã‚Œã¦ã„ã¾ã™ã€‚

subroutine elnet(ka,parm,no,ni,x,y,w,jd,vp,cl,ne,nx,nlam,  flmin,u
                 *lam,thr,isd,intr,maxit,  lmu,a0,ca,ia,nin,rsq,alm,nlp,jerr)
implicit double precision(a-h,o-z)                                
double precision x(no,ni),y(no),w(no),vp(ni),ca(nx,nlam),cl(2,ni) 
double precision ulam(nlam),a0(nlam),rsq(nlam),alm(nlam)          
integer jd(*),ia(nx),nin(nlam)                                    
double precision, dimension (:), allocatable :: vq;               

! vp ãŒ 0.0 ã ã£ãŸå ´åˆã«ã¯ jerr = 100000 ã¨ã—ã¦ return ã—ã¦ã—ã¾ã†
if(maxval(vp) .gt. 0.0)goto 10021                                 
jerr=10000                                                        
return                                                            
10021 continue                                                          
allocate(vq(1:ni),stat=jerr)

! ã“ã“ã§ã‚‚ jerr ã« 0 ä»¥å¤–ã®æ•°å€¤ãŒå…¥ã£ã¦ã„ãŸã‚‰ return ã—ã¦ã—ã¾ã†
if(jerr.ne.0) return                                              

! vp ã®å€¤ã«ã‚ˆã£ã¦ vq ã‚’ç”Ÿæˆ
! ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã¯ 1
! ni ã¯ nvars ã§å¤‰æ•°ã®æ•°ãªã®ã§ã€ vq ã«ã¯ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã§ã¯å¤‰æ•°ã®æ•°ãŒå…¥ã‚‹
! ã§ã‚‚ãªã‚“ã§ sum(vq) ãªã‚“ã ã‚
vq=max(0d0,vp)                                                    
vq=vq*ni/sum(vq)

! elnetu ã‹ elnetn ã®ã©ã¡ã‚‰ã‚’å‘¼ã¶ã‹ã¯ ka .ne. 1 ã§ã‚ã‚‹ã‹ã§åˆ¤æ–ã—ã¦ã„ã‚‹
! 1 ã§ãªã‘ã‚Œã° elnetn ã€ 1 ãªã‚‰ elnetu
if(ka .ne. 1)goto 10041                                           
call elnetu  (parm,no,ni,x,y,w,jd,vq,cl,ne,nx,nlam,flmin,ulam,thr,
              *isd,intr,maxit,  lmu,a0,ca,ia,nin,rsq,alm,nlp,jerr)
goto 10051                                                        
10041 continue                                                          
call elnetn (parm,no,ni,x,y,w,jd,vq,cl,ne,nx,nlam,flmin,ulam,thr,i
             *sd,intr,maxit,  lmu,a0,ca,ia,nin,rsq,alm,nlp,jerr)
10051 continue                                                          
continue                                                          
deallocate(vq)                                                    
return                                                            
end

goto ã‚’å¤šç”¨ã—ã¦ã„ã¾ã™ãã€‚ã€‚ã€‚ å¤‰æ•°å®£è¨€ä»¥ä¸‹ã§æ°—ã«ãªã‚‹ã¨ã“ã‚ã¨ã—ã¦ã¯ã€ vp ãŒ 0 ã ã£ãŸã¨ãã®æŒ™å‹•ã¨ã€ elnetu ã‚’å‘¼ã¶ã¨ã“ã‚ã§ã—ã‚‡ã†ã‹ã€‚

vp ã¯å‰å›žã®è¨˜äº‹ã§ç¢ºèªã—ãŸé€šã‚Šã€ glmnet ã®ãªã‹ã§ vp = as.double(penalty.factor) ã¨ã—ã¦å®šç¾©ã•ã‚Œã¦ã„ã¾ã™ã€‚ ã“ã® penalty.factor ã¯ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã§ã¯ 1 ãŒå…¥ã‚Šã¾ã™ã®ã§åŸºæœ¬çš„ã«ã¯ goto 10021 ã§é£›ã°ã•ã‚Œã¦ã—ã¾ã„ã¾ã™ã€‚ ã“ã®ã‚»ã‚¯ã‚·ãƒ§ãƒ³ã§å¼•ã£ã‹ã‹ã‚‹ã®ã¯æ˜Žç¤ºçš„ã« penalty.factor ã« 0 ã‚’æŒ‡å®šã—ãŸå ´åˆã§ã™ãã€‚

! vp ã¯å„å¤‰æ•°ã«å¯¾ã™ã‚‹ç½°å‰‡ã®é‡ã¿ï¼ˆãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã¯ 1ï¼‰ ãŒå…¥ã£ãŸãƒ™ã‚¯ãƒˆãƒ«
! vp = as.double(penalty.factor)
! jerr ã®æ•°å€¤ã§å¾Œç¶šã®å‡¦ç†ã§å‡ºåŠ›ã™ã‚‹ã‚¨ãƒ©ãƒ¼ãƒ¡ãƒƒã‚»ãƒ¼ã‚¸ãŒæ±ºã¾ã‚‹
if(maxval(vp) .gt. 0.0)goto 10021                                 
jerr=10000                                                        
return                                                            
10021 continue                                                          
allocate(vq(1:ni),stat=jerr)

ã§ã¯ penalty.factor ã« 0 ã‚’æŒ‡å®šã—ãŸå ´åˆã¯ã©ã†ãªã‚‹ã‹ã¨è¨€ã†ã¨ã€ jerr ã« 10000 ãŒå…¥åŠ›ã•ã‚Œã¦ return ã•ã‚Œã¾ã™ã€‚ ã“ã® jerr ã¯å…ˆã»ã©ç¢ºèªã—ãŸå¾Œå‡¦ç†ã«ãŠã„ã¦ errmsg = jerr(fit$jerr, maxit, pmax = nx, family = "gaussian") ã¨ã—ã¦ã‚¨ãƒ©ãƒ¼ãƒ¡ãƒƒã‚»ãƒ¼ã‚¸ã«å¤‰æ›ã•ã‚Œã‚‹ã®ã§ã—ãŸã€‚ ã¾ãŸã“ã® jerr ã¨ã„ã†é–¢æ•°ã¯ glmnet ã§å®šç¾©ã•ã‚Œã¦ã„ã¾ã™ã®ã§ã€

> glmnet:::jerr
function (n, maxit, pmax, family) 
{
  if (n == 0) 
    list(n = 0, fatal = FALSE, msg = "")
  else {
    errlist = switch(family, gaussian = jerr.elnet(n, maxit, 
                                                   pmax), binomial = jerr.lognet(n, maxit, pmax), multinomial = jerr.lognet(n, 
                                                                                                                            maxit, pmax), poisson = jerr.fishnet(n, maxit, pmax), 
                     cox = jerr.coxnet(n, maxit, pmax), mrelnet = jerr.mrelnet(n, 
                                                                               maxit, pmax))
    names(errlist) = c("n", "fatal", "msg")
    errlist$msg = paste("from glmnet Fortran code (error code ", 
                        n, "); ", errlist$msg, sep = "")
    errlist
  }
}

ã¨ã—ã¦å–ã‚Šå‡ºã›ã¾ã™ã€‚ é–¢æ•°ã‚’ã¿ã¦ã¿ã‚‹ã¨ã€ errlist ã¯ switch(family, ~) ã§æ›´ã«ç•°ãªã‚‹é–¢æ•°ã‚’å‘¼ã³å‡ºã—ã€ãã®çµæžœã‚’æ ¼ç´ã—ã¦ã„ã‚‹ã‚ˆã†ã§ã™ã€‚ ãã®ãŸã‚æ›´ã« jerr.elnet ã‚’ç¢ºèªã™ã‚‹ã¨

> glmnet:::jerr.elnet
function (n, maxit, pmax) 
{
  if (n > 0) {
    if (n < 7777) 
      msg = "Memory allocation error; contact package maintainer"
    else if (n == 7777) 
      msg = "All used predictors have zero variance"
    else if (n == 10000) 
      msg = "All penalty factors are <= 0"
    else msg = "Unknown error"
    list(n = n, fatal = TRUE, msg = msg)
  }
  else if (n < 0) {
    if (n > -10000) 
      msg = paste("Convergence for ", -n, "th lambda value not reached after maxit=", 
                  maxit, " iterations; solutions for larger lambdas returned", 
                  sep = "")
    if (n < -10000) 
      msg = paste("Number of nonzero coefficients along the path exceeds pmax=", 
                  pmax, " at ", -n - 10000, "th lambda value; solutions for larger lambdas returned", 
                  sep = "")
    list(n = n, fatal = FALSE, msg = msg)
  }
}

else if (n == 10000) msg = "All penalty factors are <= 0" ã¨ã€ç½°å‰‡é …ãŒ 0 ã§ã‚ã‚‹ã“ã¨ã‚’æ•™ãˆã¦ãã‚Œã¦ã„ã¾ã™ãã€‚

ã•ã¦ç¶šã„ã¦ elnetu ã®å‘¼ã³ã ã—ã‚’ç¢ºèªã™ã‚‹ã¨ã€elnetu ã¨ elnetn ã®ã„ãšã‚Œã‚’å‘¼ã¶ã‹ã¯ ka ã§æ±ºã¾ã£ã¦ã„ã¾ã™ã€‚ å…ˆã»ã©å°‘ã—è§¦ã‚ŒãŸé€šã‚Šã€ ka ã¯ ka = as.integer(switch(type.gaussian, covariance = 1, naive = 2, )) ã§å®šç¾©ã•ã‚Œã¦ã„ã¾ã™ã€‚ ã¾ãŸ type.gaussian ã¯ glmnet ã®å¼•æ•°ã§ã‚ã‚Šã€type.gaussian = ifelse(nvars < 500, "covariance", "naive") ã¨å®šç¾©ã•ã‚Œã¦ã„ã¾ã™ã€‚ å¤‰æ•°ã®æ•°ãŒ 500 æœªæº€ã§ã‚ã‚Œã° covarinace ã¨ãªã‚Šã€ ka ã«ã¯ 1 ãŒå¼•ãæ¸¡ã•ã‚Œã‚‹ã®ã§ if(ka .ne. 1) ã«ã¯è©²å½“ã›ãšã€ã—ãŸãŒã£ã¦ elnetu ãŒå‘¼ã°ã‚Œã‚‹ã“ã¨ã«ãªã‚‹ã‚ˆã†ã§ã™ãã€‚

! elnetu ã‹ elnetn ã®ã©ã¡ã‚‰ã‚’å‘¼ã¶ã‹ã¯ ka .ne. 1 ã§ã‚ã‚‹ã‹ã§åˆ¤æ–ã—ã¦ã„ã‚‹
! 1 ã§ãªã‘ã‚Œã° elnetn ã€ 1 ãªã‚‰ elnetu
! ka ã¯ elnet ã®ç¬¬ä¸€å¼•æ•°
! ka = as.integer(switch(type.gaussian, covariance = 1, naive = 2, ))
! ã“ã® covariance / naive ã¯å¤‰æ•°ã®æ•°ã§æ±ºã¾ã‚‹
! type.gaussian = ifelse(nvars < 500, "covariance", "naive")
if(ka .ne. 1)goto 10041                                           
call elnetu  (parm,no,ni,x,y,w,jd,vq,cl,ne,nx,nlam,flmin,ulam,thr,
              *isd,intr,maxit,  lmu,a0,ca,ia,nin,rsq,alm,nlp,jerr)
goto 10051                                                        
10041 continue                                                          
call elnetn (parm,no,ni,x,y,w,jd,vq,cl,ne,nx,nlam,flmin,ulam,thr,i
             *sd,intr,maxit,  lmu,a0,ca,ia,nin,rsq,alm,nlp,jerr)

æ¬¡å›žã¯ã“ã® elnetu ã‚’è¦‹ã¦ã¿ã¾ã—ã‚‡ã†ã€‚

2020-04-02

glmnetã‚’ã‚‚ã†å°‘ã—ç†è§£ã—ãŸã„â‘

R glmnet å¤‰æ•°é¸æŠž

ä¹…ã—ã¶ã‚Šã®æ›´æ–°ã§ã™ï¼ˆã„ã¤ã‚‚è¨€ã£ã¦ã„ã¾ã™ï¼‰ã€‚

èƒŒæ™¯

ãƒ‡ãƒ¼ã‚¿ã‚µã‚¤ã‚¨ãƒ³ã‚¹å…¥é–€ã‚·ãƒªãƒ¼ã‚ºã®ã€Œã‚¹ãƒ‘ãƒ¼ã‚¹å›žå¸°åˆ†æžã¨ãƒ‘ã‚¿ãƒ¼ãƒ³èªè˜ã€ã‚’èªã‚“ã§ã„ãŸã‚‰å¤§å¤‰é¢ç™½ã‹ã£ãŸã®ã§ã€ã„ã¤ã‚‚ã®ã‚ˆã†ã« glmnet ã®ä¸èº«ã‚’è¦‹ã¦ã¿ã‚‹ã“ã¨ã«ã—ã¾ã—ãŸã€‚ ãªãŠç§ã¯æ¥å‹™ã§Lasso/Ridgeã‚’ä½¿ã£ãŸçµŒé¨“ãŒã‚ã¾ã‚Šãªã„ãŸã‚ç†è§£ãŒé–“é•ã£ã¦ã„ã‚‹ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ãŒã€ãã®ç‚¹ã‚ã‚‰ã‹ã˜ã‚ã”äº†æ‰¿ãã ã•ã„ã€‚

ã‚¹ãƒ‘ãƒ¼ã‚¹å›žå¸°åˆ†æžã¨ãƒ‘ã‚¿ãƒ¼ãƒ³èªè˜ (ãƒ‡ãƒ¼ã‚¿ã‚µã‚¤ã‚¨ãƒ³ã‚¹å…¥é–€ã‚·ãƒªãƒ¼ã‚º)

ä½œè€…:æ¢…æ´¥ ä½‘å¤ª,è¥¿äº• é¾æ˜ ,ä¸Šç”° å‹‡ç¥
ç™ºå£²æ—¥: 2020/02/28
ãƒ¡ãƒ‡ã‚£ã‚¢: å˜è¡Œæœ¬ï¼ˆã‚½ãƒ•ãƒˆã‚«ãƒãƒ¼ï¼‰

ã“ã¡ã‚‰ã®æœ¬ã§ã™ã€‚è‰¯ã„æœ¬ã§ã™ã€‚

`glmnet` ã®å®Ÿè¡Œçµæžœ

å‰å›žã® GAM ã®æ™‚ã¨åŒæ§˜ã«ã€ã¾ãšã¯ glmnet ã§ã©ã®ã‚ˆã†ãªçµæžœã‚’å¾—ã‚‹ã“ã¨ãŒã§ãã‚‹ã®ã‹ç¢ºèªã—ã¦ã¿ã¾ã—ã‚‡ã†ã€‚ã€Œã‚¹ãƒ‘ãƒ¼ã‚¹å›žå¸°åˆ†æžã¨ãƒ‘ã‚¿ãƒ¼ãƒ³èªè˜ã€ï¼ˆä»¥ä¸‹ã€æ•™ç§‘æ›¸ï¼‰P12 ã‚³ãƒ¼ãƒ‰1.2ã‚’ï¼ˆå°‘ã—æ”¹å¤‰ã—ã¦ï¼‰å®Ÿè¡Œã—ã¦ã¿ã¾ã™ã€‚ ãªãŠã“ã‚Œã‚‰ã®ã‚³ãƒ¼ãƒ‰ã¯ã“ã¡ã‚‰ã‹ã‚‰ãƒ€ã‚¦ãƒ³ãƒãƒ¼ãƒ‰ã™ã‚‹ã“ã¨ã‚‚ã§ãã¾ã™ã€‚ ç’°å¢ƒã¯ä»¥ä¸‹ã®ã‚ˆã†ãªæ„Ÿã˜ã§ã™ã€‚

> sessionInfo()
R version 3.6.0 (2019-04-26)
Platform: x86_64-apple-darwin15.6.0 (64-bit)
Running under: macOS Mojave 10.14.6

Matrix products: default
BLAS:   /System/Library/Frameworks/Accelerate.framework/Versions/A/Frameworks/vecLib.framework/Versions/A/libBLAS.dylib
LAPACK: /Library/Frameworks/R.framework/Versions/3.6/Resources/lib/libRlapack.dylib

locale:
[1] ja_JP.UTF-8/ja_JP.UTF-8/ja_JP.UTF-8/C/ja_JP.UTF-8/ja_JP.UTF-8

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

loaded via a namespace (and not attached):
[1] compiler_3.6.0  tools_3.6.0     grid_3.6.0      lattice_0.20-38

library(glmnet)
library(plotmo)

x <- scale(LifeCycleSavings[, 2:5])
y <- LifeCycleSavings[, 1] - mean(LifeCycleSavings[, 1])

lasso <- glmnet(x, y, family = "gaussian", alpha = 1) # alpha = 1 ã§ lasso
ridge <- glmnet(x, y, family = "gaussian", alpha = 0) # alpha = 0 ã§ ridge

## directoryã¯é©å½“ã«æŒ‡å®š
png("./Image/glmnet_dive_01_01.png", width = 600, height = 400)
plot_glmnet(lasso, xvar = "lambda", label = TRUE)
dev.off()
png("./Image/glmnet_dive_01_02.png", width = 600, height = 400)
plot_glmnet(ridge, xvar = "lambda", label = TRUE)
dev.off()

f:id:ushi-goroshi:20200402204310p:plain

f:id:ushi-goroshi:20200402204326p:plain

çµæžœã®è§£é‡ˆãªã©ã«ã¤ã„ã¦è©³ã—ãã¯æ•™ç§‘æ›¸ã‚’è¦‹ã¦é ‚ãã¨ã—ã¦ã€ glmnet ã¯ç›®çš„é–¢æ•°ã«å›žå¸°ä¿‚æ•°ã®è¦æ¨¡ã«å¿œã˜ãŸç½°å‰‡ã‚’è¨ã‘ã‚‹ã“ã¨ã§ã€å›žå¸°ä¿‚æ•°ã‚’0ã«å‘ã‹ã£ã¦ç¸®å°ã•ã›ãªãŒã‚‰ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°ã‚’è¡Œã„ã¾ã™ã€‚ ã¾ãŸã‚°ãƒ©ãƒ•ã®ã‚ˆã†ã«ç½°å‰‡ã®å¤§ãã•ã‚’è‰²ã€…ã¨å‹•ã‹ã™ã“ã¨ã§å„å¤‰æ•°ã¸ã®å›žå¸°ä¿‚æ•°ãŒã©ã®ã‚ˆã†ã«å¤‰åŒ–ã™ã‚‹ã‹ã‚’è©•ä¾¡ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚ ã“ã®ã‚°ãƒ©ãƒ•ã§ã¯å·¦ã‹ã‚‰å³ã«å‘ã‹ã£ã¦ç½°å‰‡ãŒå¼·ããªã‚Šã¾ã™ãŒã€ãã‚Œã«ã¤ã‚Œã¦Lasso/Ridgeã®ä¸¡æ–¹ã¨ã‚‚å›žå¸°ä¿‚æ•°ãŒ0ã«å‘ã‹ã£ã¦å°ã•ããªã£ã¦ã„ã‚‹ï¼ˆç¸®å°ã—ã¦ã„ã‚‹ï¼‰ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ã€‚

ãªãŠ Lasso ã§ã¯å›žå¸°ä¿‚æ•°ãŒ0ã«åŽæŸã—ã¦ã„ã‚‹ä¸€æ–¹ã€ Ridge ã§ã¯å¾®å°ãªãŒã‚‰æœ€å¾Œã¾ã§ä¿‚æ•°ãŒ0ã¨ãªã‚‰ãšã«æ®‹ã£ã¦ã„ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ãŒï¼ˆã‚°ãƒ©ãƒ•ä¸Šéƒ¨ã® Degrees of Freedom ãŒ 4 ã®ã¾ã¾ã¨ãªã£ã¦ã„ã¾ã™ï¼‰ã€ Lasso ã®ã‚ˆã†ã«ä¸€éƒ¨ã®å›žå¸°ä¿‚æ•°ã‚’æ£ç¢ºã« 0 ã¨æŽ¨å®šã™ã‚‹ã“ã¨ãŒå¯èƒ½ãªæ‰‹æ³•ã‚’ã‚¹ãƒ‘ãƒ¼ã‚¹æŽ¨å®šã¨å‘¼ã³ã¾ã™ã€‚

`glmnet` ã®å®Ÿè£…

ãã‚Œã§ã¯ glmnet ã¨ã„ã†é–¢æ•°ãŒã©ã®ã‚ˆã†ã«å®Ÿè£…ã•ã‚Œã¦ã„ã‚‹ã®ã‹è¦‹ã¦ã„ãã¾ã—ã‚‡ã†ã€‚ ã¾ãšã¯ã„ã¤ã‚‚ã®ã‚ˆã†ã«å…¨ä½“ã‚’çœºã‚ã€è¦‹é€šã—ã‚’ã‚ˆãã—ã¾ã™ã€‚

function (x, y, family = c("gaussian", "binomial", "poisson", 
                           "multinomial", "cox", "mgaussian"), weights, offset = NULL, 
          alpha = 1, nlambda = 100, lambda.min.ratio = ifelse(nobs < 
                                                                nvars, 0.01, 1e-04), lambda = NULL, standardize = TRUE, 
          intercept = TRUE, thresh = 1e-07, dfmax = nvars + 1, pmax = min(dfmax * 
                                                                            2 + 20, nvars), exclude, penalty.factor = rep(1, nvars), 
          lower.limits = -Inf, upper.limits = Inf, maxit = 1e+05, type.gaussian = ifelse(nvars < 
                                                                                           500, "covariance", "naive"), type.logistic = c("Newton", 
                                                                                                                                          "modified.Newton"), standardize.response = FALSE, type.multinomial = c("ungrouped", 
                                                                                                                                                                                                                 "grouped"), relax = FALSE, trace.it = 0, ...) 
{
  
  ### 1. ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®è¨å®šã€å‰å‡¦ç†ã€ã‚¨ãƒ©ãƒ¼ãƒã‚§ãƒƒã‚¯
  family = match.arg(family)
  if (alpha > 1) {
    warning("alpha >1; set to 1")
    alpha = 1
  }
  if (alpha < 0) {
    warning("alpha<0; set to 0")
    alpha = 0
  }
  alpha = as.double(alpha)
  this.call = match.call()
  nlam = as.integer(nlambda)
  y = drop(y)
  np = dim(x)
  if (is.null(np) | (np[2] <= 1)) 
    stop("x should be a matrix with 2 or more columns")
  nobs = as.integer(np[1])
  if (missing(weights)) 
    weights = rep(1, nobs)
  else if (length(weights) != nobs) 
    stop(paste("number of elements in weights (", length(weights), 
               ") not equal to the number of rows of x (", nobs, 
               ")", sep = ""))
  nvars = as.integer(np[2])
  dimy = dim(y)
  nrowy = ifelse(is.null(dimy), length(y), dimy[1])
  if (nrowy != nobs) 
    stop(paste("number of observations in y (", nrowy, ") not equal to the number of rows of x (", 
               nobs, ")", sep = ""))
  vnames = colnames(x)
  if (is.null(vnames)) 
    vnames = paste("V", seq(nvars), sep = "")
  ne = as.integer(dfmax)
  nx = as.integer(pmax)
  if (missing(exclude)) 
    exclude = integer(0)
  if (any(penalty.factor == Inf)) {
    exclude = c(exclude, seq(nvars)[penalty.factor == Inf])
    exclude = sort(unique(exclude))
  }
  if (length(exclude) > 0) {
    jd = match(exclude, seq(nvars), 0)
    if (!all(jd > 0)) 
      stop("Some excluded variables out of range")
    penalty.factor[jd] = 1
    jd = as.integer(c(length(jd), jd))
  }
  else jd = as.integer(0)
  vp = as.double(penalty.factor)
  internal.parms = glmnet.control()
  if (internal.parms$itrace) 
    trace.it = 1
  else {
    if (trace.it) {
      glmnet.control(itrace = 1)
      on.exit(glmnet.control(itrace = 0))
    }
  }
  if (any(lower.limits > 0)) {
    stop("Lower limits should be non-positive")
  }
  if (any(upper.limits < 0)) {
    stop("Upper limits should be non-negative")
  }
  lower.limits[lower.limits == -Inf] = -internal.parms$big
  upper.limits[upper.limits == Inf] = internal.parms$big
  if (length(lower.limits) < nvars) {
    if (length(lower.limits) == 1) 
      lower.limits = rep(lower.limits, nvars)
    else stop("Require length 1 or nvars lower.limits")
  }
  else lower.limits = lower.limits[seq(nvars)]
  if (length(upper.limits) < nvars) {
    if (length(upper.limits) == 1) 
      upper.limits = rep(upper.limits, nvars)
    else stop("Require length 1 or nvars upper.limits")
  }
  else upper.limits = upper.limits[seq(nvars)]
  cl = rbind(lower.limits, upper.limits)
  if (any(cl == 0)) {
    fdev = glmnet.control()$fdev
    if (fdev != 0) {
      glmnet.control(fdev = 0)
      on.exit(glmnet.control(fdev = fdev))
    }
  }
  storage.mode(cl) = "double"
  isd = as.integer(standardize)
  intr = as.integer(intercept)
  if (!missing(intercept) && family == "cox") 
    warning("Cox model has no intercept")
  jsd = as.integer(standardize.response)
  thresh = as.double(thresh)
  if (is.null(lambda)) {
    if (lambda.min.ratio >= 1) 
      stop("lambda.min.ratio should be less than 1")
    flmin = as.double(lambda.min.ratio)
    ulam = double(1)
  }
  else {
    flmin = as.double(1)
    if (any(lambda < 0)) 
      stop("lambdas should be non-negative")
    ulam = as.double(rev(sort(lambda)))
    nlam = as.integer(length(lambda))
  }
  is.sparse = FALSE
  ix = jx = NULL
  if (inherits(x, "sparseMatrix")) {
    is.sparse = TRUE
    x = as(x, "CsparseMatrix")
    x = as(x, "dgCMatrix")
    ix = as.integer(x@p + 1)
    jx = as.integer(x@i + 1)
    x = as.double(x@x)
  }
  if (trace.it) {
    if (relax) 
      cat("Training Fit\n")
    pb <- createPB(min = 0, max = nlam, initial = 0, style = 3)
  }
  kopt = switch(match.arg(type.logistic), Newton = 0, modified.Newton = 1)
  if (family == "multinomial") {
    type.multinomial = match.arg(type.multinomial)
    if (type.multinomial == "grouped") 
      kopt = 2
  }
  kopt = as.integer(kopt)
  
  ### 2. ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°
  fit = switch(family, gaussian = elnet(x, is.sparse, ix, jx, 
                                        y, weights, offset, type.gaussian, alpha, nobs, nvars, 
                                        jd, vp, cl, ne, nx, nlam, flmin, ulam, thresh, isd, intr, 
                                        vnames, maxit), poisson = fishnet(x, is.sparse, ix, jx, 
                                                                          y, weights, offset, alpha, nobs, nvars, jd, vp, cl, ne, 
                                                                          nx, nlam, flmin, ulam, thresh, isd, intr, vnames, maxit), 
               binomial = lognet(x, is.sparse, ix, jx, y, weights, offset, 
                                 alpha, nobs, nvars, jd, vp, cl, ne, nx, nlam, flmin, 
                                 ulam, thresh, isd, intr, vnames, maxit, kopt, family), 
               multinomial = lognet(x, is.sparse, ix, jx, y, weights, 
                                    offset, alpha, nobs, nvars, jd, vp, cl, ne, nx, nlam, 
                                    flmin, ulam, thresh, isd, intr, vnames, maxit, kopt, 
                                    family), cox = coxnet(x, is.sparse, ix, jx, y, weights, 
                                                          offset, alpha, nobs, nvars, jd, vp, cl, ne, nx, nlam, 
                                                          flmin, ulam, thresh, isd, vnames, maxit), mgaussian = mrelnet(x, 
                                                                                                                        is.sparse, ix, jx, y, weights, offset, alpha, nobs, 
                                                                                                                        nvars, jd, vp, cl, ne, nx, nlam, flmin, ulam, thresh, 
                                                                                                                        isd, jsd, intr, vnames, maxit))
  if (trace.it) {
    utils::setTxtProgressBar(pb, nlam)
    close(pb)
  }
  
  ### 3. å¾Œå‡¦ç†
  if (is.null(lambda)) 
    fit$lambda = fix.lam(fit$lambda)
  fit$call = this.call
  fit$nobs = nobs
  class(fit) = c(class(fit), "glmnet")
  if (relax) 
    relax.glmnet(fit, x = x, y = y, weights = weights, offset = offset, 
                 lower.limits = lower.limits, upper.limits = upper.limits, 
                 check.args = FALSE, ...)
  else fit
}

glmnet ã§ã¯ä»¥ä¸Šã®ã‚ˆã†ã«ã€

ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°
å¾Œå‡¦ç†

ã¨ã„ã£ãŸã‚¹ãƒ†ãƒƒãƒ—ã§å‡¦ç†ãŒé€²ã‚“ã§ãŠã‚Šã€ã“ã‚Œã¯éŽåŽ»ã«ã¿ã¦ããŸ glm ã‚„ gam ã¨åŒæ§˜ã§ã™ãã€‚ ãã‚Œã§ã¯å„ã‚¹ãƒ†ãƒƒãƒ—ã‚’ç´°ã‹ãè¦‹ã¦ã„ãã¾ã—ã‚‡ã†ã€‚

ã¾ãšã¯ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®è¨å®šã‚„å‰å‡¦ç†ã«é–¢ã‚ã‚‹éƒ¨åˆ†ã§ã™ãŒã€ã¯ã˜ã‚ã« family ã®æŒ‡å®šãŒå•é¡Œãªã„ã‹ã‚’ãƒã‚§ãƒƒã‚¯ã—ã¾ã™ã€‚

## æŒ‡å®šã—ãŸfamilyãŒå¼•æ•°ã¨ã—ã¦OKã‹ãƒã‚§ãƒƒã‚¯
family = match.arg(family)

glmnet ã§ä½¿ç”¨å¯èƒ½ãª family ã¯ glm ã¨ã¯ç•°ãªã£ã¦ãŠã‚Šã€Gamma / inverse.gaussian / quasi- ãŒä½¿ãˆãªã„ä»£ã‚ã‚Šã«ã€ multinomial / cox / mgaussian ãŒä½¿ãˆã‚‹ã‚ˆã†ã«ãªã£ã¦ã„ã¾ã™ã€‚ ã“ã“ã§ multinomial ã¯å¤šé …åˆ†å¸ƒã€mgaussian ã¯å¤šå¤‰é‡æ£è¦åˆ†å¸ƒã‚’æ„å‘³ã™ã‚‹ã‚ˆã†ã§ã™ã€‚

family ã®ãƒã‚§ãƒƒã‚¯ã«ã¯ match.arg é–¢æ•°ãŒä½¿ã‚ã‚Œã¦ã„ã¾ã™ã€‚ ã“ã®é–¢æ•°ã®æŒ™å‹•ã‚’ç†è§£ã™ã‚‹ã®ã¯å°‘ã—é›£ã—ã„ã®ã§ã™ãŒã€ã“ã¡ã‚‰ã®ãƒ–ãƒã‚°ãŒå‚è€ƒã«ãªã‚Šã¾ã™ã€‚

ç¶šã„ã¦ alpha ã‚’ãƒã‚§ãƒƒã‚¯ã—ã¾ã™ï¼š

## alpha
### Lassoã¨Ridgeãã‚Œãžã‚Œã«å¯¾ã™ã‚‹ãƒšãƒŠãƒ«ãƒ†ã‚£ã®é…åˆ†ã‚’æ±ºã‚ã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿
### glmnetã«ãŠã‘ã‚‹ç½°å‰‡é …ã¯ä»¥ä¸‹ã§å®šç¾©
### alphaã¯0~1ã§ã€1ãªã‚‰Lassoã€0ãªã‚‰Ridgeã«å¯¾å¿œ
if (alpha > 1) {
  warning("alpha >1; set to 1")
  alpha = 1
}
if (alpha < 0) {
  warning("alpha<0; set to 0")
  alpha = 0
}
alpha = as.double(alpha)

glmnet ã«ãŠã„ã¦ã“ã® alpha ã¯ã€å›žå¸°ä¿‚æ•°ã®L1ãŠã‚ˆã³L2ãƒŽãƒ«ãƒ ãã‚Œãžã‚Œã«å¯¾ã™ã‚‹ç½°å‰‡ã®å‰²åˆã‚’ã‚³ãƒ³ãƒˆãƒãƒ¼ãƒ«ã—ã¾ã™ã€‚ ã‚ˆã‚Šå…·ä½“çš„ã«ã¯ã€ glmnet ã§ã¯ç½°å‰‡é …ã¯ä»¥ä¸‹ã«ã‚ˆã£ã¦å®šç¾©ã•ã‚Œã¾ã™ï¼ˆhttps://cran.r-project.org/web/packages/glmnet/glmnet.pdf ã® P19ã‚ˆã‚Šï¼‰ï¼š

$(1 − \alpha)/2||\beta||^{2}_{2} + \alpha||\beta||_{1}$

å†’é ã®ã‚³ãƒ¼ãƒ‰ã§ã¯ alpha = 1 ã¾ãŸã¯ alpha = 0 ã¨ã—ã¾ã—ãŸãŒã€ä¸Šã®å¼ã‹ã‚‰ alpha = 1 ã®ã¨ãã«L2ãƒŽãƒ«ãƒ ã«å¯¾ã™ã‚‹ç½°å‰‡ãŒæ¶ˆãˆã¦L1ãƒŽãƒ«ãƒ ã®ã¿ãŒæ®‹ã‚Šï¼ˆLassoï¼‰ã€é€†ã« alpha = 0 ã¨ã™ã‚‹ã¨L1ãƒŽãƒ«ãƒ ã«å¯¾ã™ã‚‹ç½°å‰‡ãŒæ¶ˆãˆã¦L2ãƒŽãƒ«ãƒ ãŒæ®‹ã‚‹ï¼ˆRidgeï¼‰ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ã€‚ ã¾ãŸ alpha ã‚’ (0, 1) ã¨ã™ã‚‹ã¨ä¸¡è€…ãŒãã‚Œãžã‚Œã®å‰²åˆã§ãƒ–ãƒ¬ãƒ³ãƒ‰ã•ã‚Œã¾ã™ã€‚

ãªãŠã€ã“ã“ã§L2ãƒŽãƒ«ãƒ ã«å¯¾ã™ã‚‹ç½°å‰‡ãŒ1/2ã«ãªã£ã¦ã„ã‚‹ç†ç”±ã¯ã‚ˆãã‚ã‹ã‚Šã¾ã›ã‚“ã§ã—ãŸã€‚ glmnet ã® help ã§å¼•ç”¨ã•ã‚Œã¦ã„ã‚‹ã“ã¡ã‚‰ã®è«–æ–‡ã§ã¯ã™ã§ã« $(1-\alpha)1/2||\beta||^2_2$ ã¨ã—ã¦å®šç¾©ã•ã‚Œã¦ã„ã¾ã™ã€‚ ã¾ãŸscikit-learnã§ã‚‚åŒæ§˜ã«L2ãƒŽãƒ«ãƒ ã«å¯¾ã—ã¦ã¯0.5ã‚’ä¹—ã˜ã¦ã„ã‚‹ã‚ˆã†ã§ã™ï¼ˆhttps://scikit-learn.org/stable/modules/generated/sklearn.linear_model.ElasticNet.htmlï¼‰ã€‚ èª°ã‹ç†ç”±ã‚’æ•™ãˆã¦ãã ã•ã„ã€‚

ç¶šã„ã¦ match.call() ã‚’ç”¨ã„ã¦å¼•æ•°ã®æŒ‡å®šã‚’æ£å¼ãªã‚‚ã®ã«ç›´ã—ã¾ã™ï¼š

## match.call
this.call = match.call()

ã“ã‚Œã ã‘ã ã¨ä½•ã‚’è¨€ã£ã¦ã„ã‚‹ã‹ã¡ã‚‡ã£ã¨ã‚ã‹ã‚‰ãªã„ã¨æ€ã„ã¾ã™ã®ã§ã€ä»¥ä¸‹ã®ä¾‹ã§ç¢ºèªã—ã¦ã¿ã¾ã—ã‚‡ã†ï¼š

myfun <- function(abc, def, ghi) { 
  return(abc + 2*def + 3*ghi)
}

ä¸Šã®ã‚ˆã†ã«å¼•æ•°ã¨ã—ã¦ abc ã€ def ã€ ghi ã‚’å–ã‚‹é–¢æ•°ã‚’å®šç¾©ã—ã¾ã™ã€‚ ã“ã®ã¨ã R ã§ã¯ã€å¼•æ•°ã®æŒ‡å®šãŒãªã„å ´åˆã«ã¯é †ç•ªé€šã‚Šã«å…¥åŠ›ã•ã‚Œã¾ã™ï¼š

> myfun(1, 2, 3)
[1] 14

ä¸€éƒ¨ã®å¼•æ•°ã®ã¿æŒ‡å®šãŒã‚ã‚‹å ´åˆã§ã¯æŒ‡å®šã•ã‚ŒãŸå¼•æ•°ã ã‘ãŒãã®é€šã‚Šã«å…¥åŠ›ã•ã‚Œã€æ®‹ã‚Šã¯é †ç•ªé€šã‚Šã«å‰²ã‚Šå½“ã¦ã‚‰ã‚Œã‚‹ã‚ˆã†ã§ã™ã€‚

> myfun(def = 3, 4, 5)
[1] 25

ã¨ã“ã‚ã§ã“ã®å¼•æ•°ã®æŒ‡å®šã¯ã€ä¸€æ„ã«æ±ºã¾ã‚Œã°æŒ‡å®šã¯çœç•¥ã™ã‚‹ã“ã¨ãŒã§ãã¾ã™ï¼š

> myfun(d = 3, 4, 5)
[1] 25

ä¸€æ–¹ã€ä¾‹ãˆã°ä»¥ä¸‹ã®ã‚ˆã†ãªå‘¼ã³å‡ºã—ã§ã¯ g ã‹ã‚‰å§‹ã¾ã‚‹å¼•æ•°ãŒï¼’ã¤ã‚ã‚‹ãŸã‚ä¸€æ„ã«æ±ºã¾ã‚‰ãšã€ã‚¨ãƒ©ãƒ¼ã¨ãªã£ã¦ã—ã¾ã„ã¾ã™ã€‚

> myfun2 <- function(abc, def, ghi, gjk) {
+   return(abc + 2*def + 3*ghi + 4*gjk)
+ }
> myfun2(g = 3, 4, 5, 6)
 myfun2(g = 3, 4, 5, 6) ã§ã‚¨ãƒ©ãƒ¼:  å¼•æ•° 1 ãŒè¤‡æ•°ã®ä»®å¼•æ•°ã«ä¸€è‡´ã—ã¾ã™

> match.call(myfun, call("myfun", 1, def = 3, ghi = 5))
myfun(abc = 1, def = 3, ghi = 5)

ã•ã‚‰ã«ç¶šã„ã¦ã€ nlambda ã®æŒ‡å®šã§ã™ã€‚ ã“ã“ã§ã¯ $\lambda$ ï¼ˆç½°å‰‡ã®å¤§ãã•ï¼‰ãã®ã‚‚ã®ã§ã¯ãªãã€æ¤œè¨¼ã™ã‚‹ $\lambda$ ã®æ•°ï¼ˆnubmer of lambdaï¼‰ã‚’æŒ‡å®šã—ã¾ã™ï¼ˆãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã¯100ï¼‰ã€‚

## nlambda
nlam = as.integer(nlambda)

ã“ã“ã‹ã‚‰ã¯ y ã€ x ãŠã‚ˆã³ weight ã®ãƒã‚§ãƒƒã‚¯ã§ã™ï¼š

## drop
y = drop(y)

## x
### x ã¯ï¼’åˆ—ä»¥ä¸ŠæŒã¤å¿…è¦ãŒã‚ã‚‹ã®ã§ã€å˜å›žå¸°ã¯ã§ããªã„æ§˜å
np = dim(x)
if (is.null(np) | (np[2] <= 1)) 
  stop("x should be a matrix with 2 or more columns")
### x ã®ãƒ¬ã‚³ãƒ¼ãƒ‰æ•°
nobs = as.integer(np[1])

### weights
### æœªå…¥åŠ›ã®ã¨ãã¯ 1 ã‚’ä¸Žãˆã€weights ã¨ nobs ãŒä¸€è‡´ã—ãªã„ã¨ãã¯ã‚¨ãƒ©ãƒ¼
if (missing(weights)) 
  weights = rep(1, nobs)
else if (length(weights) != nobs) 
  stop(paste("number of elements in weights (", length(weights), 
             ") not equal to the number of rows of x (", nobs, 
             ")", sep = ""))

### å¤‰æ•°ã®æ•°
nvars = as.integer(np[2])

## y
dimy = dim(y)
### y ã®ãƒ¬ã‚³ãƒ¼ãƒ‰æ•° 
nrowy = ifelse(is.null(dimy), length(y), dimy[1])
### y ã¨ x ã§ãƒ¬ã‚³ãƒ¼ãƒ‰æ•°ãŒåˆã‚ãªã„ã¨ãã¯ã‚¨ãƒ©ãƒ¼
if (nrowy != nobs) 
  stop(paste("number of observations in y (", nrowy, ") not equal to the number of rows of x (", 
             nobs, ")", sep = ""))
## å¤‰æ•°å
vnames = colnames(x)
if (is.null(vnames)) 
  vnames = paste("V", seq(nvars), sep = "")

y ã«å¯¾ã™ã‚‹ drop ã§ã™ãŒã€ã“ã‚Œã¯ length ãŒ 1 ã§ã‚ã‚‹ã‚ˆã†ãªå†—é•·ãªæ¬¡å…ƒã‚’è½ã¨ã™é–¢æ•°ã§ã™ã€‚ ç¶šã„ã¦ x ã®è¡Œæ•°ãŒ weight ã‚„ y ã¨åˆã‚ãªã„å ´åˆã«ã‚¨ãƒ©ãƒ¼ã‚’è¿”ã—ã¦ã„ã¾ã™ã€‚

ä»¥ä¸‹ã§ã¯ãƒ¢ãƒ‡ãƒ«ã«å«ã‚ã‚‹å¤‰æ•°ã‚„éžã‚¼ãƒã¨ã™ã‚‹å¤‰æ•°ãªã©ã‚’æŒ‡å®šã—ã¾ã™ ï¼ˆ nx(=pmax) ã®æ–¹ã¯ã¡ã‚‡ã£ã¨ç†è§£ãŒã‚¢ãƒ¤ã‚·ã‚¤ã®ã§ help ã®èª¬æ˜Žã‚’æ›¸ã„ã¦ãŠãã¾ã™ï¼‰ï¼š

## è‡ªç”±åº¦
### ãƒ¢ãƒ‡ãƒ«ã«å«ã¾ã‚Œã‚‹å¤‰æ•°ã®ä¸Šé™ã‚’æŒ‡å®š
### dfmax = nvars + 1
ne = as.integer(dfmax)

### éžã‚¼ãƒã¨ã™ã‚‹å¤‰æ•°ã®æ•°ã®ä¸Šé™(?)
### Limit the maximum number of variables ever to be nonzero
### pmax = min(dfmax * 2 + 20, nvars)
nx = as.integer(pmax)

### é™¤å¤–å¯¾è±¡ã¨ãªã‚‹å¤‰æ•°ã®æŒ‡å®š
if (missing(exclude)) 
  exclude = integer(0)

æ¬¡ã«å¤‰æ•°ã”ã¨ã«ç•°ãªã‚‹ãƒšãƒŠãƒ«ãƒ†ã‚£ã‚’ä¸Žãˆã‚‹ãŸã‚ã« penalty.factor ã‚’æŒ‡å®šã—ã¾ã™ã€‚ ã“ã®æ•°å€¤ãŒ lambda ã«ä¹—ã˜ã‚‰ã‚Œã‚‹ãŸã‚ã€ä¾‹ãˆã°ç‰¹å®šã®å¤‰æ•°ã«å¯¾ã—ã¦ penalty.factor = 0 ã¨ã—ã¦ãŠã‘ã°ç½°å‰‡ã‚’ä¸Žãˆãªã„ã‚ˆã†ã«ã™ã‚‹ã“ã¨ãŒå¯èƒ½ã¨ãªã‚Šã¾ã™ï¼ˆçµæžœã¨ã—ã¦å¸¸ã«ãƒ¢ãƒ‡ãƒ«ã«æŽ¡ç”¨ã•ã‚Œã‚‹ã‚ˆã†ã«ãªã‚‹ï¼‰ï¼š

## å¤‰æ•°ã”ã¨ã«ç•°ãªã‚‹ãƒšãƒŠãƒ«ãƒ†ã‚£ã‚’ä¸Žãˆã‚‹
### ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã¯ 1 ãŒå…¥ã‚‹
### Inf ãŒæŒ‡å®šã•ã‚Œã¦ã„ã‚‹å¤‰æ•°ã¯ exclude ã¨ã—ã¦æ‰±ã‚ã‚Œã‚‹
if (any(penalty.factor == Inf)) {
  exclude = c(exclude, seq(nvars)[penalty.factor == Inf])
  exclude = sort(unique(exclude))
}
if (length(exclude) > 0) {
  jd = match(exclude, seq(nvars), 0)
  if (!all(jd > 0)) 
    stop("Some excluded variables out of range")
  penalty.factor[jd] = 1
  jd = as.integer(c(length(jd), jd))
}
else jd = as.integer(0)
vp = as.double(penalty.factor)

ã“ã‚Œã¯ã›ã£ã‹ããªã®ã§å®Ÿéš›ã«ã‚„ã£ã¦ã¿ã¾ã—ã‚‡ã†ã€‚ å†’é ã®ã‚³ãƒ¼ãƒ‰ã‚’æŒã£ã¦ãã¦ã€ä»¥ä¸‹ã®ã‚ˆã†ã« lambda ã‚’é©å½“ã«è¨å®šã—ã¦ã¿ã¾ã™ã€‚

x <- scale(LifeCycleSavings[, 2:5])
y <- LifeCycleSavings[, 1] - mean(LifeCycleSavings[, 1])

> coef(glmnet(x, y, family = "gaussian", alpha = 1, lambda = 0.3))
5 x 1 sparse Matrix of class "dgCMatrix"
                       s0
(Intercept)  1.182354e-15
pop15       -1.691002e+00
pop75        .           
dpi          .           
ddpi         9.816514e-01

ã“ã®ã¨ãã€2ãƒ»3ç•ªç›®ã®å¤‰æ•°ã§ã‚ã‚‹ pop75 ã¨ dpi ã¯ 0 ã¨æŽ¨å®šã•ã‚Œã¦ã—ã¾ã„ã¾ã—ãŸã€‚ ã“ã“ã§ã“ã‚Œã‚‰ã®å¤‰æ•°ã® penalty.factor ã‚’ 0 ã¨ã™ã‚‹ã¨

> coef(glmnet(x, y, family = "gaussian", alpha = 1, lambda = 0.3,
+             penalty.factor = c(1, 0, 0, 1)))
5 x 1 sparse Matrix of class "dgCMatrix"
                       s0
(Intercept)  9.523943e-16
pop15       -7.827680e-01
pop75        8.127991e-01
dpi         -1.560908e-01
ddpi         6.812498e-01

ã¡ã‚ƒã‚“ã¨æŽ¨å®šã•ã‚Œã‚‹ã‚ˆã†ã«ãªã£ã¦ã„ã¾ã™ã€‚ é€†ã« pop15 ã® penalty.factor ã‚’å¤§ããã™ã‚‹ã¨

> coef(glmnet(x, y, family = "gaussian", alpha = 1, lambda = 0.3,
+             penalty.factor = c(2, 0, 0, 1)))
5 x 1 sparse Matrix of class "dgCMatrix"
                      s0
(Intercept) 7.266786e-16
pop15       .           
pop75       1.374655e+00
dpi         2.586151e-02
ddpi        9.300500e-01

ã“ã®ã‚ˆã†ã«ãƒ¢ãƒ‡ãƒ«ã‹ã‚‰é™¤å¤–ã•ã‚Œã‚‹ã“ã¨ã«ãªã‚Šã¾ã™ã€‚ ã•ã‚‰ã« penalty.factor = Inf ã¨ã™ã‚‹ã¨ã€ãã®å¤‰æ•°ã¯ exclude ã¨ã—ã¦æ‰±ã‚ã‚Œã‚‹ã‚ˆã†ã«ãªã‚Šã¾ã™ã€‚

## å†…éƒ¨ã§ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã§æŒã£ã¦ã„ã‚‹ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ 
internal.parms = glmnet.control()
### ãƒ—ãƒã‚°ãƒ¬ã‚¹ãƒãƒ¼ã‚’è¡¨ç¤ºã™ã‚‹ï¼
if (internal.parms$itrace) 
  trace.it = 1
else {
  if (trace.it) {
    glmnet.control(itrace = 1)
    on.exit(glmnet.control(itrace = 0))
  }
}

æ¬¡ã«ã€å›žå¸°ä¿‚æ•°ã«å¯¾ã™ã‚‹ä¸Šé™ãƒ»ä¸‹é™ã‚’è¨å®šã—ã¾ã™ã€‚ ãªãŠä¸‹é™ã¯ non-positive ã€ä¸Šé™ã¯ non-negative ã—ã‹è¨å®šã§ããªã„ã‚ˆã†ã§ã™ãã€‚

## ä¸Šé™ãƒ»ä¸‹é™
### lower.limit ã¨ã—ã¦ã¯éžæ£ã®å€¤ã®ã¿æŒ‡å®šã§ãã‚‹
if (any(lower.limits > 0)) {
  stop("Lower limits should be non-positive")
}
### upper.limtit ã¯é€†ã«éžè² ã®å€¤ã®ã¿æŒ‡å®šã§ãã‚‹
if (any(upper.limits < 0)) {
  stop("Upper limits should be non-negative")
}
### Inf ï¼ˆãƒ‡ãƒ•ã‚©ãƒ«ãƒˆï¼‰ã«ãªã£ã¦ã„ã‚‹ã‚‚ã®ã«ã¤ã„ã¦ã¯ç‰¹å®šã®å€¤(9.9e35)ã«å·®ã—æ›¿ãˆ  
lower.limits[lower.limits == -Inf] = -internal.parms$big
upper.limits[upper.limits == Inf] = internal.parms$big

### nvars ã¨ã®æ•´åˆæ€§ãƒã‚§ãƒƒã‚¯
if (length(lower.limits) < nvars) {
  ### lower.limits ã¨ã—ã¦ã‚¹ã‚«ãƒ©ãŒæŒ‡å®šã•ã‚Œã¦ã„ã‚‹å ´åˆã¯ nvars å…¨ã¦ã«é©ç”¨
  if (length(lower.limits) == 1) 
    lower.limits = rep(lower.limits, nvars)
  else stop("Require length 1 or nvars lower.limits")
}
### lower.limits ãŒ nvars ã‚ˆã‚Šã‚‚é•·ã„å ´åˆã¯å‰ã‹ã‚‰åˆ©ç”¨ã™ã‚‹
else lower.limits = lower.limits[seq(nvars)]
### nvars ã¨ã®æ•´åˆæ€§ãƒã‚§ãƒƒã‚¯ï¼ˆlower.limits ã¨åŒæ§˜ï¼‰
if (length(upper.limits) < nvars) {
  if (length(upper.limits) == 1) 
    upper.limits = rep(upper.limits, nvars)
  else stop("Require length 1 or nvars upper.limits")
}
else upper.limits = upper.limits[seq(nvars)]
### ä¸Šé™ãƒ»ä¸‹é™
### coefficient limitï¼Ÿ
cl = rbind(lower.limits, upper.limits)

### lower ã¾ãŸã¯ upper ã« 0 ã‚’å«ã‚€å ´åˆ
### 0é™¤ç®—ãŒç™ºç”Ÿã™ã‚‹ã¨ãã®ã‚¨ãƒ©ãƒ¼å¯¾ç–ï¼Ÿ
if (any(cl == 0)) {
  ### fdev ã¯æœ€å°ã¨ãªã‚‹ãƒ‡ãƒ“ã‚¢ãƒ³ã‚¹ã®å¤‰åŒ–é‡(å‰²åˆ)
  ### minimum fractional change in deviance for stopping path; factory default = 1.0e5
  fdev = glmnet.control()$fdev
  if (fdev != 0) {
    glmnet.control(fdev = 0)
    on.exit(glmnet.control(fdev = fdev)) # é–¢æ•°çµ‚äº†æ™‚ã«å®Ÿè¡Œã•ã‚Œã‚‹å‡¦ç†
  }
}
storage.mode(cl) = "double"

æ¨™æº–åŒ–ã¨åˆ‡ç‰‡ã«å¯¾ã™ã‚‹æŒ‡å®šã§ã™ã€‚ æ¨™æº–åŒ–ã®å‡¦ç†ãã®ã‚‚ã®ã¯ä»¥é™ã®é–¢æ•°ã®å†…éƒ¨ã§å®Ÿè¡Œã•ã‚Œã‚‹ãŸã‚ã€ã“ã“ã§ã¯æŒ‡å®šã®ã¿ã‚’è¡Œã„ã¾ã™ã€‚

## æ¨™æº–åŒ–
### standardize ã¨ intercept ã¯ãƒ‡ãƒ•ã‚©ãƒ«ãƒˆã¯ TRUE ãªã®ã§ 1 ã«ãªã‚‹
isd = as.integer(standardize)
intr = as.integer(intercept)
### Coxå›žå¸°ã«ãŠã‘ã‚‹è¦å‘Š
if (!missing(intercept) && family == "cox") 
  warning("Cox model has no intercept")
### standardize.response ã¯ family="mgaussian" ã®ã¨ãã«ç›®çš„å¤‰æ•°ã‚’æ¨™æº–åŒ–ã™ã‚‹ã‹ã®æŒ‡å®š
jsd = as.integer(standardize.response)

åŽæŸã‚’åˆ¤å®šã™ã‚‹é–¾å€¤ã‚’æŒ‡å®šã—ã¾ã™ã€‚

## åŽæŸåˆ¤å®š
### coordinate descent ã«ãŠã‘ã‚‹åŽæŸã®é–¾å€¤
thresh = as.double(thresh)

æ¬¡ã«ã€ lambda ã«é–¢ã™ã‚‹æŒ‡å®šã¨ãªã‚Šã¾ã™ãŒã€ flmin ãŠã‚ˆã³ ulam ã®ä½¿ã‚ã‚Œæ–¹ãŒã‚ˆãç†è§£ã§ããªã‹ã£ãŸãŸã‚ã€ã“ã‚Œã‚‰ã®èª¬æ˜Žã¯çœç•¥ã—ã¾ã™ã€‚ ãªãŠ help ã«ã‚‚ã‚ã‚Šã¾ã™ãŒã€é€šå¸¸ã¯ lambda ã«ã¯å˜ä¸€ã®å€¤ã§ã¯ãªãã€å€™è£œã¨ãªã‚‹å€¤ã®ãƒ™ã‚¯ãƒˆãƒ«ã‚’ä¸Žãˆã¾ã™ã€‚

Avoid supplying a single value for lambda (for predictions after CV use predict() instead).

## lambda
### ãƒšãƒŠãƒ«ãƒ†ã‚£ã®å¤§ãã•
### æŒ‡å®šãŒãªã„å ´åˆã€flmin ã¨ ulam ã¯ lambda.min.ratio ãŠã‚ˆã³ 1 ã«æŒ‡å®šã•ã‚Œã‚‹
### lambda.min.ratio = ifelse(nobs < nvars, 0.01, 1e-04)
if (is.null(lambda)) {
  if (lambda.min.ratio >= 1) 
    stop("lambda.min.ratio should be less than 1")
  flmin = as.double(lambda.min.ratio)
  ulam = double(1)
}
### æŒ‡å®šãŒã‚ã‚‹å ´åˆã€flmin(ä¸‹é™ï¼Ÿ)ã¨ulam(ä¸Šé™ï¼Ÿ)ã¯ 1 ãŠã‚ˆã³ lambdaã®é™é † ã«æŒ‡å®šã•ã‚Œã‚‹
else {
  flmin = as.double(1)
  if (any(lambda < 0)) 
    stop("lambdas should be non-negative")
  ulam = as.double(rev(sort(lambda)))
  nlam = as.integer(length(lambda))
}

æ¬¡ã«ç–Žè¡Œåˆ—ã®æŒ‡å®šã§ã™ã€‚ å…¥åŠ› X ãŒç–Žè¡Œåˆ—ã§ã‚ã‚‹å ´åˆã€dgCMatrix å½¢å¼ã«å¤‰æ›ã•ã‚Œã¾ã™ã€‚ ã“ã“ã§ dgCMatrix ã¨ã¯åˆ—æ–¹å‘ã®å¿—å‘æ€§ã‚’æŒã¤ç–Žè¡Œåˆ—ã®å½¢å¼ã§ã™ã€‚

## sparse matrix 
### x ãŒ Matrix::sparseMatrix ã®å ´åˆã¯ Matrix::dgCMatrix ã«å¤‰æ›ã™ã‚‹
### dgCMatrix: cscé †ã«ä¸¦ã³æ›¿ãˆã¦(cscå½¢å¼)ã®ç–Žè¡Œåˆ—åœ§ç¸®ä¿ç®¡
is.sparse = FALSE
ix = jx = NULL
if (inherits(x, "sparseMatrix")) {
  is.sparse = TRUE
  x = as(x, "CsparseMatrix")
  x = as(x, "dgCMatrix")
  ### x@p ã¯å„åˆ—ã®éžã‚¼ãƒã®å€¤ã®å€‹æ•°ã‚’ç©ã¿ä¸Šã’ãŸã‚‚ã®ãŒæ ¼ç´ã•ã‚Œã¦ã„ã‚‹ï¼ˆåˆ—æ•° + 1ï¼‰
  ### diff(x@p + 1) ã™ã‚Œã°å„åˆ—ã®éžã‚¼ãƒã®å€¤ã®å€‹æ•°ãŒã‚ã‹ã‚‹
  ix = as.integer(x@p + 1)
  ### x@i ã¯å„åˆ—ã®éžã‚¼ãƒã®å€¤ã®è¡Œç•ªå·ãŒæ ¼ç´ã•ã‚Œã¦ã„ã‚‹ï¼ˆãªã®ã§ length(x@i) ãŒéžã‚¼ãƒã®å€¤ã®å€‹æ•°ã¨ä¸€è‡´ã™ã‚‹ï¼‰
  ### 0-index ãªã®ã§ R ã®ã‚¹ã‚¿ã‚¤ãƒ«ã¨åˆã‚ã›ã‚‹ãŸã‚ã« +1 ã—ã¦ã„ã‚‹ã®ã§ã—ã‚‡ã†
  jx = as.integer(x@i + 1)
  ### x@x ã¯éžã‚¼ãƒã§ã‚ã‚‹å€¤ãã®ã‚‚ã®ã®ãƒ™ã‚¯ãƒˆãƒ«
  x = as.double(x@x)
}

ã“ã“ã‚‚ã€ã›ã£ã‹ããªã®ã§ç–Žè¡Œåˆ—ã«ãŠã‘ã‚‹æ•°å€¤ã®æ ¼ç´æ–¹æ³•ã«ã¤ã„ã¦ã‚‚è¦‹ã¦ãŠãã¾ã—ã‚‡ã†ã€‚ ä»¥ä¸‹ã®ã‚ˆã†ã«ç–Žè¡Œåˆ—ã‚’ä½œæˆã—ã¾ã™ï¼š

set.seed(1234)
i <- c(1, 5, 18)
j <- c(4, 13, 19)
n <- rnorm(3)

m <- matrix(0, 20, 20)
for (k in 1:length(n)) {
  m[i[k], j[k]] <- n[k]
}

s_m <- as(m, "dgCMatrix")

ã“ã“ã§ s_m ã¯è¡Œåˆ— m ã‚’ç–Žè¡Œåˆ—ã¨ã—ã¦æ‰±ã£ãŸã‚‚ã®ã§ã™ã€‚ str() ã§ç¢ºèªã™ã‚‹ã¨ã€ s_m ã«ã¯

@ i ï¼šéžã‚¼ãƒã®è¦ç´ ã®å…¥ã£ã¦ã„ãŸè¡Œç•ªå·( 0-index ã§ã‚ã‚‹ã“ã¨ã«æ³¨æ„)
@ Dim ï¼šè¡Œåˆ—ã®æ¬¡å…ƒ
@ Dimnames ï¼šè¡Œåˆ—ã®å„æ¬¡å…ƒã®åå‰
@ x ï¼šéžã‚¼ãƒã®è¦ç´ ã®æ•°å€¤
@ factors ï¼šï¼ˆã“ã‚Œã¯ã¡ã‚‡ã£ã¨ã‚ã‹ã‚Šã¾ã›ã‚“ã§ã—ãŸï¼‰

ãŒæ ¼ç´ã•ã‚Œã¦ã„ã¾ã™ã€‚

> str(s_m)
Formal class 'dgCMatrix' [package "Matrix"] with 6 slots
  ..@ i       : int [1:3] 0 4 17
  ..@ p       : int [1:21] 0 0 0 0 1 1 1 1 1 1 ...
  ..@ Dim     : int [1:2] 20 20
  ..@ Dimnames:List of 2
  .. ..$ : NULL
  .. ..$ : NULL
  ..@ x       : num [1:3] -1.207 0.277 1.084
  ..@ factors : list()

ã“ã“ã§ @ i ã«ã¯éžã‚¼ãƒã§ã‚ã‚‹å„è¦ç´ ã®è¡Œç•ªå·ãŒå…¥ã‚‹ãŸã‚è¡Œåˆ— m ã‚’ä½œã£ãŸã¨ãã®è¡Œç•ªå·ã®æŒ‡å®š i ã«å¯¾å¿œã—ã¾ã™ãŒã€0-index ã§ã‚ã‚‹ãŸã‚æ•°å—ã¯1ã¤ãšã¤å°ã•ããªã£ã¦ã„ã¾ã™ã€‚

> print(i- 1)
[1]  0  4 17
> print(s_m@i)
[1]  0  4 17

ã¡ã‚‡ã£ã¨ã‚ã‹ã‚Šã«ãã„ã®ãŒ @ p ã§ã€ã“ã“ã«ã¯å„åˆ—ã«ãŠã‘ã‚‹éžã‚¼ãƒã®è¦ç´ ã®å€‹æ•°ã®ç´¯ç©ãŒæ ¼ç´ã•ã‚Œã€åˆ—æ•°ã«å¯¾å¿œã—ã¾ã™ï¼ˆãŸã ã—æœ€åˆã« 0 ãŒè¿½åŠ ã•ã‚Œã‚‹ãŸã‚ã€åˆ—æ•° + 1 ã®é•·ã•ã«ãªã‚Šã¾ã™ï¼‰ã€‚ ä»Šå›žã®ä¾‹ã§ã¯è¡Œåˆ—ã®åˆ—æ•°ãŒ 20 ãªã®ã§ã€length ãŒ 21 ã¨ãªã‚Šã¾ã™ã€‚

> length(s_m@p)
[1] 21

ã“ã®ãƒ™ã‚¯ãƒˆãƒ«ã«ã¯éžã‚¼ãƒã®è¦ç´ ã®å€‹æ•°ã®ç´¯ç©ãŒå…¥ã£ã¦ã„ã‚‹ãŸã‚ã€å·®åˆ†ã‚’å–ã‚‹ã¨å…ƒã®è¡Œåˆ—ã§éžã‚¼ãƒã®è¦ç´ ãŒå…¥ã£ã¦ã„ãŸåˆ—ã‚’å¾—ã‚‹ã“ã¨ãŒã§ãã¾ã™ã€‚

> diff(s_m@p)
 [1] 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0

åˆ—ç•ªå·ã‚’æŒ‡å®šã—ãŸ j ã¨æ¯”è¼ƒã—ã¦ã¿ã¾ã—ã‚‡ã†ï¼š

> which(diff(s_m@p) == 1)
[1]  4 13 19
> j
[1]  4 13 19

åˆã£ã¦ã„ã¾ã™ãã€‚ ç¶šãå‡¦ç†ã§ã¯ã€ ix ã«ã¯å„åˆ—ã«ãŠã‘ã‚‹éžã‚¼ãƒã®è¦ç´ ã®ç´¯ç©å€‹æ•°(+1)ã‚’ ã€ jx ã«ã¯è¡Œç•ªå·ã‚’ä»£å…¥ã—ã¦ã„ã¾ã™ã€‚ ã¾ãŸ x ã«ã¯å…ƒã®ç–Žè¡Œåˆ—ã«ãŠã‘ã‚‹éžã‚¼ãƒã®è¦ç´ ã®å€¤ãã®ã‚‚ã®ã‚’ãƒ™ã‚¯ãƒˆãƒ«ã¨ã—ã¦å…¥åŠ›ã—ã¦ãŠã‚Šã€èª¬æ˜Žå¤‰æ•°ã®è¡Œåˆ—ãŒç–Žè¡Œåˆ—ã§ã‚ã£ãŸå ´åˆã€ã“ã®æ™‚ç‚¹ã§è¡Œåˆ—ã§ã¯ãªããƒ™ã‚¯ãƒˆãƒ«ã¨ã—ã¦æ‰±ã‚ã‚Œã‚‹ã“ã¨ã«ãªã‚Šã¾ã™ã€‚

æ¬¡ã«ã€ãƒ—ãƒã‚°ãƒ¬ã‚¹ãƒãƒ¼ã®æŒ‡å®šã§ã™ï¼ˆå‡ºã›ã‚‹ã‚“ã§ã™ãï¼‰ã€‚

## ãƒ—ãƒã‚°ãƒ¬ã‚¹ãƒãƒ¼
if (trace.it) {
  if (relax) 
    cat("Training Fit\n")
  pb <- createPB(min = 0, max = nlam, initial = 0, style = 3)
}

ãã—ã¦æœ€å¾Œã«æœ€é©åŒ–ã®æ‰‹æ³•ã«ã¤ã„ã¦ã®æŒ‡å®šã§ã™ã€‚ family ãŒ `binomial ã¾ãŸã¯ multinomial ã®å ´åˆã€ glmnet ã®å¼•æ•°ã§ã‚ã‚‹ type.logistic ãŠã‚ˆã³ type.multinomial ãŒè©•ä¾¡ã•ã‚Œã€ï¼ˆå¾Œã®å·¥ç¨‹ã§ï¼‰ãã‚Œã«å¿œã˜ã¦å‘¼ã°ã‚Œã‚‹é–¢æ•°ãŒå¤‰ã‚ã‚Šã¾ã™ã€‚ å…·ä½“çš„ã«ã¯ lognet2m ã€ lognetn ãŠã‚ˆã³ multlognetn ã®ã©ã‚ŒãŒé¸ã°ã‚Œã‚‹ã‹ãŒæ±ºã¾ã‚Šã¾ã™ã€‚ ã“ã‚Œã¯åˆ¥ã®æ©Ÿä¼šã«è§£èª¬ã—ã¾ã™ï¼ˆäºˆå®šã§ã™ï¼‰ã€‚

## æœ€é©åŒ–ã®æ‰‹æ³•ï¼ˆãƒã‚¸ã‚¹ãƒ†ã‚£ãƒƒã‚¯ãŠã‚ˆã³å¤šé …ãƒã‚¸ã‚¹ãƒ†ã‚£ãƒƒã‚¯ã®æ™‚ï¼‰
### type.logistic = c("Newton", "modified.Newton")
### Newton ã‚’æŒ‡å®šãªã‚‰ 0ã€modified.Newton ã‚’æŒ‡å®šãªã‚‰ 1 ã‚’è¿”ã™
### If "Newton" then the exact hessian is used (default), while "modified.Newton" uses an upper-bound on the hessian, and can be faster.
kopt = switch(match.arg(type.logistic), Newton = 0, modified.Newton = 1)
### type.multinomial = c("ungrouped", "grouped")
### å¤šé …ãƒã‚¸ã‚¹ãƒ†ã‚£ãƒƒã‚¯ã§æ›´ã«groupedã®å ´åˆã¯ kopt ã¯ 2 ã¨ãªã‚‹
### If "grouped" then a grouped lasso penalty is used on the multinomial coefficients for a variable. This ensures they are all in our out together. 
### The default is "ungrouped"
if (family == "multinomial") {
  type.multinomial = match.arg(type.multinomial)
  if (type.multinomial == "grouped") 
    kopt = 2
}
kopt = as.integer(kopt)

æœ€åˆã®æ–¹ã§ family ã®ãƒã‚§ãƒƒã‚¯ã«ä½¿ã‚ã‚Œã€ã“ã“ã§ã‚‚ä½¿ã‚ã‚Œã¦ã„ã‚‹ match.arg ã§ã™ãŒã€ã›ã£ã‹ããªã®ã§æŒ™å‹•ã‚’ç¢ºèªã—ã¦ãŠãã¾ã—ã‚‡ã†ï¼š

### å¼•æ•°ã« type.logistic ã‚’æŒã¤é–¢æ•°ã‚’å®šç¾©
myfun <- function(a = "aaa", type.logistic = c("Newton", "modified.Newton")) {
  ### å‘¼ã³å‡ºã—å…ƒã®é–¢æ•°ã®å¼•æ•°ã‚’ãƒã‚§ãƒƒã‚¯ã—ã€ Newton ãªã‚‰ 0ã€modified.Newton ãªã‚‰ 1ã‚’å‰²ã‚Šå½“ã¦ã‚‹
  kopt <- switch(match.arg(type.logistic), Newton = 0, modified.Newton = 1)
  kopt
}

> myfun()
[1] 0
> myfun(type.logistic = "Newton")
[1] 0
> myfun(type.logistic = "modified.Newton")
[1] 1

2. ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°

ä»¥ä¸Šã§ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®è¨å®šã‚„å‰å‡¦ç†ãŒçµ‚ã‚ã‚Šã¾ã—ãŸã®ã§æ¬¡ã¯ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°ã§ã™ã€‚ ã¨ã„ã£ã¦ã‚‚ã“ã“ã§ã¯ family ã«å¿œã˜ã¦å‘¼ã³å‡ºã™é–¢æ•°ã‚’å¤‰ãˆã¦ã„ã‚‹ã ã‘ãªã®ã§ã€è©³ç´°ã¯ä¸€æ—¦ã‚¹ã‚ãƒƒãƒ—ã—ã¾ã—ã‚‡ã†ã€‚

# ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°
## family ã«å¿œã˜ã¦ãã®å¾Œã«å‘¼ã³å‡ºã™é–¢æ•°ã‚’å¤‰ãˆã‚‹
fit = switch(family,
             ### gaussian ã®ã¨ãã¯ elnet 
             gaussian = elnet(x, is.sparse, ix, jx, 
                              y, weights, offset, type.gaussian, alpha, nobs, nvars, 
                              jd, vp, cl, ne, nx, nlam, flmin, ulam, thresh, isd, intr, 
                              vnames, maxit), 
             ### poisson ã®ã¨ãã¯ fishnet
             poisson = fishnet(x, is.sparse, ix, jx, 
                               y, weights, offset, alpha, nobs, nvars, jd, vp, cl, ne, 
                               nx, nlam, flmin, ulam, thresh, isd, intr, vnames, maxit),
             ### binomial ã®ã¨ãã¯ lognet
             binomial = lognet(x, is.sparse, ix, jx, y, weights, offset, 
                               alpha, nobs, nvars, jd, vp, cl, ne, nx, nlam, flmin, 
                               ulam, thresh, isd, intr, vnames, maxit, kopt, family), 
             ### multinomial ã®ã¨ãã‚‚ lognet
             multinomial = lognet(x, is.sparse, ix, jx, y, weights, 
                                  offset, alpha, nobs, nvars, jd, vp, cl, ne, nx, nlam, 
                                  flmin, ulam, thresh, isd, intr, vnames, maxit, kopt, 
                                  family), 
             ### cox ã®ã¨ãã¯ coxnet
             cox = coxnet(x, is.sparse, ix, jx, y, weights, 
                          offset, alpha, nobs, nvars, jd, vp, cl, ne, nx, nlam, 
                          flmin, ulam, thresh, isd, vnames, maxit), 
             ### mgaussian ã®ã¨ãã¯ mrelnet
             mgaussian = mrelnet(x, 
                                 is.sparse, ix, jx, y, weights, offset, alpha, nobs, 
                                 nvars, jd, vp, cl, ne, nx, nlam, flmin, ulam, thresh, 
                                 isd, jsd, intr, vnames, maxit))
## ãƒ—ãƒã‚°ãƒ¬ã‚¹ãƒãƒ¼
if (trace.it) {
  utils::setTxtProgressBar(pb, nlam)
  close(pb)
}

ãªãŠã“ã“ã§ãã‚Œãžã‚Œã®é–¢æ•°ã«æ¸¡ã•ã‚Œã¦ã„ã‚‹å¼•æ•°ã‚’æ¯”è¼ƒã™ã‚‹ã¨ä»¥ä¸‹ã®ã‚ˆã†ã«ãªã‚Šã¾ã™ï¼ˆä¸€éƒ¨ã¯ã‚ˆãã‚ã‹ã‚Šã¾ã›ã‚“ã§ã—ãŸï¼‰ï¼š

å¼•æ•°	èª¬æ˜Ž	elnet	fishnet	lognet	coxnet	mrelnet
x	èª¬æ˜Žå¤‰æ•°ã®è¡Œåˆ—	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
is.sparse	ç–Žè¡Œåˆ—ã§ã‚ã‚‹ã‹ã®æŒ‡å®š	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
ix	ç–Žè¡Œåˆ—ã«ãŠã‘ã‚‹éžã‚¼ãƒã®è¦ç´ ã®ç´¯ç©å€‹æ•°	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
jx	ç–Žè¡Œåˆ—ã«ãŠã‘ã‚‹éžã‚¼ãƒã®è¦ç´ ã®è¡Œç•ªå·	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
y	ç›®çš„å¤‰æ•°ã®è¡Œåˆ—	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
weights	è¦³æ¸¬å€¤ã«å¯¾ã™ã‚‹é‡ã¿	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
offset	ã‚ªãƒ•ã‚»ãƒƒãƒˆ	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
type.gaussian	1:covariance, 2:naÃ¯ve	ã€‡	-	-	-	-
alpha	L1ã¨L2ã«å¯¾ã™ã‚‹é‡ã¿ã®èª¿æ•´ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
nobs	ãƒ¬ã‚³ãƒ¼ãƒ‰æ•°	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
nvars	èª¬æ˜Žå¤‰æ•°ã®æ•°	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
jd	?	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
vp	å„å¤‰æ•°ã«å¯¾ã™ã‚‹ç½°å‰‡ã®é‡ã¿ï¼ˆpenalty.factorï¼‰	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
cl	?	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
ne	ãƒ¢ãƒ‡ãƒ«ã«å«ã¾ã‚Œã‚‹å¤‰æ•°ã®ä¸Šé™ã€‚ne = dfmax = nvars + 1	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
nx	éžã‚¼ãƒã¨ã™ã‚‹å¤‰æ•°ã®å€‹æ•°ã®ä¸Šé™ï¼Ÿ	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
nlam	lambdaã®æ•°	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
flmin	?	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
ulam	?	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
thresh	åŽæŸåˆ¤å®šã®é–¾å€¤	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
isd	standardizeã™ã‚‹ã‹ã®æŒ‡å®š	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
jsd	?	-	-	-	-	ã€‡
intr	åˆ‡ç‰‡ï¼ˆInterceptï¼‰ã‚’å«ã‚ã‚‹ã‹ã®æŒ‡å®š	ã€‡	ã€‡	ã€‡	-	ã€‡
vnames	å¤‰æ•°å	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
maxit	åå¾©å›žæ•°ã®ä¸Šé™	ã€‡	ã€‡	ã€‡	ã€‡	ã€‡
kopt	æœ€é©åŒ–ã®æ‰‹æ³•	-	-	ã€‡	-	-
family	family	-	-	ã€‡	-	-

3. å¾Œå‡¦ç†

æœ€å¾Œã«å¾Œå‡¦ç†ã§ã™ã€‚

# å¾Œå‡¦ç†
## lambda ãŒæŒ‡å®šã•ã‚Œã¦ãŠã‚‰ãš fit$lambda ãŒ 3 ãƒ‘ã‚¿ãƒ¼ãƒ³ä»¥ä¸Šæ¤œè¨¼ã•ã‚Œã¦ã„ã‚‹å ´åˆã€å…ˆé ã‚’å·®ã—æ›¿ãˆã‚‹
## glmnet::fix.lam
## function (lam) {
## if (length(lam) > 2) {
##     llam = log(lam)
##     lam[1] = exp(2 * llam[2] - llam[3])
## }
## lam
## }
if (is.null(lambda)) 
  fit$lambda = fix.lam(fit$lambda)
## call
fit$call = this.call
## ãƒ¬ã‚³ãƒ¼ãƒ‰æ•°
fit$nobs = nobs
## class ã« glmnet ã‚’è¿½åŠ 
class(fit) = c(class(fit), "glmnet")

# ãƒªã‚¿ãƒ¼ãƒ³
## relax ãŒ TRUE ã®å ´åˆã€è§£ãƒ‘ã‚¹ã®å„ã‚»ãƒƒãƒˆã«ã¤ã„ã¦ç½°å‰‡ãªã—ã§ãƒ¢ãƒ‡ãƒ«ã‚’ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°ã™ã‚‹   
## If TRUE then for each active set in the path of solutions, the model is refit without any regularization. See details for more information. 
## This argument is new, and users may experience convergence issues with small datasets, especially with non-gaussian families. 
## Limiting the value of â€™maxpâ€™ can alleviate these issues in some cases.
if (relax) 
  relax.glmnet(fit, x = x, y = y, weights = weights, offset = offset, 
               lower.limits = lower.limits, upper.limits = upper.limits, 
               check.args = FALSE, ...)
else fit

ã“ã®å¾Œå‡¦ç†ã§ç›®ç«‹ã¤å·¥ç¨‹ã¨ã—ã¦ã¯ relax ã®éƒ¨åˆ†ã§ã—ã‚‡ã†ã€‚ ã“ã“ã§ relax ã¯ help ã«ã‚ˆã‚‹ã¨ã€

If relax=TRUE a duplicate sequence of models is produced, where each active set in the elastic-net path is refit without regularization. The result of this is a matching "glmnet" object which is stored on the original object in a component named "relaxed", and is part of the glmnet output.

ã¨ã„ã†ã“ã¨ã§ã€glmnet ã«ã‚ˆã£ã¦å¤‰æ•°é¸æŠžã•ã‚ŒãŸçµæžœã‚’ç”¨ã„ã¦ã€ç½°å‰‡ãªã—ã§å†åº¦ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°ã‚’è¡Œã†ã‚ªãƒ—ã‚·ãƒ§ãƒ³ã®ã‚ˆã†ã§ã™ã€‚ ã“ã‚Œã‚‚å®Ÿéš›ã«ã‚„ã£ã¦ã¿ã‚‹ã®ãŒæ—©ã„ã¨æ€ã„ã¾ã™ã®ã§ã€ä»¥ä¸‹ã®ã‚ˆã†ã«å®Ÿè¡Œã—ã¦ã¿ã¾ã™ï¼š

lasso_02 <- glmnet(x, y, family = "gaussian", relax = T)

ã™ã‚‹ã¨ã€å…ˆç¨‹ã®çµæžœï¼ˆ lasso ï¼‰ã«ã€ lasso_02$relaxed ã¨ã„ã†çµæžœãŒè¿½åŠ ã•ã‚Œã¦ã„ã‚‹ã“ã¨ãŒã‚ã‹ã‚Šã¾ã™ãŒã€å†…å®¹ã¯ lasso ã¨ã»ã¨ã‚“ã©åŒã˜ã§ã™ã€‚

> str(lasso)
List of 12
 $ a0       : Named num [1:68] 6.11e-16 6.71e-16 7.26e-16 7.76e-16 8.22e-16 ...
  ..- attr(*, "names")= chr [1:68] "s0" "s1" "s2" "s3" ...
 $ beta     :Formal class 'dgCMatrix' [package "Matrix"] with 6 slots
  .. ..@ i       : int [1:216] 0 0 0 0 0 3 0 3 0 3 ...
  .. ..@ p       : int [1:69] 0 0 1 2 3 4 6 8 10 12 ...
  .. ..@ Dim     : int [1:2] 4 68
  .. ..@ Dimnames:List of 2
  .. .. ..$ : chr [1:4] "pop15" "pop75" "dpi" "ddpi"
  .. .. ..$ : chr [1:68] "s0" "s1" "s2" "s3" ...
  .. ..@ x       : num [1:216] -0.181 -0.347 -0.497 -0.634 -0.757 ...
  .. ..@ factors : list()
 $ df       : int [1:68] 0 1 1 1 1 2 2 2 2 2 ...
 $ dim      : int [1:2] 4 68
 $ lambda   : num [1:68] 2.02 1.84 1.68 1.53 1.39 ...
 $ dev.ratio: num [1:68] 0 0.0352 0.0645 0.0888 0.1089 ...
 $ nulldev  : num 984
 $ npasses  : int 562
 $ jerr     : int 0
 $ offset   : logi FALSE
 $ call     : language glmnet(x = x, y = y, family = "gaussian", alpha = 1)
 $ nobs     : int 50
 - attr(*, "class")= chr [1:2] "elnet" "glmnet"

> str(lasso_02$relaxed)
List of 12
 $ a0       : Named num [1:68] 6.11e-16 1.29e-15 1.29e-15 1.29e-15 1.29e-15 ...
  ..- attr(*, "names")= chr [1:68] "s0" "s1" "s2" "s3" ...
 $ beta     :Formal class 'dgCMatrix' [package "Matrix"] with 6 slots
  .. ..@ i       : int [1:216] 0 0 0 0 0 3 0 3 0 3 ...
  .. ..@ p       : int [1:69] 0 0 1 2 3 4 6 8 10 12 ...
  .. ..@ Dim     : int [1:2] 4 68
  .. ..@ Dimnames:List of 2
  .. .. ..$ : chr [1:4] "pop15" "pop75" "dpi" "ddpi"
  .. .. ..$ : chr [1:68] "s0" "s1" "s2" "s3" ...
  .. ..@ x       : num [1:216] -2.04 -2.04 -2.04 -2.04 -1.98 ...
  .. ..@ factors : list()
 $ df       : int [1:68] 0 1 1 1 1 2 2 2 2 2 ...
 $ dim      : int [1:2] 4 68
 $ lambda   : num [1:68] 2.02 1.84 1.68 1.53 1.39 ...
 $ dev.ratio: num [1:68] 0 0.208 0.208 0.208 0.208 ...
 $ nulldev  : num 984
 $ npasses  : int 562
 $ jerr     : int 0
 $ offset   : logi FALSE
 $ call     : language glmnet(x = x, y = y, family = "gaussian", relax = T)
 $ nobs     : int 50
 - attr(*, "class")= chr [1:2] "elnet" "glmnet"

ã“ã“ã§ lasso_02$relaxed ã®ä¸èº«ã‚’å°‘ã—è¦‹ã¦ã¿ã‚‹ã¨ã€ä¾‹ãˆã° beta ã«ã¯ä»¥ä¸‹ã®ã‚ˆã†ãªæ•°å€¤ãŒå…¥ã£ã¦ã„ã¾ã™ã€‚

> lasso_02$relaxed$beta[, 1:6]
4 x 6 sparse Matrix of class "dgCMatrix"
      s0        s1        s2        s3        s4        s5
pop15  . -2.040996 -2.040996 -2.040996 -2.040996 -1.980216
pop75  .  .         .         .         .         .       
dpi    .  .         .         .         .         .       
ddpi   .  .         .         .         .         1.270865

ã“ã‚Œã¯ä½•ã‹ã¨è¨€ã†ã¨ã€å°‘ã—ãšã¤ç½°å‰‡ã®é‡ã¿ã‚’å¤‰ãˆãŸã“ã¨ã§å¤‰æ•°ãŒé¸æŠžã•ã‚ŒãŸçŠ¶æ…‹ã§é€šå¸¸ã®ç·šå½¢å›žå¸°ã‚’å½“ã¦ã¯ã‚ãŸã¨ãã®å›žå¸°ä¿‚æ•°ã¨ãªã£ã¦ã„ã¾ã™ã€‚ ä¾‹ãˆã° lasso_02$relaxed$beta[, 6] ã«ã¯ã€å¤‰æ•°ã¨ã—ã¦é¸æŠžã•ã‚ŒãŸ pop15 ã¨ ddpi ãã‚Œãžã‚Œã®å›žå¸°ä¿‚æ•°ãŒå…¥ã£ã¦ã„ã¾ã™ã€‚ å®Ÿéš›ã« lm ã®çµæžœã¨ä¸€è‡´ã™ã‚‹ã‹è¦‹ã¦ã¿ã¾ã—ã‚‡ã†ï¼š

> coef(lm(y ~ x[, c(1, 4)]))
      (Intercept) x[, c(1, 4)]pop15  x[, c(1, 4)]ddpi 
     1.364331e-15     -1.980216e+00      1.270865e+00

åˆã£ã¦ã„ã¾ã™ãã€‚ ã¨ã“ã‚ã§åˆ‡ç‰‡ã®æŽ¨å®šå€¤ãŒå…¥ã£ã¦ã„ã‚‹ lasso_02$relaxed$a0 ã®å€¤ã¯å°‘ã—ç•°ãªã‚‹ã‚ˆã†ã§ã™ï¼š

> lasso_02$relaxed$a0[6]
         s5 
1.28119e-15

ãªã‚“ã§ã‚„ã‚ã‹ã€‚ã€‚

ã‚‚ã—ã‹ã—ãŸã‚‰æ¨™æº–åŒ–ã®é•ã„ã‹ã¨ã‚‚æ€ã„ã¾ã—ãŸãŒãã‚Œã§ã‚‚ãªã„ã‚ˆã†ã§ã€ã“ã®ç†ç”±ã¯ã‚ã‹ã‚Šã¾ã›ã‚“ã§ã—ãŸã€‚

lasso_03 <- glmnet(x, y, family = "gaussian", relax = T, standardize = F)

> lasso_03$relaxed$a0[6]
         s5 
1.28119e-15

glmnet() ã®å®Ÿè£…ã¯ä»¥ä¸Šã¨ãªã‚Šã¾ã™ã€‚ æ¬¡å›žã¯ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°ã®éƒ¨åˆ†ã§å‘¼ã°ã‚Œã¦ã„ã‚‹ elnet ã‚’è©³ã—ãè¦‹ã¦ã„ãã¾ã—ã‚‡ã†ã€‚ ãªãŠ gam ã®ã¨ãã¨ã¯é•ã„ã€ glmnet ã§ã¯ library ã‚’ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã—ã¦ã‚‚ã‚½ãƒ¼ã‚¹ã‚³ãƒ¼ãƒ‰ã¯ä»˜ã„ã¦ãã¾ã›ã‚“ã§ã—ãŸã®ã§ã€ã“ã¡ã‚‰ã‚’å‚è€ƒã« fortran ã®ã‚½ãƒ¼ã‚¹ã‚³ãƒ¼ãƒ‰ã‚’å–å¾—ã—ã¾ã—ãŸã€‚

ã§ã¯ã¾ãŸæ¬¡å›žã€‚

2020-02-05

çµ±è¨ˆ ã‚»ãƒŸãƒŠãƒ¼

1/31ã«é–‹å‚¬ã•ã‚ŒãŸçµ±è¨ˆæ•°ç†ç ”ç©¶æ‰€ã®å…¬é–‹è¬›åº§ã€Œçµ±è¨ˆã®å“²å¦ã‚’ç†è§£ã™ã‚‹ãŸã‚ã«ã€ã«å‚åŠ ã—ã¦ãã¾ã—ãŸã®ã§ãã®ãƒ¡ãƒ¢ã‚’å…±æœ‰ã—ã¦ãŠãã¾ã™ã€‚å…¨ä½“çš„ã«ã¯ã‚¨ãƒªã‚ªãƒƒãƒˆãƒ»ã‚½ãƒ¼ãƒãƒ¼ã¨ã„ã†å°¤åº¦ä¸»ç¾©è€…ã‹ã‚‰è¦‹ãŸé »åº¦ä¸»ç¾©ãƒ»ãƒ™ã‚¤ã‚ºä¸»ç¾©ã«å¯¾ã™ã‚‹æ‰¹åˆ¤çš„è¦³ç‚¹ã®ç´¹ä»‹ã¨ã„ã†æ§‹æˆã§ã€ãã‚Œãžã‚Œã®ç«‹å ´ãŒç”ãˆã‚ˆã†ã¨ã—ã¦ã„ã‚‹å•ã„ãŒæµ®ãå½«ã‚Šã«ãªã‚‹ã‚ˆã†ãªå†…å®¹ã§ã—ãŸã€‚

ç§‘å¦ã¨è¨¼æ‹ â€•çµ±è¨ˆã®å“²å¦ å…¥é–€â€•

ä½œè€…:ã‚¨ãƒªã‚ªãƒƒãƒˆãƒ»ã‚½ãƒ¼ãƒãƒ¼
å‡ºç‰ˆç¤¾/ãƒ¡ãƒ¼ã‚«ãƒ¼: åå¤å±‹å¤§å¦å‡ºç‰ˆä¼š
ç™ºå£²æ—¥: 2012/10/20
ãƒ¡ãƒ‡ã‚£ã‚¢: å˜è¡Œæœ¬

ã¾ãŸæœ€å¾Œã«ã€ã‚ã¾ã‚Šæ™‚é–“ãŒãªãã¦é§†ã‘è¶³ã§ã®ç´¹ä»‹ã¨ãªã£ã¦ã„ã¾ã—ãŸãŒã€Deborah Mayoã«ã‚ˆã‚‹ã€Œèª¤ã‚Šçµ±è¨ˆå¦ã€ã«ã¤ã„ã¦ç°¡å˜ã«ç´¹ä»‹ãŒã‚ã‚Šã¾ã—ãŸï¼ˆæ¾çŽ‹å…ˆç”Ÿæ›°ãä¸–ç•Œåˆã®è³‡æ–™ã€ã¨ã®ã“ã¨ï¼‰ã€‚

Statistical Inference as Severe Testing: How to Get Beyond the Statistics Wars

ä½œè€…:Deborah G. Mayo
å‡ºç‰ˆç¤¾/ãƒ¡ãƒ¼ã‚«ãƒ¼: Cambridge University Press
ç™ºå£²æ—¥: 2018/09/20
ãƒ¡ãƒ‡ã‚£ã‚¢: ãƒšãƒ¼ãƒ‘ãƒ¼ãƒãƒƒã‚¯

æ—¥æ™‚

2020/1/31 10:00@ç«‹å·

è¬›å¸«

ã‚¨ãƒªã‚ªãƒƒãƒˆãƒ»ã‚½ãƒ¼ãƒãƒ¼

ã‚¢ãƒ¡ãƒªã‚«ã®ä»£è¡¨çš„ãªç§‘å¦å“²å¦è€…
è‘—æ›¸
- ç§‘å¦ã¨è¨¼æ‹
- OCKHAM'S RAZORSã®ç¿»è¨³ãŒã§ã‚‹äºˆå®š

çµ±è¨ˆå¦è«–äº‰ã¯çµ‚ã‚ã£ã¦ã„ãªã„

æœ‰æ„æ¤œå®šè«–äº‰ã€ãƒ¬ã‚·ãƒ”çš„ãªçµ±è¨ˆå¦ã®é£Ÿã„æ¢ã‚

çµ±è¨ˆã®å“²å¦

çµ±è¨ˆã®åŸºç¤Žã‚’ã‚ãã‚‹è°è«–ã®ç·ä½“
å“²å¦ã¯å¸¸ã«è«–äº‰ã§æˆã‚Šç«‹ã¡ã€çµè«–ã«ã¯åˆ°é”ã—ãªã„
- ãƒ™ã‚¤ã‚ºä¸»ç¾©
  - ä¿¡å¿µåº¦åˆã„
    - ä¸»è¦³
    - å®¢è¦³
- é »åº¦ä¸»ç¾©
  - ãƒã‚¤ãƒžãƒ³-ãƒ”ã‚¢ã‚½ãƒ³
    - ç„¡é™å›žã®æ–½è¡Œã‚’å‰æã¨ã—ãŸè€ƒãˆãŸ
  - ãƒ•ã‚£ãƒƒã‚·ãƒ£ãƒ¼
    - ç›¸å¯¾é »åº¦ã€æŽ¨æ¸¬ç¢ºçŽ‡
çµ±ä¸€çš„è¦‹è§£ã‚’ç¤ºã—ãŸã‚‚ã®ã¯ãªã„ã®ã§å„ä¸»ç¾©ã‚’å¦ã¶ã—ã‹ãªã„
- ãƒ™ã‚¤ã‚º
  - å®Ÿæ…‹ãŒæ‰ãˆã«ãã„
  - æ„æ€æ±ºå®šä¸å¿ƒã€ç§‘å¦çš„ä»®èª¬ã®ç¢ºè¨¼ä¸å¿ƒï¼ˆç§‘å¦å“²å¦ï¼‰ã€ãƒ™ã‚¤ã‚ºçµ±è¨ˆã®æµå„€
  - ãƒãƒ¼ã‚¬ãƒ¼ï¼†ã‚¦ã‚©ãƒ«ãƒ‘ãƒ¼ãƒˆï¼ˆ1988ï¼‰ã€ã‚²ãƒ«ãƒžãƒ³ï¼ˆä¸€é€£ï¼‰
- é »åº¦ä¸»ç¾©
  - Mayoã®ã‚‚ã®ã¯åŒ…æ‹¬çš„ã ãŒã‚ã‹ã‚Šã«ãã„
- å°¤åº¦ä¸»ç¾©
  - ã‚³ãƒ³ãƒ‘ã‚¯ãƒˆã§ã‚ã‹ã‚Šã‚„ã™ã„
  - ã‚½ãƒ¼ãƒãƒ¼ã‚„ãƒã‚¤ãƒ¤ãƒ«ã¯è©±ãŒçŸãè«–ç‚¹ãŒæ˜Žå¿«ã ãŒæŽ’ä»–ä¸»ç¾©

ï¼“ã¤ã®ä¸»ç¾©

ãƒã‚¤ãƒ¤ãƒ«ã®ï¼“ã¤ã®å•ã„
- è¨¼æ‹ ã‚’ã‚‚ã¨ã«ä½•ãŒã‚ã‹ã‚‹ã‹ã€€â†’ å°¤åº¦ä¸»ç¾©
  - é™çš„ç¾åœ¨ä¸»ç¾©ã€å¤–åœ¨ä¸»ç¾©
  - ãƒ‡ãƒ¼ã‚¿ãŒç›´æŽ¥ç¤ºã—ã¦ã„ã‚‹ã€Œä»®èª¬ã«é–¢ã™ã‚‹æƒ…å ±ï¼ˆè¨¼æ‹ ï¼‰ã€ã‚’ã‚ãƒ£ãƒƒãƒã›ã‚ˆ
  - ã„ã£ãŸã‚“ãƒ‡ãƒ¼ã‚¿ãŒå¾—ã‚‰ã‚ŒãŸã‚‰ä»–ã®ãƒ‡ãƒ¼ã‚¿ã®å¯èƒ½æ€§ã¯æ¨è±¡ã›ã‚ˆ
- è¨¼æ‹ ã‚’ã‚‚ã¨ã«ä½•ã‚’ä¿¡ã˜ã‚‹ã‹ã€€â†’ ãƒ™ã‚¤ã‚ºä¸»ç¾©
  - å‹•çš„ç¾åœ¨ä¸»ç¾©ã€å†…åœ¨ä¸»ç¾©
  - ä»–ã®ãƒ‡ãƒ¼ã‚¿ã®å¯èƒ½æ€§ã¯ä¸€åˆ‡æ¨è±¡ã›ã‚ˆ
  - ãƒ‡ãƒ¼ã‚¿ãŒã€Œï¼ˆå¯èƒ½ãªï¼‰ä»®èª¬ã«é–¢ã™ã‚‹æƒ…å ±ã€ã‚’ã©ã†å¤‰åŒ–ã•ã›ã‚‹ã‹ã‚ãƒ£ãƒƒãƒã›ã‚ˆ
- è¨¼æ‹ ã‚’ã‚‚ã¨ã«ä½•ã‚’ã™ã‚‹ã¹ãã‹ã€€â†’ é »åº¦ä¸»ç¾©
  - åäº‹å®Ÿä¸»ç¾©ã€è¦ç´„ä¸»ç¾©
  - ã“ã®å ´ã§ç”Ÿã˜ã¦ã„ã‚‹ã“ã¨ã ã‘ã§ãªãã€ç”Ÿã˜ãŸå¯èƒ½æ€§ãŒã‚ã‚‹äº‹æŸ„ã‚‚ã™ã¹ã¦ä½µã›ã¦ä»®èª¬ã«ã¤ã„ã¦åˆ¤æ–ã›ã‚ˆ
  - ä½Žã„ç¢ºçŽ‡ã‚’æ£„å´ã®ã‚µã‚¤ãƒ³ã¨ã¿ãªãã†ã€åŒã˜ãƒ«ãƒ¼ãƒ«ã‚’ä½•åº¦ã‚‚é©ç”¨ã™ã‚Œã°èª¤ã‚Šã®å¯èƒ½æ€§ãŒä½Žã„ã®ã ã‹ã‚‰ä»Šå›žã‚‚ãã®ãƒ«ãƒ¼ãƒ«ã‚’é©ç”¨ã™ã‚‹

å°¤åº¦ã€ŒåŽŸç†ã€ã«ã¤ã„ã¦

ã‚½ãƒ¼ãƒãƒ¼ã®è°è«–ã®æ ¸ã¨ãªã‚‹ï¼’ã¤ã®åŽŸç†
- ç©å½“ãªåŽŸç†
  - ã‚‚ã—EãŒçœŸã§ã‚ã‚‹ã¨çŸ¥ã‚‹ã“ã¨ã«ã‚ˆã£ã¦å‘½é¡ŒPã‚’æ£„å´ã™ã‚‹ã“ã¨ãŒæ£å½“åŒ–ã•ã‚Œã€ã‹ã¤ã€ã“ã®æƒ…å ±ã‚’å¾—ã¦ã¯ã˜ã‚ã¦Pã®æ£„å´ãŒæ£å½“åŒ–ã•ã‚ŒãŸã®ã§ã‚ã‚Œã°ã€Eã¯Pã«åã™ã‚‹è¨¼æ‹ ã¨ã•ã‚Œãã°ãªã‚‰ãªã„
- å…¨è¨¼æ‹ ã®åŽŸç†
  - å®Ÿé¨“ã«ã‚ˆã£ã¦å¾—ã‚‰ã‚ŒãŸãƒ‡ãƒ¼ã‚¿ã¯ã™ã¹ã¦è¨¼æ‹ ã®åˆ¤æ–ã«ç”¨ã„ã‚‰ã‚Œãªã‘ã‚Œã°ãªã‚‰ãªã„
å°¤åº¦åŽŸç†ï¼ˆLPï¼‰
- xãŒè¦³æ¸¬ã•ã‚ŒãŸã‚ã¨ã€Î¸ã«ã¤ã„ã¦æŽ¨è«–ï¼ˆæ±ºå®šï¼‰ã™ã‚‹éš›ã«ã€å®Ÿé¨“ã«ã¤ã„ã¦é–¢ä¿‚ã®ã‚ã‚‹ã™ã¹ã¦ã®æƒ…å ±ã¯ã€è¦³æ¸¬ã•ã‚ŒãŸxã«å¯¾ã™ã‚‹å°¤åº¦é–¢æ•°ã«å«ã¾ã‚Œã¦ã„ã‚‹ã€‚ã•ã‚‰ã«ï¼’ã¤ã®å°¤åº¦é–¢æ•°ãŒÎ¸ã®é–¢æ•°ã¨ã—ã¦äº’ã„ã«æ¯”ä¾‹ã®é–¢ä¿‚ã«ã‚ã‚‹ãªã‚‰ï¼’ã¤ã®é–¢æ•°ã¯Î¸ã«ã¤ã„ã¦åŒã˜æƒ…å ±ã‚’å«ã‚“ã§ã„ã‚‹
- ãƒ•ã‚£ãƒƒã‚·ãƒ£ãƒ¼ã«ç”±æ¥
- ã“ã‚Œã‚’æº€ãŸã™ã‹æº€ãŸã•ãªã„ã‹ã§ã€é™£å–¶ãŒåˆ†ã‹ã‚Œã‚‹
  - æº€ãŸã™
    - å°¤åº¦ä¸»ç¾©ã€ãƒ™ã‚¤ã‚ºä¸»ç¾©
  - æº€ãŸã•ãªã„
    - é »åº¦ä¸»ç¾©
- ã„ã¾ã è«–äº‰ã®ç«ç¨®
- ã‚‚ã—LPãŒãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿æŽ¨å®šã®æ ¹æœ¬åŽŸç†ã§ã‚ã‚‹ãªã‚‰ã€
  - P(x' | Î¸i) = kP(x | Î¸i) ãŒæˆã‚Šç«‹ã¤ã¨ãEv(E, x) = Ev(E', x')ã¨ãªã‚‹ã¯ãšã€‚Evã¯è¨¼æ‹ ã€Eã¯å®Ÿé¨“
  - ã“ã‚ŒãŒæˆã‚Šç«‹ãŸãªã‘ã‚Œã°ãã®ã‚ˆã†ãªçµæžœã‚’ã‚‚ãŸã‚‰ã™æŽ¨è«–ã¯ä¸é©åˆ‡
  - ãƒãƒ¼ãƒ³ãƒã‚¦ãƒ ãŒè¨¼æ˜Ž
    - è¨¼æ˜Žã®æ˜¯éžã¯æœªæ±ºç€
- ã•ã‚‰ã«é¡ã‚‹ã¨
  - ååˆ†æ€§ã®åŽŸç†
  - æ¡ä»¶ä»˜ã‘ã®åŽŸç†
  - ã“ã‚Œã‚‰ï¼’ã¤ã®åŽŸç†ã¯çµ±è¨ˆå¦è€…ãªã‚‰èª°ã§ã‚‚å—ã‘å…¥ã‚Œã‚‰ã‚Œã‚‹ã¯ãšã®åŽŸç†
  - ã“ã‚Œã‚‰ï¼’ã¤ã®åŽŸç†ã¨å°¤åº¦åŽŸç†ã®ç‰ä¾¡æ€§ã‚’ã€Œè¨¼æ˜Žã€ï¼ˆãƒãƒ¼ãƒ³ãƒã‚¦ãƒ ï¼‰ã€ï¼’ã¤ã®åŽŸç†ã‚’å—ã‘å…¥ã‚Œã‚‹ãªã‚‰å°¤åº¦åŽŸç†ã‚‚å—ã‘å…¥ã‚Œãªã„ã¨ã„ã‘ãªã„
- ãƒãƒ¼ãƒ³ãƒã‚¦ãƒ ã®å•é¡Œæ„è˜
  - ã€Œçµ±è¨ˆå¦çš„ã«å°Žã‘ã‚‹è¨¼æ‹ ã€ãŒã€Œå®Ÿé¨“ã«ãŠã‘ã‚‹è¨¼æ‹ ã€ã«ãªã£ã¦ã„ã‚‹
    - (E, x) ã¨ Ev(E, x) ã¯åŒºåˆ¥ã•ã‚Œã‚‹
      - (E, x)
        
        ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ç©ºé–“Î©ã«ã¤ã„ã¦ã®è¨˜è¿°
        
        Eã®å¯èƒ½ãªçµæžœxã®ã‚µãƒ³ãƒ—ãƒ«ç©ºé–“ã«ã¤ã„ã¦ã®è¨˜è¿°
      - Ev(E, x)ï¼šå®Ÿé¨“çš„è¨¼æ‹
        
        ã©ã†è©•ä¾¡ã™ã‚‹ã‹ï¼Ÿ
  - è§£æ˜Žã®ãƒã‚¤ãƒ³ãƒˆ
    - ï¼’ã¤ã®çµ±è¨ˆçš„è¨¼æ‹ (E, x) ã¨ (E', y) ãŒé–¢ä¿‚ã™ã‚‹ã‚ã‚‰ã‚†ã‚‹ç‚¹ã§ç‰ã—ã„ã¨è¨€ãˆã‚‹æ¡ä»¶ï¼Ÿ
      - çµ±è¨ˆçš„è¨¼æ‹ (E, x) ã¨ (E', y) ãŒé–¢ä¿‚ã™ã‚‹ã‚ã‚‰ã‚†ã‚‹é‡è¦ãªç‚¹ã§ç‰ã—ã„æ™‚ã€ Ev(E, x) = Ev(E', y)
å°¤åº¦åŽŸç†ã‹ã‚‰ã®é‡è¦ãªå¸°çµ
- ã‚µãƒ³ãƒ—ãƒ«ã‚¹ãƒšãƒ¼ã‚¹ï¼ˆå¯èƒ½ã ãŒå®Ÿéš›ã«ã¯å¾—ã‚‰ã‚Œãªã‹ã£ãŸç¢ºçŽ‡å¤‰æ•°ã®å€¤ï¼‰ã®ç„¡é–¢ä¿‚æ€§
  - é‡è¦ãªäº‰ç‚¹
  - åäº‹å®Ÿã®é‡è¦æ€§ã‚’å¦å®š

ãƒ‡ãƒ•ã‚£ãƒãƒƒãƒ†ã‚£
- ç¢ºçŽ‡ã€è³ã‘ã€ä¿¡å¿µã®é–¢ä¿‚
  - ã€Œåˆç†çš„ãªè³ã‘ãŒæˆç«‹ã™ã‚‹ãŸã‚ã®æ¡ä»¶ã€ã€Œç¢ºçŽ‡ã®ï¼“ã¤ã®è¦å‰‡ã€åŒã˜æ¡ä»¶
- D.ã‚®ãƒªãƒ¼ã‚¹ã€Œç¢ºçŽ‡ã®å“²å¦ç†è«–ã€
ã‚µãƒ´ã‚§ãƒƒã‚¸
- Inductive inference ã¨ Inductive behavior
- å¾Œè€…ãŒã‚ˆã‚Šé‡è¦
  - Inference
    - æ„è¦‹ã‚’å¤‰ãˆã‚‹ã“ã¨
  - Behavior
    - åˆ†å¸ƒã¨æœ€çµ‚çš„ãªè¡Œç‚ºã®çµŒæ¸ˆçš„äº‹å®Ÿã‚’ç”¨ã„ã¦æœ€ã‚‚æœŸå¾…åŠ¹ç”¨ã®é«˜ã„ã‚‚ã®ã‚’é¸ã¶
ä¸»è¦³çš„ vs å®¢è¦³çš„
- ä¿¡å¿µå¤‰åŒ–ã®åˆç†æ€§
- åŸºç¤Žä»˜ã‘ä¸»ç¾©
- å®¢è¦³çš„äº‹å‰ç¢ºçŽ‡
  - ã‚¸ã‚§ãƒ•ãƒªãƒ¼ã‚ºã®ç„¡æƒ…å ±äº‹å‰åˆ†å¸ƒã€ã‚¸ã‚§ã‚¤ãƒ³ã‚ºã®æœ€å¤§ã‚¨ãƒ³ãƒˆãƒãƒ”ãƒ¼
å“²å¦çš„ãƒ™ã‚¤ã‚ºä¸»ç¾©
- ã‚«ãƒ«ãƒŠãƒƒãƒ—ã®å¸°ç´è«–ç†
  - ãƒ©ãƒ—ãƒ©ã‚¹å¸°ç´æŽ¨è«–ã®ç™ºå±•å½¢ï¼ˆÎ»é€£ç¶šä½“ï¼‰
    - Î» = 0ï¼šé »åº¦
    - Î» = kï¼šãƒ©ãƒ—ãƒ©ã‚¹
    - Î» = âˆžï¼šè«–ç†èª¬
- ãƒ™ã‚¤ã‚ºçš„ç¢ºè¨¼ã€ç¢ºè¨¼ç¨‹åº¦ã€etc.
å®Ÿç”¨ã¸ã®è»¢æ›
- Lindley & Smithã«ã‚ˆã‚‹éšŽå±¤ãƒ™ã‚¤ã‚º
- Gelfand & Smithã«ã‚ˆã‚‹MCMCã®å°Žå…¥

ã‚°ãƒ¬ãƒ ãƒªãƒ³ä»®èª¬
- å“²å¦ã§ã¯ã—ã°ã—ã°ã€Œèª¬æ˜Žå¯èƒ½æ€§ã€ã¨ã€Œç¢ºçŽ‡ã€ãŒçµã³ã¤ã
å°¤åº¦ä¸»ç¾©ã®é™ç•Œ
- åŒºé–“ã‚’æŒã£ãŸä»®èª¬ï¼ˆè¤‡åˆä»®èª¬ï¼‰ã¯è€ƒå¯Ÿã®å¯¾è±¡ã¨ãªã‚‰ãªã„
- å°¤åº¦ã®å¹³å‡ã‚’æ±‚ã‚ã‚‹ã“ã¨ã¯å¯èƒ½ã ãŒã€äº‹å‰åˆ†å¸ƒãŒå¿…è¦ã¨ãªã‚‹
- ã‚½ãƒ¼ãƒãƒ¼ã®ç«‹å ´
  - é »åº¦ä¸»ç¾©ã®çµ±è¨ˆãƒ†ã‚¹ãƒˆã¯ç”¨ã„ãŸããªã„
  - ãƒ™ã‚¤ã‚ºä¸»ç¾©ã¯ã§ãã‚‹ã ã‘æŽ§ãˆãŸã„
  - çµæžœ
    - AICã§
å°¤åº¦ã‚‚ãƒ¢ãƒ‡ãƒ«ã«ä¾å˜ã™ã‚‹ãŸã‚æ£æ„æ€§ãŒæ··ã˜ã‚‹ãŒã€ãªãœå°¤åº¦ä¸»ç¾©è€…ã¯ãƒ™ã‚¤ã‚ºä¸»ç¾©ã‚’æ‰¹åˆ¤ã§ãã‚‹ã®ã‹ï¼Ÿ
- ãƒŸã‚¹ãƒªãƒ¼ãƒ‡ã‚£ãƒ³ã‚°ç¢ºçŽ‡ã¨ã„ã†ã‚‚ã®ã‚’ç”¨ã„ã‚‹ã“ã¨ã§å®¢è¦³æ€§ã‚’ä¿è¨¼ã§ãã‚‹ã€ã¨ã„ã†ã®ãŒã‚½ãƒ¼ãƒãƒ¼ã®ç«‹å ´

ãƒ•ã‚£ãƒƒã‚·ãƒ£ãƒ¼ã®æœ‰æ„æ€§æ¤œå®š
- å˜ç‹¬ã®ä»®èª¬ã«å¯¾ã™ã‚‹æ¤œå®š
- å¸°ç„¡ä»®èª¬ã¯æ£ã—ã„ã¨è¨¼æ˜Žã•ã‚Œã‚‹ã“ã¨ã¯ãªã„
- ç¢ºçŽ‡è«–çš„ãƒ¢ãƒ¼ãƒ€ã‚¹ãƒˆãƒ¬ãƒ³ã‚¹ã¸ã®æ‰¹åˆ¤
  - å¸°ç´è«–ç†
ãƒã‚¤ãƒžãƒ³ - ãƒ”ã‚¢ã‚½ãƒ³
- è¡Œç‚ºé¸æŠžã®è¦å‰‡
  - å¸°ç´è¡Œç‚º

è€ƒãˆæ–¹

ãŠè©¦ã—

ã‚·ãƒŸãƒ¥ãƒ¬ãƒ¼ã‚·ãƒ§ãƒ³

çµ‚ã‚ã‚Šã«

ãƒ«ãƒ¼ãƒ—â‘¢ï¼ˆå›žå¸°ä¿‚æ•°ã®æŽ¨å®šï¼‰

ãƒ«ãƒ¼ãƒ—â‘£ï¼ˆåˆ†æ•£å…±åˆ†æ•£è¡Œåˆ—ã®è¨ˆç®—ï¼‰

ãƒ«ãƒ¼ãƒ—â‘¤ï¼ˆå›žå¸°ä¿‚æ•°ã®æ›´æ–°ï¼‰

ãƒ«ãƒ¼ãƒ—â‘¥ï¼ˆå›žå¸°ä¿‚æ•°ã®æŽ¨å®šãƒ»å†ï¼‰

ãƒ«ãƒ¼ãƒ—â‘¦ï¼ˆå›žå¸°ä¿‚æ•°ã®æ›´æ–°ãƒ»å†ï¼‰

ãƒ«ãƒ¼ãƒ—â‘§ï¼ˆå›žå¸°ä¿‚æ•°ã®æ›´æ–°ãƒ»å†ã€…ï¼‰

ãƒ«ãƒ¼ãƒ—â‘¨ï¼ˆå›žå¸°ä¿‚æ•°ãŒæŽ¨å®šã•ã‚ŒãŸå¤‰æ•°ã®ã‚«ã‚¦ãƒ³ãƒˆï¼‰

çµ‚ã‚ã‚Šã«

elnet1ã®å®Ÿè£…

å‰å‡¦ç†

ãƒ«ãƒ¼ãƒ—â‘ ï¼ˆalmã®æ›´æ–°ï¼‰

ãƒ«ãƒ¼ãƒ—â‘¡ï¼ˆç½°å‰‡ã®å®šç¾©ï¼‰

elnetu ã®å®Ÿè£…

elnet ã®å®Ÿè£…

elnetï¼ˆäºŒåº¦ç›®ï¼‰ã®å®Ÿè£…

èƒŒæ™¯

glmnet ã®å®Ÿè¡Œçµæžœ

glmnet ã®å®Ÿè£…

1. ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®è¨­å®šã€å‰å‡¦ç†ã€ã‚¨ãƒ©ãƒ¼ãƒã‚§ãƒƒã‚¯

2. ãƒ•ã‚£ãƒƒãƒ†ã‚£ãƒ³ã‚°

3. å¾Œå‡¦ç†

æ—¥æ™‚

è¬›å¸«

ã‚¨ãƒªã‚ªãƒƒãƒˆãƒ»ã‚½ãƒ¼ãƒãƒ¼

çµ±è¨ˆå­¦è«–äº‰ã¯çµ‚ã‚ã£ã¦ã„ãªã„

çµ±è¨ˆã®å“²å­¦

ï¼“ã¤ã®ä¸»ç¾©

å°¤åº¦ã€ŒåŽŸç†ã€ã«ã¤ã„ã¦

å¯¾ãƒ™ã‚¤ã‚ºä¸»ç¾©

å°¤åº¦ä¸»ç¾©ã¨ã¯

å¯¾é »åº¦ä¸»ç¾©

è€ƒãˆæ–¹

ãŠè©¦ã—

çµ‚ã‚ã‚Šã«

ãƒ«ãƒ¼ãƒ—â‘¢ï¼ˆå›žå¸°ä¿‚æ•°ã®æŽ¨å®šï¼‰

ãƒ«ãƒ¼ãƒ—â‘£ï¼ˆåˆ†æ•£å…±åˆ†æ•£è¡Œåˆ—ã®è¨ˆç®—ï¼‰

ãƒ«ãƒ¼ãƒ—â‘¤ï¼ˆå›žå¸°ä¿‚æ•°ã®æ›´æ–°ï¼‰

ãƒ«ãƒ¼ãƒ—â‘¥ï¼ˆå›žå¸°ä¿‚æ•°ã®æŽ¨å®šãƒ»å†ï¼‰

ãƒ«ãƒ¼ãƒ—â‘¦ï¼ˆå›žå¸°ä¿‚æ•°ã®æ›´æ–°ãƒ»å†ï¼‰

ãƒ«ãƒ¼ãƒ—â‘§ï¼ˆå›žå¸°ä¿‚æ•°ã®æ›´æ–°ãƒ»å†ã€…ï¼‰

ãƒ«ãƒ¼ãƒ—â‘¨ï¼ˆå›žå¸°ä¿‚æ•°ãŒæŽ¨å®šã•ã‚ŒãŸå¤‰æ•°ã®ã‚«ã‚¦ãƒ³ãƒˆï¼‰

çµ‚ã‚ã‚Šã«

`elnet1`ã®å®Ÿè£…

å‰å‡¦ç†

ãƒ«ãƒ¼ãƒ—â‘ ï¼ˆ`alm`ã®æ›´æ–°ï¼‰

ãƒ«ãƒ¼ãƒ—â‘¡ï¼ˆç½°å‰‡ã®å®šç¾©ï¼‰

`elnetu` ã®å®Ÿè£…

`elnet` ã®å®Ÿè£…

`elnet`ï¼ˆäºŒåº¦ç›®ï¼‰ã®å®Ÿè£…

`glmnet` ã®å®Ÿè¡Œçµæžœ

`glmnet` ã®å®Ÿè£…

1. ãƒ‘ãƒ©ãƒ¡ãƒ¼ã‚¿ã®è¨å®šã€å‰å‡¦ç†ã€ã‚¨ãƒ©ãƒ¼ãƒã‚§ãƒƒã‚¯

3. å¾Œå‡¦ç†

ã‚¨ãƒªã‚ªãƒƒãƒˆãƒ»ã‚½ãƒ¼ãƒãƒ¼

çµ±è¨ˆå¦è«–äº‰ã¯çµ‚ã‚ã£ã¦ã„ãªã„

çµ±è¨ˆã®å“²å¦

ï¼“ã¤ã®ä¸»ç¾©

å°¤åº¦ã€ŒåŽŸç†ã€ã«ã¤ã„ã¦

å°¤åº¦ä¸»ç¾©ã¨ã¯