「mlp」を含む日記 RSS

はてなキーワード: mlpとは

2025-02-23

大規模言語モデル訓練における速度・精度革新手法の体系的時系列分析

Transformerアーキテクチャを基盤とする大規模言語モデル(LLM)の訓練効率化に関する主要技術革新を、時系列的に整理し体系化する。本分析arXivを中心とした学術論文に基づき、実証研究成果に焦点を当てる。

初期最適化手法確立2018-2020年

動的バッチサイズ調整

Popelら(2018)のTransformerモデル向け訓練手法分析[8]では、バッチサイズ学習率の動的調整が収束速度向上に有効であることを実証。最大文長制約を設けることでメモリ使用量を最適化し、8GPU環境で1.4倍の訓練速度向上を達成した。特に学習率のウォームアップ戦略が勾配不安定性を低減し、初期収束を促進する効果確認されている[8]。

混合精度訓練の導入

Zhuangら(2023)の調査[1]によれば、自動混合精度(AMP)訓練はFP16とFP32のハイブリッド運用により、メモリ消費量50%削減しつつ、DeiT-Bモデルの訓練速度を2倍改善。勾配スケーリング機構が数値的不安定性を緩和し、精度劣化なしに計算効率を向上させる[1]。

効率アルゴリズム多様化2021-2023年

Lion最適化手法

Zhuangらの分析[1]で言及されるLion最適化は、AdamWと比較してメモリ効率が30%改善され、収束速度が1.5倍高速化運動量推定と重み減衰の組み合わせが、Transformerの大規模疎行列演算適応し、ImageNet分類タスクTop-1精度1.2%向上を記録[1]。

シャープネス対応最小化(SAM)

損失関数の平坦な最小値を探索するSAM手法[1]は、Transformer訓練における汎化性能を15%改善。ただし二段階最適化必要なため訓練時間が1.8倍増加する課題を抱える。後続研究では確率的重み摂動を導入し、計算オーバーヘッドを30%削減[1]。

パラメータ効率型微調整の台頭(2023-2024年

ランク適応(LoRA)

Shahidら(2024)の総説[3]で解説されるLoRAは、重み更新行列を低ランク分解することで微調整パラメータを90%削減。GPT-3 175Bモデルで従来手法と同等の性能を維持しつつ、GPUメモリ使用量を65%削減[3]。

動的ドロップアウト

動的ドロップアウト手法[4]は検証損失に基づき正則化強度を調整、Shakespeare_charデータセットで収束速度を40%改善指数減衰スケジュールが最適で、推論時のメモリ効率を25%向上させた[4]。

分散知能活用の進展(2024年

SALT訓練フレームワーク

小規模言語モデル(SLM)を活用したSALT手法[2]は、二段階訓練アプローチによりLLM事前学習時間を30%短縮。知識蒸留段階ではSLMの予測分布転移し、難易度適応データ選択学習効率最適化[2]。

エキスパート混合(MoE統合

MoEアーキテクチャ[3]は専門家ネットワークの動的選択により、同パラメータ数で推論速度を2.3倍向上。トークンレベルルーティング計算負荷を分散し、GLUEベンチマークで精度3.1%改善[3]。

最適化理論の深化(2024-2025年

近接政策最適化(PPO)

強化学習統合したPPO手法[3]は人間フィードバック効率的に活用倫理的アライメントタスクで従来比25%の精度向上。報酬モデルとの相互作用学習政策勾配の安定性を確保[3]。

アルゴリズム蒸留

EVOLvEフレームワーク[7]は探索的バンディット問題に対して最適アルゴリズム知識をLLMに転移、合成データによる事前学習で探索効率を60%改善モデルサイズ依存性を低減し、7Bパラメータモデルが70Bモデルを性能で凌駕[7]。

技術進化総合考察

速度改善要因の体系化

1. 計算量削減:MoEの疎活性化計算コストO(1))[3]

2. メモリ階層最適化AMPと動的ドロップアウトの併用[1][4]

3. 分散処理効率化:非同期勾配更新パイプライン並列化[8]

精度向上メカニズム

1. 損失地最適化:SAMによる平坦最小値探索[1]

2. 知識転移効率化:SALTの二段階蒸留戦略[2]

3. 動的適応機構:PPOの政策最適化MoE専門家選択[3][7]

今後の課題展望

技術課題

1. カタストロフィックフォーミング:継続学習における破滅忘却問題[3]

2. 計算-精度トレードオフ量子化訓練の精度劣化メカニズム[1]

3. 倫理的アライメント:自己最適化システム制御可能性[3]

期待される発展

1. ニューロモーフィック統合:脳神経機構模倣した効率化[3]

2. マルチモーダル拡張画像-言語連成訓練の効率化[3]

3. 物理法則統合エネルギー保存則に基づく最適化[4]

学術論文に基づく本分析を通じ、LLM訓練技術が単なる計算資源の拡大からアルゴリズム革新へとパラダイムシフトしていることが明らかとなった。今後の進展により、エネルギー効率倫理的妥当性を両立する次世代訓練手法の登場が期待される。

Citations:

[1] ttps://arxiv.org/pdf/2302.01107.pdf

[2] ttps://arxiv.org/html/2410.18779v1

[3] ttps://arxiv.org/abs/2408.13296

[4] ttps://arxiv.org/abs/2411.03236

[5] ttps://arxiv.org/pdf/2308.04950.pdf

[6] ttp://arxiv.org/pdf/2307.06435.pdf

[7] ttps://arxiv.org/abs/2410.06238

[8] ttps://arxiv.org/abs/1804.00247

[9] ttps://arxiv.org/pdf/2010.07003.pdf

[10] ttps://arxiv.org/html/2410.16392v1

[11] ttps://www.ijcai.org/proceedings/2023/0764.pdf

[12] ttps://arxiv.org/abs/2306.10891

[13] ttps://arxiv.org/html/2410.16682v1

[14] ttps://arxiv.org/abs/2502.00571

[15] ttps://arxiv.org/abs/2405.14277

[16] ttps://arxiv.org/abs/2310.05204

[17] ttps://arxiv.org/html/2308.09372v2

[18] ttps://arxiv.org/abs/2305.14239

[19] ttps://arxiv.org/abs/2407.18003

[20] ttps://arxiv.org/pdf/2309.06054.pdf

[21] ttps://arxiv.org/html/2401.02038v1

[22] ttps://arxiv.org/abs/2409.04833

[23] ttps://arxiv.org/html/2308.09372v3

[24] ttps://arxiv.org/abs/2410.13116

[25] ttps://arxiv.org/abs/2502.01612

[26] ttps://arxiv.org/abs/2302.01107

[27] ttps://arxiv.org/html/2302.07730v4

[28] ttps://arxiv.org/abs/2410.06940

[29] ttps://www.axelera.ai/blog/multilayer-perceptrons-mlp-in-computer-vision

2024-07-09

白人って遺伝子レベルケモナーだよな

Sleipnir、皆まだこの名前を覚えているだろうか?

プニルだよプニル

ちげーよスライムじゃねーよ。

ブラウザだよブラウザ

火狐クロームバチバチの戦いを繰り広げていたちょっと懐かしいWEBブラウザプニルだ。

コイツ元ネタ北欧神話であることを知っている人は半分ぐらいだと思う。

ゲーム脳の人には常識だけど、普通の人はゲーム脳じゃないからね。

オーディンの愛馬にして八本足で空を飛ぶとんでもホースなんだが、その出生がこれまた凄い。

スレイプニル

Sleipnir

北欧神話の神々の王オーディン乗馬オーディンを乗せ空中を風のように速く駆ける。悪神ロキがあるとき雌馬に変身して,アスガルズの城壁を神々のために建設した不思議巨人の所有していたスバジルファリという雄馬交尾して産んだといわれ,生れつき8本足であったとされる。

出典 ブリタニカ国際大百科事典 小項目事典

北欧神話きってのトリックスターであるロキがなんと牝馬に変身して雄馬とのセックスの果てに産んだとされている。

産ませたではなく産んだというんだから業が深い。

そうして生まれ子供主神オーディンが愛用しているんだからこりゃもうえらいこっちゃだ。

分かるかい

白人ケモナー遺伝子アジアとは比べ物にならないってことだよ。

なんでマイリトルポニーが向こうで生まれたのか、そして向こうではマイリトルポニーでシコってるお友達が沢山いるのはなぜか?

答えはシンプルだ。

ケモにおいては白人のほうが遺伝子レベルでよっぽどHENTAIからだ。

日本HENTAIにおいて世界一みたいに言われているが、ふとケモの分野で見てみるとポケモンソニックとかでちょこちょこメガヒットを出してはいても界隈全体でさえマイナー扱い。

一方ズートピアMLPファン界隈じゃケモシコこそがメジャー性癖みたいな状態だ。

レベルが違う。

遺伝子レベルで違うんだな。

マジで凄いぜ!

2020-07-29

地蔵とかっぱが血みどろの戦いを繰り広げてた日本に比べれば全然普通キャラクターでは。

このゲーム最初マイリトルポニーパロディ格闘ゲームだったのが、版権問題で色々あって最終的にマイリトルポニー4世代目)のクリエイターオリジナルキャラクターデザインを手掛けた労作。

MLP特に第4世代アメリカで凄まじく有名で人気のあるキャラクターからケモナーとかそういう次元にいないんだよね。

ただケモナーだとか闇とか言っちゃうのはファンを凄まじく馬鹿にしてるわ。

もちろんエロパロもいっぱいあるけど。

2020-07-02

anond:20200629113900

アメリカにはティーンエイジャーに対象を絞ったアニメコンテンツがないんじゃないの?

MLPみたいな幼児向けかシンプソンズアメコミ物みたいな大人でも違和感なく観ることができるもののどっちかのイメージしかない。

日本の”少年漫画みたいな小学生から高校生が見るものみたいな漫画メディアもないしそういうのから派生したアニメもない。

アメリカアニオタになろうにも、日本でいうところの朝やってるタイプワンピみたいな世の中に浸透してるやつしかいからそこまでのめりこめないんだと思うよ。

2020-05-30

anond:20200529124907

MLPはよくプリキュアに擬えられるけどちょっと違うと思う。

プリキュアニチアサ文化ってものベースにあってそれありきで支持されてる。

一方MLP80年代ブームを起こし定着したのち(この頃から何度もアニメ化はされてきた )、だんだんマンネリ化し一時下火になったものの、

2010年から始まったアニメ、「〜トモダチは魔法〜」シリーズがその骨太ストーリーキャラクター造形から幅広い層から支持され空前絶後の人気となった。

ネトフリのドキュメンタリーシリーズ「ボクらを作ったオモチャたち」のマイリトルポニー回を見てもらうのが手っ取り早いだろう。

無理やり日本コンテンツに例えるなら、

昭和に一斉を風靡し何度もアニメ化されつつ、平成に入ってからは全く存在感のなかった「おそ松くん」を、

とっつきやすキャラクター設定、練り込まれサブカルネタが炸裂するギャグセンスで「おそ松さん」としてリブートし、腐女子という、今までの赤塚不二夫作品には見られなかった新たなファン層を獲得した事例に近いのではないだろうか。

「〜トモダチは魔法〜」の作風自体は強引に言ってけものフレンズに似ていると思った。

2020-05-29

anond:20200529124907

最新のMLP: G4(といってもシリーズは終了したが)のアニメ路線をガラッと変えてしまたから少し違うかもしれないけど

基本的には「リカちゃん」など着せ替え・ごっこ遊びが出来る女児向けドール / 玩具が一番近い

擬人化の方はハズブロが新しい着せ替えドールラインを作ろうとして、人気のMLP企画したのではないか [要出典]

2019-12-26

私の資産形成2019

淡々と積み立ててるよ。老後は年金運用益だけで暮らしていくのが目標

制度

中小企業なので、企業年金とか企業確定拠出年金なんてのは無いから、iDeCo (個人確定拠出年金) とNISA (一般NISA) を利用している。

確定拠出年金は60歳になるまで原則として引き出せないけど、どうせ月2.3万円が上限なのであまり気にしていない。つみたてNISAではなく一般NISAなのは、年間120万円と上限があるのと、株や米国ETFを買うため。とはいえ、長期投資観点からはつみたてNISAの方が好ましいので、制度改定を見ながら適当な時期に移行する予定。

資産配分

NISAiDeCo特定口座で毎月13万円程度積み立ててる。ボーナスは毎回50万円ほど使って、配分を調整する。(基本的に売却はしない) 短期的には含み損が出ることもあるが、30年を超える長期投資なのであまり気にしない。

今のところの配分はこんな感じ。

一部米国株を中心に個別株で持っているけど、他はほぼ全てが投資信託 (信託報酬年0.2%以下が大半) か米国ETF

人にお勧めできる買い方ではないので、他の人にはiDeCo/つみたてNISA

あたりをオススメしてる。

生命保険

トラディショナルな貯蓄型の生命保険ゴミなので、都民共済に加えてじぶんの積立 (明治安田生命) を掛けている。後者生命保険機能はほぼ無くて、実質生命保険料控除を取るためだけのもの。常に解約返戻率が100%以上でいつでも解約して数日後には返戻金を受け取れる。

独身であれば共済で十分だし、生命保険料が年間8万円前後 (共済の割戻金による) になるので控除枠を有効活用できる。

個人年金

今のところ掛けていないが、農協ライフロードが有力な選択肢。(他社は月2万円からだったりと、個人年金保険料控除を考慮してもイマイチ。) 10年以内の返戻率は100%を切るが、個人年金保険料控除を含めて考えれば損益分岐点は5,6年くらいになるはず。

ふるさと納税

年間十数万寄付して、返礼品をもらっている。制度自体は不健全なところはあるけど、節税観点からは他の適法手段と同じだから気にせず使う。

2019-11-09

anond:20191109094542

小学生の頃マイメロの部分交換される回でめっちゃ抜いた記憶があるけど

かい性癖まで考え出すとMLPポケモン放送禁止になるからなあ・・・

フェミニスト個々人の意見撤回!みたいなやっちゃう無限に拡大されちゃってみんな内心うぜえ・・・ってなるだけなので

CEROみたいな機関作って、ハラルフードの如くこれはフェミニストでも消費できる非性的コンテンツ!とかやるほうがマシなのでは

2019-11-06

anond:20191106110225

MLPガチシコってるやつは、MLPが好きでシコってるんよ。

小児性愛タブーの逃げ道としてのケモノとかって昔の話で今の文脈じゃない。

日本コンテンツはWeeabooによって翻訳されたり拡散されたりしてるからMLPエロアクセス出来て日本コンテンツアクセスできない人間ってのは稀。

MLPドラゴンカーセックスアメリカの厳しい規制に対してのネタの側面がかなりあって、本気のブロニーとかはごくごく少数でしかない。

2019-06-30

ディープラーニングの衝撃って

「ええ!?そんなにメモリCPUGPU)使っていいの!??????????

って言うのがまず最初にあったし

古典機械学習MLP以外)も同じくらいの数のパラメータを使わせたら同じくらいの精度出るんじゃねえの

2018-05-14

anond:20180514123509

MLP患者を見てると言わんとすることはわかるけどMLP欲情するようになったのはロリコンオタクに対する不当な抑圧が原因なのではないかという気になる

2018-03-26

第一自動運転ブームは冬の時代差し掛かろうとしている

世界中で、Uberテスラ死亡事故を起こしている。

このままだと第一次第二次第三次人工知能と同じ道を歩むかもしれない。

ジェフリー・ヒントン助けて。。。

ちな、MLPMultilayer perceptronの略な!

世の中のあらゆることをMLP学習して素性見つけるの楽しすぎワロタ

お前らもやってみろ

 
ログイン ユーザー登録
ようこそ ゲスト さん