「Springer」を含む日記 RSS

はてなキーワード: Springerとは

2025-11-01

国産LLMの人」が成功できますように

一般的国産LLM開発という主語ではございません.

私としては国産なり日本発のLLM開発を諦めてはならないし, その可能性は十分にあると信じています. 既に出ているものも多数ございますし.

エントリはそれとは全く別の,

国産LLMの人」という方についてです.

---------

色々思うところがありまして.

例えば,

微分は使いたくない」「XOR出来たから何とかなるやろ」

と繰り返し主張しておられる.

そのような単純な活性化関数では過学習か誤差が噴出するかの二択でしょう. 実際, 氏のツイートは正にその状態示唆しているように見受けられます.

```x

▶︎ 誤差が0.12あるだけでとんでもないエラー率になる。誤差関数が雑だから本当はもっとあるのかもしれないが、改善余地がある。

▶︎ 問題は、どのような状態の時に学習成功し、失敗するのかがまだ分かっていない。表現力は十分に持っているはずなのに、なぜか学習しない。

```

過学習に至ったときにうまくいってるように見えるだけでしょう.

と思うのですが, 反論過去にされていた.

```x

▶︎過学習ではないですね。データセットが小さいかつ、それ以外の範囲が出ないことが分かっているので。XORは2^2パターン全て学習できれば精度が100%になりますが、それは過学習とは呼ばないのと同じで、今回の初期のRNNに関しても文字数が圧倒的に少なく、パターンも決まっているので。

```

……と主張されておられる.

私が思うにそれは単純な写像を, ニューロンを使って回り道して作っている状態. LLMは局所的にはたしか線形写像ですが,全体で見ても線型写像だとしたらそれは複雑な文章生成には到底耐えられないかと. (十分に大きいモデルマクロに見ると非線形性があるので)

大規模言語モデル=LLMを目指すとして,

そもそもエンベディングテーブルとは数百億から下手すれば1兆語彙を, たった数千〜1万次元程度のベクトル表現する, 凄まじく繊細なテーブルです.

それをGELUやSwiGLUのような綺麗な活性化関数を使わずに, しか爆速でやると仰っている. さすがにそのレベル革新性を主張するには根拠がない限り, 飛躍が過ぎると判断されるかと.

そのやり方で, 例えば1億語彙までスケールするとして2乗の1京回×数千次元バックプロパゲーションなしで学習するというのは……さすがにきついかと.

バックプロパゲーションが要らないという主張については活性化関数がきわめて単純だから. それなら全層に渡しても「修正」できるでしょう.つまり自明に近いですね.

勾配消失なんて関係ない, という主張については, xorというゼロイチでしか見ないのであれば勾配消失も何もありません. 永遠に層を貫通するわけですから, 何層増やそうがほとんど意味が出てこない. つまりそれは実際には極めて浅い層だけで動いてると思われる.

「こんに」から「ち」「は」が次文予測できたとの報告ですが, まぁ……それが「大規模言語モデル=LLM」にそのままスケールできると言い切れるのはなぜでしょうか?

MNISTだけでなくGLUEあたりをパスしてからにした方がいいと考える次第です.

```x

▶︎ 私が批判されながら、誤差逆伝播に変わるアルゴリズムや精度を30%→100%まで持っていく頭のおかしい行動が取れる理由は、以下の思想があるから

▶︎ 1. 私のNNは高次元の万能近似回路

▶︎ 2. RNNだろうがCNNだろうが展開すれば可能

▶︎ 3. 何十回と失敗した経験則から、原因と対策殆どわかっている

```

殆どわかってる, との事ですが, なんで上手くいってるのか分かってないとも自分で明言なさっている. ↓↓↓

```x

▶︎ 学習が進まないの、謎。単体だと上手く動いてるはず?何が原因だろうか。

▶︎ 学習アルゴリズム開発者本人ですが、なぜ学習が進むのかは謎です。

```

既存手法があまたの失敗の上で最適だと言われてきてる経緯もよく知った方がよい.

それはごく初期にそういった様々な試行錯誤のうえで「やはりGELUやBP現実的にいい性能が出せるし, コストも抑えてこれである」と様々な研究者合意しているような状況.

そして, そもそもアカデミアは自分アイディアも含めて新規手法を常に疑ってかかるのが基本姿勢.

ジャーナルに「不確実さ」を載せないためで, それが積み重なると自他問わず全ての研究が信用出来なくなってしまうため. だから懐疑的になる. 個人攻撃ではないのです.

そして「危険すぎるから論文にできない」について.

さないのも自由ですが, 前述の理由で信頼を得られない. これは言動に一切関わらず, その厳密性をフラット評価してそう判断しているから. 感情ではなく, 論理として.

……と, ここまで色々と蛇足アドバイスをさせていただいたものの, この投稿に対しても

```x

▶︎ 何もわかってない人が国産LLMのやつ批判してて吹いたww

```

といったツイートをなさるのでしょう. (過去に氏がそう仰っていたので)

先に答えておきますね.

自分のやってることがご自分でお分かりにならないようなら, 私にわかるわけがないですし仰る通りです. ただ, 詳しい者として一般論は申し上げられます.」

まだ間に合いますので, 大学院あたりまで修了なさるのがおすすめです.

Twitterに何を投稿しようと自由です. でも自分違和感を見て見ないふりするのだけはやめたほうがよろしい. 既存手法と同等に自分手法を疑うこと, これは研究者としての基本姿勢です.

何故ここまでつらつら申し上げたかと言いますと,

研究テーマ設定を見かけるとついつい, より良い筋でやっていけるようアドバイスしたくなってしまう性が染み付いてしまっているためでして.

もちろん, 関わりのない方ですので蛇足しかないのですが, 多くの方に影響力をお持ちでありつつ研究の進め方については独自姿勢を持つように見受けられまして.

それはもちろん根本的には自由でありつつ, 相談相手需要がもしあればひとつの(一般的)意見をお渡しできるかなと思いキーボードを叩いた次第です.

どうか匿名でご勘弁を.

ぜひ成功できますよう. 圧倒的な成果をお祈りしております.

--------

追記

おそらく氏のやられていることは順伝播 (forward propagation) のみでの学習かと思いますが, この手法の先行研究は山のように存在します.

(Hebbian theory, Perceptron, Adaptive Linear Neuron:ADALIN, Widrow-Hoff learning rule...)

見つけられないとすれば, 古典的 (1960~1980年頃) ゆえに電子化されていないためです. 現行の商用LLMがそれらの情報簡単連想して引用できず, DR等で検索しても出てこないのはその為でしょう.

これらに簡単アクセスするためにはやはり学術機関所属して図書館を利用するのが圧倒的に楽です. マイクロフィルムや紙媒体しか残っていないものもありますから.

また, 有料データベースであるJSTOR, IEEE Xplore, Springer Linkなどにもアクセスが出来ます.

この観点から大学に足を運ばれることをお勧めします.

なお, arXivあくまプレプリントですので, 論文として引用するには査読を通過したものをつよく推奨します. ジャーナルもものによっては不十分な査読掲載されてしまますので, トップカンファレンスのものを信頼できる足がかりの論理として扱うのが基本的な考え方となります.

また, 「分からなければ (大量に貼った) 論文を読んでください」という姿勢は, それぞれをどう引用し, どのように自分の主張と論理的に接続するかの説明がなされなければ根拠として見なされないのが一般的な考え方です.

ブログとしての掲載はもちろん自由ですが, それらを十分な説明として取り扱ってもらうには至らないでしょう.

あくま一般論ですが,

論文引用するからにはそういった丁寧な取り扱いをすることを期待されるものです. 「敬意がない」と他の方から指摘されるのはおそらくそれが理由でしょう.

これは, 過去論文引用しながら新たな主張を論文として営々と積み上げ続けてきたアカデミアの「過去への感謝」という慣習です.

人の行動は自由ですから「こうしろ」とは申し上げませんが, この暗黙の了解を保持する (≈研究機関所属したことのある) 方から理解を得るのはこのままですときわめて難しいであろう, とアドバイスさせてください.

こういった主張のやり方を自分なりに一から身につけるのはたいへん難しいので, どなたかそういった手法を学べる信頼できる方に師事することをおすすめしている次第です.

2025-05-30

書籍価値が下がる時代

書籍価値が下がる時代と言うが、アテンションエコノミーとかそういう話ではない

まずゴーストライター。これは何も知識のない書く能力だけの奴がググるなりしてテキトーなことを代筆するやつ

これは前から存在していたが、ひ○○きもホ○○○ンもおそらくはゴーストライターが書いている

んで、最近AI生成が出現したから、人間ゴーストライターに頼むまでもなく、AI自体ゴーストライターの役目を果たすようになった

ってことは人間が持っている生き生きとした知見など、もはや書籍には存在しないということだ

もし書籍を買うなら、昔の哲学書原典とかそういうもの価値が出るだろう

あるいはAMSやSpringerが出している数学書とかO'Reillyが出している技術書とかは客観知なのでまだ価値はある

2025-05-17

anond:20250517162314

いか、まず落ち着いて自分の主張を読んでみろ。語尾に「wwwww」連発して自分に酔ってる暇があるなら、論理の基礎ぐらい学んでから出直してこい。

まず「Natureに名指しで不正大国とされた日本」とかいうのは、確かに2000年代からいくつかの不正事例が報告されたのは事実だ。

しかし、重要なのは「発覚」して「処分」され、「制度的に是正される」ことだ。日本では不正が見つかれば学会と省庁の調査が入り、処分が公開される。お前がそれを知ってる時点で、透明性が機能してる証拠だ。

対して中国はどうだ?国外ジャーナル掲載された論文が大量撤回されても、国内では一切報道されず、関係者も表舞台から消えない。

2020年SpringerとElsevierが中国病院研究機関から出た数百本のゴーストライティング論文を一括撤回した事件、覚えてないのか?

そもそも不正が少ない国」じゃなくて「不正が表に出ない国」だろうが。国家学術監督機関メディアも押さえてる国の「不正がない」って言葉信頼性なんか1ミリもない。

次に半導体。EUVを自国製造に成功?どこの情報だ?ASMLがEUV装置を唯一製造していて、その技術は日米蘭の厳格な輸出管理対象

中国が開発したとされるEUVは、せいぜい「プロトタイプレベルの試作段階」で、実際に量産ラインに投入可能な歩留まりや安定性を持っていない。

smicが先端プロセスにもう少しって、お前それ3年前から言ってるやつだろ。TSMCSamsungが3nm世代の量産を始めてる今、もう少しと言ってる時点で追いついてないって意味なんだよ。

官民一体で猛追?だから何?追いつくことと追い越すことは別物だ。

しかも、その「官民一体」の実態は、国家補助金を受けた企業コネ癒着資金を浪費し、成果を水増し報告して処分される事例が多発してる。

中国国家ファンド「大基金」が2023年に数十人規模で汚職摘発されたの、忘れたのか?

日本の足を引っ張り合う政治問題だが、少なくともそれは表に出て議論できる。中国のように、情報統制と密室の中で腐敗が制度として温存されてる状況で「一体化」と言われても、それは独裁体制の別名に過ぎない。

月面着陸についても知識不足露骨すぎて笑える。中国の「月の裏側への着陸」は確かに偉業だ。

ただし、その後のミッション運用情報ほとんどが非公開、サンプルの国際共有も制限された。

技術はすごい、だが科学は共有と再現性がなければ発展しない。

対して日本のSLIMは、狙った10m四方ピンポイント着陸に人類で初めて成功した。これが「ただ落ちた」扱いされるのなら、お前の脳には重力制御概念が入ってないんだろう。

しかも、国際協力の中で透明性高く技術成果を共有してる。この違いはデカい。

あと「他国迷惑」って何が?どこにどんな国際的迷惑をかけたのか、具体的に一例でも出してみろよ。出せないだろ。お前のはただの感情論だ。

それと最後に、論文引用数で語るなら、その前に基本統計確認してこい。

中国論文数が多いのは事実だ。しかし、引用数・被引用率の中央値で見ると、まだ西側主要国に比べて低い。

まり、数は多くても質のある研究比率は高くない。それに中国国内での自己引用系列引用が異常に多いことも知られてる。量の暴力は見かけ上の成績は上がるが、国際学術の中での本質的評価には直結しない。

あと最後に言っとくが、幸福度生活満足度・消費力に直結する年収中央値中国都市部でようやく月4〜5万円レベルだ。農村部を入れれば中央値さらに下がる。

表面のGDPがどうであれ、国民一人ひとりの生活が全く豊かになっていないのが中国経済の実態なんだよ。

対して日本賃金の伸び悩みはあるが、それでもインフラ医療社会保障込みでの可処分所得生活の安定性は桁違い。量と見かけの数値だけを見て勝ちと判断するお前の思考が、何より知的に貧しい。

もう少しまともな根拠を出してから話そうな。知恵遅れ呼ばわりする前に、自分が何も理解してないってことを自覚しろ。それがスタートラインだ。

2023-09-16

日本の政治が間違ってるから研究力が落ちる😭

お前らだけで出来る施策教えてやるよ

日本の国際誌に良い論文出してIF上げる

はいやれ今すぐやれ

自分エゴでElsevierやSpringerに金流してんだから国のためとか何とかアホみたいなこと言ってんじゃないよ

2022-11-09

anond:20221109141805

技術書」で2万3万ってどういう分野だ?

Springerとかだったらそういう値段しなくもないけど、「技術書」というイメージではない。

2020-10-19

今時の検索方法ってどういうのなの?

自分情弱なので、GoogleDuckDuckgoを使うくらいしかできない。

ヘルプに書かれている、「@(ソーシャルメディア名)」をつけて限定するとか、完全一致や除外はわかる。


例えば、コロナで非接触で体温を多くの人が測っているわけだが、

工学実験をしていると、放射温度計を使うときは、黒体炉で測定して、測定したい物に黒体テープを張り付けないと上手く測れないなという実感があるが、

マスクをして、眼鏡をかけて、額は髪の毛で覆われていても測定できているので不思議に思っている。

もちろん人を測定したいだけなので、バラツキや相関から決めればいいのだろうが、こういう定義でやってるのが出てこない。


他の例だと、音声を処理するアルゴリズムについて一覧を探したいとする。

だが大抵出てくるのは一覧ではなく、一部のアルゴリズムについてだけだ。

結局、Springer Handbook of Speech Processingという書籍に書かれているというのが一番詳しく、

この書籍出版された2007年以降のアルゴリズムについては部分的しかからなかった。


検索でヒットする場合問題ない。

検索でヒットしない場合は、本当にないのか、検索ワードが悪いのか、自分判断しないといけないわけだが、

母集団を知っているわけではないし、定期的に大規模調査をしてズレがないか確認するといったこともできない。


新しい検索サイトが出たとか、ヘルプに書かれているような検索方法は、ブログなどで紹介されるわけだが、

ヘルプ以上の情報が見つけられない。


情強と呼ばれる人は一体どのような手法を用いているのか。

2020-02-04

日本人は死んだ。日本希望はない。民主主義を捨てた奴隷なのだ

澤田愛子

@aiko33151709

大学定年退職フリー研究者欧州ESPMH会員。安倍政権に危機感を抱き2015年末よりツイッターを始めました。『夜の記憶』(創元社)の著者、Encyclopedia of Global Bioethics (Springer,2015) 他の執筆者。悪意で攻撃してくる場合対応しません。酷い時は名誉棄損で訴えます

2014-02-24

http://anond.hatelabo.jp/20140224005552

springer電子版とかは制限なしのpdfダウンロードできるけどな。

あいう形式が普及すればいいんだけど、まあ子供達はモラルとか無いから余裕でコピー配布しまくるだろうね。

出版社の気持ちも分かる。適当認証機能つきにするのが落としどころだろうなあ。

2011-09-02

学術出版という封建制

西洋世界でもっとも無慈悲な資本主義者は誰だろうか?

彼らの独占の仕方の前では、ウォルマートさえ街角個人商店にすぎず、

メディアマードックでさえ社会主義者に見える。

そのような候補者は限りなくあるだろうが、

私が一票を投じる先は銀行でも保険屋でもない。

学術出版社である

科学最先端研究を理解することが望ましいということには、誰もが賛意を惜しまない。

最新の知識を欠いては安定した民主的決定は不可能だ。

しか出版社はその門の前に立入禁止の札を掲げる。

タイムズ紙やサンデー・タイムズ紙をアクセスするのに24時間あたり1ドルという、

マードック流の購読システムには飽き飽きしている人も多いだろう。

しかし、少なくともその期間内はいくつでも記事を読めるし、ダウンロードしておくこともできる。

エルゼビアの出版する学術雑誌では、1つの論文を読むのに31.50ドルかかる(原注1)。

シュプリンガーは34.95ユーロ(原注2)。ワイリー・ブラックウェルは42ドルだ(原注3)。

10件読みたければその10倍を払わなければならない。

そして出版社は永続的な著作権を保持している。

1981年出版されたレターを読みたければ、やはり31.50ドルだ(原注4)。

もちろん、(まだそれがあるとして)図書館で読むという選択肢もあるが、

図書館も多額の購読料に苦しめられている。

化学分野の学術雑誌場合、年間購読料は平均して3792ドルだ(原注5)。

なかには年間1万ドル以上に及ぶものもある。

私が見た範囲ではエルゼビアの Biochimica et Biophysica Acta の2万930ドル(原注6)が最高額だ。

大学図書館は購読を打ちきることで帳尻を合わせようとしているが、雑誌購読費は予算の65%を占めている(原注7)。

大学支出のうち学術雑誌購読料はかなりの割合を占めており、

そのつけは学生に跳ね返ってくる。

マードック記者編集者賃金を払っており、

彼の会社群が使うコンテンツの大半は彼ら自身が作ったものだ。

一方、学術出版社論文論文の査読と編集作業の大半とをタダで手に入れている。

コンテンツ製作に当たって支払いをするのは出版社自身ではなく、

政府による研究費を通して支払う私たちだ。

そしてそれを読むために、私たちはもう一度支払うのである

上がりは天文学的だ。

会計年度のエルゼビアの経常利益営業利益は 36% (20ポンド収入中7億2400万ポンド)(原注

8)。

この結果は市場の独占から来ている。

エルゼビア、シュプリンガー、ワイリーはそれぞれ競合企業を買収した結果、

今では学術雑誌出版の42%を占めている(原注9)。

さらに重要なのは大学が購読にロックされていることだ。

つの学術論文は一ヶ所でしか出版されず、

研究者は最新の情報に追いつくためそれを読まなければならない。

需要弾力性はなく、競争存在しない。

同じ内容を別の出版社出版することはできないからだ。

多くの場合出版者はたくさんの学術雑誌パッケージとしてまとめて購読するよう、図書館に強制している。

この国の人々を食い物にした極悪人の一人、

ロバートマクスウェルが学術出版でその財の大半をなしたことは驚くに当たらない。

製作と配布の費用をまかなうためにこれらの購読料を課さざるをえない、と出版社は主張する。

また(シュプリンガー言葉では)「雑誌ブランドを築き、学術情報流通電子的基盤で支援する」という付加価値提供もしているという(原注10)。

しかドイツ銀行の分析では異なる結論が出ている。

出版社出版プロセスに与える付加価値は相対的にはほとんどないと考えられる。

もし出版社の反論するように出版プロセスがそれほど複雑で高コストだとすれば、40%の利益率は不可能だ」(原注11)。

出版社は、投稿から出版までに1年以上の長いプロセスをかけることによって、

研究を伝播させるどころか研究を隠してしまっている(原注12)。

ここに見られるのは、公共の資源を独占し不当な価格を課す、純粋なレンティエ資本主義である

経済寄生ともいえよう。

その製作に当たって自分たちがすでに支払っている知識を得たければ、

私たちは地主土地を明け渡さなければならないのだ。

これが学術界に対して害をなすのはもちろんだが、

世俗に対してはさらにひどいことになっている。

私は主張をするときは根拠となる原典をたどれるようにしておくべき、

という原理にしたがって、査読済み論文引用する。

だがその主張を私が公正に要約しているかどうか、読者が検証しようと思っても、

その費用を支払えるとは限らない。

在野の研究者重要な学術雑誌に目を通しておきたければ、

数千ポンドを支払わなければならない(原注12)。

これは教育への課税、公共の知の収奪である

「全ての人は自由に……科学の進展とその恩恵を享受する権利を有する」とする世界人権宣言抵触する恐れすらある(原注13)。

Public Library of Science (PLoS) や物理arxiv.org などの優れた事例もあるとはいえ、

オープンアクセス出版は独占資本家を駆逐するには至らなかった。

1998年エコノミスト誌は電子出版の可能性を調査し、

利益率40%の時代はまもなくロバートマクスウェルと同様に終わりを迎えるかもしれない」と予言した(原注14)。

しか2010年のエルゼビアの利益率は1998年と変わらず36%のままだった(原注15)。

その理由は、大出版社インパクトファクター上位に来る学術雑誌を手中にしているからだ。

こうした雑誌出版することは、研究者にとって、研究費を獲得しキャリアを積むためにかかせない(原注16)。

とっかかりとしてオープンアクセスジャーナルを読むことはできるが、

クローズドな方もけっきょくは読まなければならない。

少数の例外を除いて、各国政府は彼らと対決することができていない。

米国 National Institutes of Health は、自らの研究費を獲得した研究者オープンアクセスアーカイブ論文を置くように求めている(原注17)が、

英国の Research Council の公共アクセスについての宣言は無意味の極致である

それは「出版社現在ポリシー精神を維持しつづけるという仮定」に基づいている(原注18)。

政府は短期的には、出版社に対する監視機関を備えるとともに、

政府研究費に基づいて製作される論文がすべて無料の公共データベースにおかれるよう強制すべきだ(原注19)。

また長期的には、政府研究者協調して中間搾取者を追い出し、

ビョルン・ブレンブスの提案に沿い、学術論文データ世界単一アーカイブを作る取り組みを進めるべきだ(原注20)。

査読を監督する独立した機関を設置し、

いまは略奪を受けている図書館支出でそれを運営することもできるだろう。

知識の独占は、穀物法と同様、正当化できない前時代の遺物だ。

寄生地主を追放し、私たちの研究解放しよう。

George Monbiot

2011年8月30日ガーディアン

http://www.monbiot.com/2011/08/29/the-lairds-of-learning/

 
ログイン ユーザー登録
ようこそ ゲスト さん