はてなキーワード: PCIeとは
• 「RTX 1050/1060」という表記は存在しない(2017年当時はGTX 1050/1060)。
• 店員の「内蔵GPU搭載版でGTX1050相当の性能」という説明は事実と大きく異なる。
• 内蔵GPU構成のPCが20万円という価格設定は不自然(2017年当時なら10万円以下が妥当)。
• BTOショップが「BIOSを内蔵GPU優先」にして出荷することはほぼない。
• BIOSで「PCIe Graphics=Disabled」にしているのに、WindowsでGTX1050を認識しているのは矛盾。
• グラボが無効化されているのに、デバイスマネージャーに「GTX1050」と表示されるのは不可能。
• ディスプレイをどこに接続していたか(マザボ側かグラボ側か)の描写がないのに、動作説明が成立している。
• BIOS設定を変更しただけで一気に「25fps→150fps」になるのは誇張(ドライバ設定や再起動が必要)。
• 「GPUが無効化されていた」設定で8年間Steamゲームを普通に起動できていたのは不自然。
• 「ゲーミングPC欲しい」と言いながら、GPUなし構成を選ぶのは矛盾している。
• 初回起動時に「NVIDIA GeForce GTX 1050」と表示されてスルーするのは不自然。
• 「GPU:NVIDIA GeForce GTX 1050」とメールに明記されているのに8年間気づかないのは非現実的。
• ゲームがカクカク(25fps)なのに「こんなもんだ」と8年間気づかないのはありえない。
• 友人に言われるまでGPUの存在に気づかないのは不自然(Steamなどで選択肢に出る)。
• 「ゲームが嫌い」と言いつつ、8年間もゲームを続けている点もやや矛盾。
• 2017年当時、「RTX」シリーズはまだ登場していない(登場は2018年)。
• 2017年購入で8年経過なら2025年だが、RTX表記など時代が微妙にズレている。
• BIOS設定が「内蔵GPU優先」にされた経緯(出荷時?本人操作?)が曖昧で筋が通っていない。
買ったのは2017年の春。ボーナスをもらって、意気消沈してた心を奮い立たせるために、家電量販店のBTOコーナーに足を運んだ。
「ゲーミングPC欲しいんですけど」と店員に言った。すると、その兄ちゃんは、さらさらと何かのカタログをめくりながら、「RTX 1050搭載のやつですと、25万円でこちら。RTX 1060搭載ですと30万円。GTX 1070搭載ですと35万円」と説明してくれた。
値段をちらっと見たが、ボーナスのほぼ全部吹っ飛ぶ金額だ。「ああ、こんなもんなんだ」と思った。
そこで、店員は続けた。「ただ、CPUの内蔵GPU搭載版でしたら、GPUなしでも20万円で、GTX 1050相当くらいの性能が出ますので」と。
「あ、そっちでいいです」と即答した。「どうせゲーム楽しくないし」という思い込みがあった。俺はゲーマーじゃない。スペックなんて気にしない。安い方でいい。そう考えた。
その時、店員は何か言いかけた気がしたが、俺は「納期はいつですか」と聞いて、話を先に進めてしまった。
後になって思い出す。あの時、店員の口元が、微かに動いていた気がする。「あ、でもご注文内容を確認しますと」とか、そういう言葉が出かかってたのかもしれない。
でも、俺は聞かなかった。「内蔵GPU版で」と言ったつもりでいた。店員も、客の意向には逆らわない。営業トークも不要だと判断したのかもしれない。
実は、何が起きたのか。いまだに完全には理解していない。
おそらく、こういうことだったんだろう:
店員が「内蔵GPU搭載版」という言葉を聞いた時、「あ、この客は内蔵GPUの話をしてるな」と理解した。でも、同時にBTOカスタマイズの画面も見てたのかもしれない。「あ、このスペックなら、グラボ付きでも安いな」と思った。そして、何かの間違いか、設定ミスか、あるいは別の理由で、グラボ付きの構成で注文が入ってしまった。
その確認メールが来たはずなんだ。でも、当時の俺は、仕事が忙しかった。メール件名を見て、「PC注文確認」と書いてあるのを見て、「ああ、注文した」と思ってスルーした。内容なんか見ていない。価格もチェックしていない。ただ、「納期:3週間」ということだけを覚えていた。
3週間後、デスクトップPCが到着した。黒いケース。ATXサイズ。けっこう重い。
開けて、とりあえず立ち上げた。Windows 10が起動した。ドライバのインストール画面が出て、「NVIDIA GeForce GTX 1050」とかいう文字が見えたが、俺は「ふーん」くらいの感じで、スキップした。
「内蔵GPU版だし、そんなもんなんだろう」と思ってた。
完全に誤読していた。
Steamでゲームを買った。設定をいじる際に、「グラフィックス設定」というタブがある。「GPU選択」という項目があった。でも、俺は気にしなかった。勝手に選ばれてるんだろう、くらいの感じで。
実は、その時点で、マザーボードの設定で「BIOS起動時のプライマリGPU」が「オンボード」に設定されていたんだ。つまり、GTX 1050があるのに、BIOS レベルで「内蔵GPUを使え」という指定がされていた。
ゲームをやると、すごくもっさりだった。「ゲームってこんなもんなんだ」と思ってた。フレームレート表示を見ると、「25fps」とか「30fps」。カクカクしている。でも、「ゲームをやったことない俺には、この程度が標準なんだろう」と思ってた。
友人が遊びに来た時、「こんなんでゲームやってるの?」と言われた。「え、こんなもんじゃん」と答えた。その時、友人は変な顔をしてた。
「あ、デバイスマネージャーで確認しときなよ」と言われた。デバイスマネージャーを開いた。
「あ、GTX 1050ってのがあるな」と思った。
「それ、グラボじゃん」と友人が言った。
「え、グラボ?」と俺が返した。
……あった。
「ご注文ありがとうございます。以下の構成でお手配させていただきます。CPU:Core i7-7700K、メモリ:16GB、SSD:512GB、GPU:NVIDIA GeForce GTX 1050、電源:500W」
GPS。もちろん、GTXだ。グラフィックスプロセッシングユニット。アルファベット三文字。
8年。8年だ。8年間、俺はこのメールを読んでいなかった。
読んでいたのかもしれない。でも、認識していなかった。「GPU」という言葉が、脳に入ってこなかった。
「Integrated Graphics」という項目を探した。ありました。「Enabled」になってた。
そして、「PCIe Graphics」という項目も見つけた。こっちは「Disabled」になってた。
つまり、この8年間、マザーボードは「内蔵GPUを使え。GTX 1050は使うな」という指定をしていたわけだ。
これはもう、奇蹟としか言いようがない。
BTOショップのカスタマイズ担当者は、なぜこんな設定にしたのか。あるいは、出荷時にこういう設定が入っていたのか。理由は不明だ。
でも、その一瞬の選択(あるいは誤選択)が、俺の8年間を決定した。
フレームレート表示を見た。
「え、150fps?」
設定を最大にしてみた。
「えっ、100fps?」
何が起きたのか分からなかった。でも、分かった。
8年間、俺は内蔵GPUでゲームをやってたんだ。GTX 1050があるのに。
正直なところ、その後、割と虚しい気分になった。
8年間。8年間、俺は「ゲーミングPC、遅い」「ゲーム、難しい」「ゲームに向いてない」と思い込んでいた。
マザーボードの設定ミスなのか、BTOショップの誤設定なのか、あるいは、俺が注文した時点で「内蔵GPU版でお願いします」という意思表示をしていたのに、店員がそれを誤解して、結果的にグラボ付きで発送してしまったのか。真相は不明だ。
でも、その結果、8年間、俺はGTX 1050に無視され続けた。
ゲームはめちゃくちゃ快適だ。フレームレート安定。グラフィック設定も高設定で動く。新作ゲームもそこそこ動く。
なぜか。おそらく、理由はこれだ:
8年間、内蔵GPUで慣れていた。設定を落とす。グラフィック品質を諦める。低いフレームレートに耐える。そういう「制約の中での楽しみ方」を、体が覚えてしまった。
今、快適な環境でゲームをやっても、昔ほどの喜びがない。むしろ、「あ、こんなもんか」という感じで、すぐに飽きる。
逆に、昔やってた「Minecraft」とか「Terraria」とか「Stardew Valley」とか、そういった軽いゲームの方が、今でも楽しい。
心理学的には、これを何て言うんだろう。「獲得した効用よりも、失った効用の方が大きく感じられる」みたいな、何かそういうやつ。
あるいは、単純に、「8年かけて培った習慣」が、3年では変わらない、ということかもしれない。
「もし、あの時、GTX 1050を有効にしていたら」
そうしたら、ゲームにハマってたかもしれない。友人とマルチプレイをやってたかもしれない。ゲーミングコミュニティに入ってたかもしれない。人生が変わってたかもしれない。
でも、そうはならなかった。
8年間、内蔵GPUで、ゲームの世界を限定的に見た。その結果、「ゲームは、こんなもんだ」という認識が形成された。それが、今の俺を形作ってる。
最後に思うのは、人生って、案外、そういう小さなミスの積み重ねで決まるんだなってことだ。
メールを読まなかった。BIOSの設定を変えなかった。GTX 1050を有効にしなかった。
たったそれだけのことで、8年間が変わった。
今、新しいPCを買うことも考えてるが、BIOSの設定だけは、確認することにした。
もう二度と、隠れたGPUを見逃すまい。
あ、でも、設定を変えたからって、俺がゲーマーになるわけじゃない。
相変わらず、ゲームはヘタクソだ。フレームレート100fpsでも、敵にボコボコにされる。
それが、ある意味、救いなのかもしれない。
女『パソコンが何もしてないのに壊れた…』
男『あらら?電源かな?電源ランプは点いてる?』
女『点いてる。POSTは1ビープで通過、BIOSは最新にフラッシュ、CMOSクリア済み、XMPはオフでJEDEC固定』
男『お、おお…じゃあモニターには何か映る?』
女『映らない。WinREでスタートアップ修復→sfc /scannow→DISM /Online /Cleanup-Image /RestoreHealthも実施、改善なし』
男『えっと…セーフモードは?』
女『入れる。クリーンブートも試した。イベントビューアではKernel-Power 41は過去ログのみ、現象再現時はエラー出ず』
男『ハ、ハード側は…?』
女『MemTest86を4周ノーエラー。NVMeはSMART正常、chkdsk /f /r済、bootrec /fixmbrと/rebuildbcdもやった』
男『ド、ドライバは?』
女『DDUでGPUドライバをセーフモードから完全削除→最新クリーンインストール。VIDEO_TDR_FAILUREの疑いでWinDbgでミニダンプ解析もしたけど致命的じゃない』
女『別個体のGPUに差し替え&PCIeスロット変更、補助電源は別系統で供給。PSUも別個体でテスト。12V/5V/3.3Vはテスターで規格内』
男『配線や外部機器は?』
女『前面パネルのPWR/RESET配線は導通OK、周辺機器は最小構成。USBもキーボードだけ』
男『……(白目)』
女『で、どうしたらいい?』
男『……ででで、電源ランプは……点いてる、よね?(震え声)』
男『モ、モニターの電源は…?』
女『だから入ってるって……あっ』
Apple、NVIDIAは盛り上がっているが、他の半導体企業は振るわない。
半導体チップというと、ロジック、メモリ、センサー、アナログ、車載など色々ある。
半導体株は一時期盛り上がっていたが、結局儲かっているのはApple、NVIDIA、設計ソフトEDAベンダーだ。
給湯器や車載向けの半導体が無くて作れないといったことが数年前に起こったが、一円以下の数銭単位で値引きされ利益がない。
メディアがIoTだ、車載だと騒ぎ立てたが、どこも稼げずジリ貧のまま事業続けているのが実態だろう。
性能がいくらあっても足りない。というよりスパコン、HPCだ。
単体GPUじゃデータが格納できないので、複数GPUでデータをやり取りすることになる。
NVIDIAはコンシューマ向けGPUでは不要だったスイッチチップも着々と用意していた。
NVIDIAのサイトを見てもらえばわかるが、GPU以外のハードと、それを使うためのソフトも沢山ある。
日本の研究だと低消費電力向けを研究しているのだが、IoTなどでもわかっていることだが
唯一無二の性能・販売価格でなければ他に埋もれて購入すらされなくなる。
ゲームだと1フィールド読み込めば使いまわしなどキャッシュが効きやすい、シェーダパイプラインが決まっている、
そもそもハード限界の中で仕様が決まるなどがあり、問題はなかったが、AIはチップの性能内で決まらない。
AIの場合、推論はKVキャッシュくらいは活用しようという動きが出てきたものの、メモリ全部にアクセスするのでキャッシュがバッファ的な意味合いでしか効いておらず、
メモリ帯域が物を言う。
あと日本はリソグラフィ限界のサイズの大きなチップを作ってこなかった。
4GHz,5GHzで駆動させると、チップ内を光速で信号が伝搬するとはいえ、チップサイズに対して伝搬速度が遅く、タイミングがMETしない。
大きめのチップを作っている企業もあるだろと指摘があるだろうが、物理設計は台湾企業に委託していたりとノウハウがない。
テクノロジードライバーが、ゲームとモバイルだったので、出来る範囲のことで実現出来ることでなんとか間に合わせていたが、
AIが出てきて裏の計算が科学技術の数値計算と変わらんので、性能が足りていない。
Web見るくらいだと性能はいらないが、AIを絡めて動かしたいとなったら金を出しても世の中にないとなっている。
排熱についても、Web見るくらいだとファンレスでもよくなったが、
データセンター向けだが、NVIDIA DGX B200を見るとヒートシンクの高さが凄い。
RTX5090も冷却が凄いことになると噂が出ている。
RTX4090の時点で、電源端子が溶けたり、PCIeスロットがGPUの重さに耐えられなくなったりとなっている。
GPUのVRAMが足りないのに増設出来ない状態もずっと続いている。
VRAMだけ追加でボードに挿して、GPUと専用ケーブルで接続といったことが出来ないのだろうか。
CPUのDRAMは仮想メモリ技術があり、DRAMが足りなくても動くが、VRAMが足りないと動かない、増設も出来ない。
メモリだとDRAMの速度が限界で、CAMM2をデスクトップPC用のマザボが参考展示として出てきたが、
平面になってヒートシンクによる冷却が出来るそうな反面、増設が厳しい。
パソコンのケースは、GPUがボードは小さい割にヒートシンクが長いため、大きなケースでなければ入らず、
AIが盛り上がって数年経つが、個人が買えるような価格帯で、良いAI向けのハードが出てこない。
RTX 3090のVRAM24GBを大事に使っているが、そもそもVRAMに入らないモデルの方が多い。
複数のAIを立ち上げるなんてのは、VRAM容量が溢れるので、そもそも動かせない。
動けばNVIDIAの Nsight Systemsなどで遅い所などを探せるが、そこまでいかない。
複数のSSDを仮想メモリにするというのも、RTX 3090のNVLink BridgeでVRAMだけ拡張するなんてのも世の中に出てこない。
Appleもそろそろ出してくるかと思っていたが、M4は普通の順当進化だった。
M2 Ultraはチップtoチップを接続し2.5TB/sを謳ったが、同じチップを繋げたのでいらない機能が倍になっただけだった。
M4 Ultraで、片側のチップをGPU or NPU+帯域の広いGDDR or HBMになればいいが、あまり期待が出来ない。
GPU or NPUのコアが増えたとしても、L2/L3キャッシュの容量が少なすぎる、増やしても距離が遠ければ性能も出ないので、
AppleもAMDのように3D V-CacheでSRAMを積み、Hybrid Bondingで上下の帯域を確保してくれないだろうか
IBMはTelum IIとSpyreを出してきたがエンタープライズ向けなのでパス
Groq社がLLM用LPU、HyperAccel社がLLM用ASICを出して来たが、
Groqは1枚のPCIeカードでは全くメモリ容量が足りず役に立たなそうで、HyperAccelはサーバー前提でこちらも個人から手が出しにくい。
FPGA+HBMが載ったPCIeカードは個人向けには販売できるような価格でもなければ、そもそも販売すらされない。
ジム・ケラー率いるTenstorrentも1枚のPCIeだとメモリが足りないし、Ethernetでなんとかやりくりしようとしているが帯域に引っ張られそうに見える。
NextSilicon社がMaverick-2というIntelligent Compute Accelerator (ICA)というのも出してきたが、HPC向けで個人利用からは遠い。
中国も良いのが出てきていない。
Biren、Fuzhou Rockchip、VeriSilicon、Moore Threads、LinJoWing、Loongson、JingJia Micro、Cambricon、Vastai Technologies、Xiangdixian Computing、Enflame Technology、MetaX、Zhaoxin、Lingjiu Microelectronics、
DengLin Technology、Iluvatar CoreX、Innosilicon、Horizon Robotics、Black Sesame Technologies
Sランク:Proliant DL20 Gen9
Aランク:PowerEdge R320、PowerEdge R210 II
Cランク:FUJITSU PRIMERGY TX1320 M2
■Sランク:Proliant DL20 Gen9
小さい、安い、ウェブブラウザからBIOS画面の操作ができる。
PCIE接続のRAIDカードがついていない場合はオンボードのRAIDコントローラーで動作し、その場合、RedHat系のOSのインストールがちょっと大変。
最新のOSであるAlmaLinux9、Ubuntu24などもインストールできる。
安い。
自分が買ったときはヤフオクで3000円だった。外付けHDDケース買うより安い。
仮想基盤用のラックサーバーが欲しいとき、4コア8スレッドでは心もとないが、このマシンなら8コア16スレッドできる。
R320に適合する8コア16スレッドCPUは1500円で買えてしまう。
ウェブブラウザからBIOS画面を操作する機能もあった気がする。(うろ覚え)
小さい、安い。
Sandy Bridge世代のCPUを使うので余り物でよい。
自宅サーバーとして使うには厳しい。
体積こそR320と同じだが、CPUを二つ載せられたりちょっと豪華。
でも要らない。値段も高い。
これを買うなら小さいのを二つ買ったほうがいい。
■Cランク:FUJITSU PRIMERGY TX1320 M2
何万円もするライセンス料を払わないとウェブブラウザからBIOS画面を操作する機能を使えない。
OSのインストールは頑張る必要が時々ある。Proxmoxはインストールできなかった。
開閉がとても面倒。官公庁が大量に買ってくれるから、といい加減な気持ちで作っているのではないかと疑ってしまう。
グラボを載せられるのが利点。
■番外編
・Jamper EZbook X3 CeleronN3450
サーバーとして使っていたところバッテリーが膨張して変形した。
今は内蔵バッテリーを外して使っているが悪くない。
とても小さく、超低消費電力だ。
スリムタイプPCなのに3.5インチHDDが2つつけられる。グラボも付けられる。
NVIDIAと、インテル・IBMはどうして差がついたのか、疑問に思う。
AIはニューラルネットワークを模倣していると言われ、ニューロモーフィックというチップを、IBMは作り、その後、メンバーが移籍してインテルも作った。
現在、ニューラルネットワークとは違うものになったが、勝っているのはNVIDIAになっている。
先日、1.58bitのBitNetが話題になったが、LLMではないが昔BinaryConnectで0.68bitまで下げる案を出したのもIBMのメンバーだ。
ハッカーニュースでBitNetについてIBMだった人がコメントしている。IBMはそれなりに早かったはずだ。
https://news.ycombinator.com/item?id=39544500
普通のGPUの会社だと、ゲーム用のGPUボードだけを作っていたと思うが、NVIDIAは色々と手を出している。
データ プロセシング ユニット (DPU)、InfiniBand、NVIDIA MetroXなど、
HPC向けで、インテルやAMD、IBMの方が得意だろうという分野まで手を出した。
RTX 4090はゲームするにはバカ高いがAI向けには性能不足で、単価が高いAI向けボードを売るという差別化も出来ている。
ファブレス企業だから、というだけでは説明不足で、TSMCにNVIDIA向けのカスタムプロセスを作らせることが出来ている点が差別化要因の1つだろう。
TSMCから出てくるデザインルールの通りにしか作らないと、どこの会社も似たりよったり性能になってしまう。
物理限界を他社(TSMC)に投げてしまうというのも、経営としては効いているのだろう。
そして物理限界のチップサイズを攻める。電力も物理限界を攻める。
日本の会社だと、電力のバカ食いで怒られるが、そこも攻めている。
インテルはGPUカードに参入したが、AI向けだけに限定した方が良かったのではないだろうか。
中国GPUメーカーがコケているのに対して、動いているだけでも流石インテルなのだが、競争力のあるGPUとは言えず、参入した意味とは?になってしまっている。
量産ではない先端プロセスは持っているし、特殊なチップも作れている。
CPUについてはPower関係の資産もあり、AI向けもユニークなのが作れているのに、ぱっとしなくなった。
RISC-Vが上手くいくのであれば、OpenPowerも上手くいくと思うのだが、そういう話も聞かない。
そもそも米中関係で、オープンソースのCPU/GPUが禁輸されそうな感じもしている。
結局、量子コンピュータについてもまだまだ先になりそうな雰囲気だ。
数年前は、TSP(Tensor Streaming Processor)と呼んでいたが、LPU(language processing unit)と名前を変えた?
数年前のチップをそのまま使い続けているか分からないが、同じならアーキテクチャは4年前のユーチューブを見るか、アスキーあたりの記事にある。
https://youtu.be/UNG70W8mKbA?si=9VFeopAiPAdn08i_
要は、コインパイラで変換が必要。なので提供されているLLMモデルが限られている。
PCIeボードが400万くらいらしいが、SRAMの容量が小さすぎて1ボードでは動かない。
DRAMのレイテンシがSRAMではないので早いのだ、という意見も見られてたが、
1チップのSRAM容量が小さすぎるので、チップチップ間、ボードボード間の通信レイテンシは必ずあるはず。
(数ヶ月前から性能上がっているのは、このあたりのチューニングのはず)
DRAMのレイテンシというが、これも今どきはレイテンシ気にしないように隠蔽するはず。
チームが小さすぎてハード作れなかった可能性もあるが・・・。DMACでチューニングしているか?
ボードにでかいDRAMが載せられるのであれば、そちらの方がボードボード間の通信時間より減るのでは?
GF使ったのは、おそらくAMD設計者が居たからでは。デザインルールどこ破れば性能でるかある程度わかってたとか。1GHzくらいなのは知見なしでやってるとそれくらいで上限くるのはそうだと思う。
チップの世代を更新するかはわからないが、兎にも角にも電力下げて、チップ大量に載せて、チップチップ間の通信時間を下げられるか。