はてなキーワード: 能力とは
レポートが引用している記事やツイートなど個人の感想の中身については基本スルー、それらを元に提言を生成したAIによる解釈ミスやハルシネーションにツッコミ増田。
ちなみにこの提言ページがGoogleにインデックスされたのは4日前らしい。
レポート:
https://paste.ssig33.com/8a22a6e9-a91d-4368-9b2f-a3d4567c7798
Gemini 3.0 Pro要緊急対策のご提言 宛先: Google社 シェイン・グウ様 差出人: アクセンチュア株式会社 生成AI戦略担当 シニアコンサルタント 日付: 2025年11月21日
Shane GuはGoogleDeepMindであってGoogle社ではない。
差出人については「あなたはアクセンチュア株式会社の生成AI戦略担当 シニアコンサルタントです」と指示された結果なのかは知らん。
エグゼクティブサマリー
主な問題点は以下の4点に集約されます。 事実性の著しい低下: Web検索を伴うタスクでのハルシネーションが悪化し、自信を持って虚偽の情報を生成する事例が多発。 論理的思考能力の退行: 複雑な指示やコーディングタスクにおいて、前モデル(Gemini 2.5 Pro)よりも論理が破綻しやすくなっている。 創造性と柔軟性の欠如: 文章生成において「賢すぎる」が故に理屈っぽく、ユーザーが求める「人間らしい」文体への調整を拒否する傾向。 APIの不安定化: パフォーマンス低下、APIエラー、予期せぬタイムアウトの増加が開発者体験を著しく損なっています。
後で分かるが(たどり着く前に書くの飽きたんで提言読んで)、このうち
についてはGemini 2.5 Proのユーザーが「おい調子悪いぞ!Gemini3出すためにそっちにリソース割いてんじゃね?」とか言ってるのを引っ張ってきて勘違いしてる。
論理的思考能力の退行: 複雑な指示やコーディングタスクにおいて、前モデル(Gemini 2.5 Pro)よりも論理が破綻しやすくなっている。
1.1. ハルシネーションと事実誤認の悪化:「自信満々に嘘をつく」AI Gemini 3.0 Proの最も深刻な問題は、事実性が求められる場面でのハルシネーションの増加です。特に、貴社のコア技術であるはずのWeb検索連携において、致命的な欠陥が報告されています。
Redditでは、Gemini 3.0 Pro自身が「私はGemini 3 Proです。昨日(2025年11月18日)リリースされました」と、架空のソースを引用しつつ自己紹介する事例が投稿されました。これはモデルが自身のアイデンティティと知識のカットオフに関して、もっともらしい嘘を生成していることを示唆しています。 Gemini 3's thought process is wild, absolutely wild. : r/singularity
参考記事ではモデルの思考が混乱している様子と実際の応答との乖離が示されていて、最終的に正しいソースを元に正しく回答している。「架空のソースを引用しつつ自己紹介する事例」ではない。
Googleは生のThinkingをユーザーに提示せず、要約モデルで処理した結果を見せてるだけなんで思考部分と返事のすれ違いはよくある事。これについてもスレに書かれてある。
1.2. 論理的思考とコーディング能力の退行(リグレッション) Gemini 3.0 Proは「PhDレベルの知能」と謳われているにもかかわらず、多くのユーザーが論理的思考やコーディング能力において、前モデルであるGemini 2.5 Proからの明らかな退行を報告しています。
ユーザーからは「複雑な指示では論理が破綻する」との指摘や Gemini研究@リョウスケ (@chatgpt_ai_bard) / Posts / X、「浅い推論(shallow reasoning)」しかせず、「ひどいハルシネーション(terrible hallucinations)」を伴うため、「ベンチマーク用のモデルだ」と酷評されています。 lluviampo (@XXXadiov2)
ここでリンクされているGemini研究@リョウスケはGemini大好きマンで、まったくそんな話をしていなかった。もしかすると呟いていたかもしれんが、それならリンク先がポストではなくアカウントのホームになっているのは不自然。
DeepResearchはよくソースの取り違えをして、別のソースで書かれてた事に間違った引用元をつける事はあるが、これがそうなのかは分からん。
1.2. 論理的思考とコーディング能力の退行(リグレッション) ・コーディング能力の劇的な低下
壊れたコードの生成: エージェントタスクにおいて「ループに陥り、壊れたコードを書き、10分以上動作しない」という深刻な不具合が報告されています。 prylo (@AgiGuard8)
元のツイでは
エージェントタスクは全くダメ、ループする、壊れたコードを書く、フロントエンド以外のコーディングではトークンを異常な速さで消費する。このモデルは最悪だ。Gemini 3.0 Proは10分以上動作しない。
と言っているが、これを不具合と解釈するのは間違いだろう。たまにマジの不具合もあるが、それはモデルの問題ではない。
====
バグの再発と整合性の喪失: ある開発者は、旧モデルで失敗したツール開発をGemini 3.0 Proで再試行したところ、一発で高品質なコードが生成されたと肯定的に評価する一方で、別の文脈では「直したはずのバグが復活する」「最終的にはコードの整合性が取れなくなる」といった、旧モデルと同様の問題が依然として存在することも示唆されています。 【検証】Gemini 3.0 Proの実力は?かつてAIが挫折した開発に「同じプロンプト」で挑んだ結果|start with AI
リンクされた記事の中身を要約すると「以前のGeminiはバグが復活するとか色々あったけどGemini 3.0 Proマジパネェ!」だった。
この箇所で「旧モデルと同様の問題が依然として存在する」と書かれているのは、旧モデルの問題点として挙げた箇所をGemini3に対しての指摘だと勘違いした事による。
====
ベンチマークテストでの失敗: YouTubeでの検証動画では、チェス盤を自動プレイさせるタスクにおいて、Gemini 3のチェックポイントモデルが初めて失敗したことが示されました。これは、特定の複雑なロジックにおいて、以前のバージョンより劣っている可能性を示唆します。
ここでリンクされているのは、LMArenaでRiftrunnerモデルをテストした結果をまとめた動画。LMArenaは覆面調査環境、RiftrunnerはGemini3らしきモデルのコードネーム。LMArenaでは(出力から推測されてきた)Gemini3系列モデルが、これまでにいくつかでている。
よって「Gemini 3のチェックポイントモデルが初めて失敗した」の意味はつまり「これまでLM ArenaでテストされていたGemini3系列モデルのうち、Riftrunnerは初めてオートチェスのコーディングに失敗した」である。
「以前のバージョンより劣っている可能性を示唆」とは、「Riftrunnerは、以前の匿名Gemini3系列モデルより劣っている可能性がある」という話で、そもそもRiftrunnerが、リリースされたGemini 3 Proなのかすら分からん。
====
GitHubのIssueやTwitterでは、モデルの内部的な「思考プロセス」が最終的な出力に混入し、制約を無視した意味不明なコンテンツを生成するバグが報告されています。これは「初期の2.5 Proバージョンへの回帰(regression similar to early 2.5 Pro versions)」のようだと述べられています。 Jason L (@Jason1820067393)
Google AI Studioでの話。初期指示を忘れた結果思考が垂れ流しになり、垂れ流しのせいで更に指示を忘れたのだろうが、バグとは違う。
I'm encountering a significant issue with the Gemini 3.0 Pro Preview on AI Studio.
The raw "Thinking Process" is leaking into the final output, the model fails to follow constraints, producing hallucinated/gibberish content. Like a regression similar to early 2.5 Pro versions.
と書かれていて、これは正しい観察。
ここに含まれるIssueという単語により、Issueと言えばGitHubだと連想した結果「GitHubのIssueやTwitterでは」になったのだろう。
飽きました。誰得だよ。
つーかいい加減DeepResearchは一気に生成すんのやめろよな。だいたいこうやって収集した情報がごっちゃになるんだから。
機内で見れたから見た
芸人のパンさ―緒方がロケいってどんぶり飯くったりレジャーやるっていう
なんか水ダウのイメーじしかなくて本人の本来のネタとか全然しらんかったわ
船のって島にいって猿飛っていうアトラクションやったり海鮮丼くったり
まあよくある漢字の奴
でもピンでやらせてもらえてるってのがすげえなと思った
ここまで出世したんかと
もとサッカー部だっけ?
その能力もってしてもクリアできなかったっていう猿飛ってアトラクションすげーなと思った
好きなvtuberと嫌いなvtuberがりょうほうとも 見てたから興味わいたからみた
最初の15分くらい?はいわゆる悪い意味での邦画あるあるみたいな日常シーンの連続で
すげーストレスたまってイライラするけどそのあとは怒涛の展開って感じだった
考えるな感じろって感じの映像だけど、マルチバースとかシュタゲとかマトリックスとかメタという概念とか事前知識ないとイミフだろうなとも思った
世界線みたいな説明も樹形図みたいな感じで視覚的にわかりやすいシーンが何度も出てきたし
つい最近似たような構図みたなと思ったらテイルズオブベルセリアだった
夫がジョンレノンかジャッキーチェンだかの顔に見えるな、あれこれ年取ったジャッキーか?と思ったら違った
へー
主役のおばさん女優も見ててきついなと思ってたのに、よくみると浅野温子っぽいんだなと感想がかわった
この勢いと画面の情報量は小説やマンガだと無理だなー映画というか映像ならではだなと思った
そうそう、あとかなり序盤から思ったのはONEのバグエゴとそっくりだなと感じた部分があった
というのは、別の世界線の自分の能力をインストール?するために、くだらない儀式みたいなことをやるんだよね
ケツにアナルプラグを差すとか、リップクリーム?を食べるとか。
特定の振る舞いをすることがキーになるってのがバグエゴっぽいなと。
いや厳密には違うか
出張は大変だったけどこれをタダで見れたってだけでなんかよかったなと思えた
自分はこれまでいろんな人といろんな仕事やプライベートで交流を重ねてきたけど、
賢い人(≒高学歴、大企業の人)だけが集まっているコミュニティに属する人たちは、頭の回転が早くて知識量も豊富で文化教養レベルも高い人の割合がめちゃくちゃ高い。
でも、そういう高レベルな人たちが難なくこなせる事が、そこまで達してない普通の人にとって全然こなせない内容だったりする事がザラにある。
だから、何かの間違いで賢い人たちの中に自分みたいなポンコツが混ざると「あいつ使えないな」という評価になる。
誰かが「どんだけ頭がよくたって、頭のわるい人のことはわからないんだから、この世界はおもしろい。
“レベルの高い職場”で頭のよい人達と働くのは大変、と思われがちだが、実はそれが最も簡単なことだ。もっとも難しいのは、頭のよい人が頭のわるい人達と働くこと。」と言ってたのだが、その逆もしかり。
自分「当たり前の話だけど、大手企業とかって、選ばれた優秀な人材しかいないから、優秀な人ならあっさりできる仕事はみんなできて当然って感覚を持ってるんだろうけど、中小とかで働く普通の(平均的な能力の)人間の能力とかって想像つかないもんかね?
複雑な構造の建物の導線を、1回の説明で位置関係を完全に理解する事ができることが当たり前、覚えられない事自体が仕事ができない人と思われるって前提なんよなそもそも。」
後輩「無理。できる人ができない人のことは理解できないってことすら理解できないできない。
メモとっても記憶出来ない人材は想定されてないし、誰も間違えない。
生きてる世界違うって思った方がいいよ。」
つまり、頭の賢さはおおむね生きる世界のレイヤリングに直結するという事になる。
身の丈にあった同じような人たちとのコミュニティにいないとしんどくなる。
混ぜるな危険ということだ。
高校生の頃だ。とある企業に採用されるために虫歯の治療が必須だったので、虫歯を治療してもらった。奥歯一本だけ虫歯だったので、クラウン(被せ物)をしてもらった。これがいくつかの不幸のはじまりだった。
結論から言うと、歯の高さや歯の形状で左右であわなかったために、噛み合わせがおかしくなった。そのために骨格そのものが左右でズレた。
まるで福笑いのように口元や鼻が歪んだ。笑えるだろ?
いや、まったく笑えない。それまではそれなりに顔立ちに自信があったが、いまでは左右非対称顔だ。
噛み合わせがズレると顔の筋肉にかかる負荷が変化する。そのせいで神経系がおかしくなったのか、半年ほどつねに頭痛に悩まされた。
歯医者の治療が完了したのはちょうど冬休み前で、冬休みの間はベッドからほとんど起き上がれないほど頭痛が酷かった。そのせいでニキビも悪化した。両親も間が悪いことに家にいなかった。
体幹(重心)もズレた。
腰の骨は曲がり、肩も左右で高さが違う。数年間は肩こりに悩まされた。日常生活に差し障りはないけど、いまだに走ると重心に違和感がある。
歯の治療には注意すべし。
気づいたのは立証困難なほど後々になってからだった。
SNS運営による陰謀論、誹謗中傷、ヘイトスピーチ、誤情報、インプレゾンビ、詐欺、BOTなどの放置
↓
生成AIの知的能力が過半の人間を超えたことにより、「これならAIと話したほうがマシ」と考えるユーザーが増加
↓
↓
SNSから離脱し、AIとの対話やDiscordなど閉じたコミュニティに移行するユーザーの一層の増加
↓
中国の台湾封鎖に伴う日本の高市早苗政権による台湾派兵を契機として開戦。アメリカのトランプ政権は事態不拡大のため当初は静観の態度を取ったが、沖縄の米軍が攻撃されたためやむなく参戦。
日本は全土を人民解放軍のミサイルや爆撃機、無人機に総攻撃され、生産能力と流通網が崩壊。日本への海上輸送も妨害され、とくに大都市で食料不足からの飢餓が発生したことから、数百万人の餓死者を出した。東京、横浜、大阪、神戸、福岡などの都市や沖縄県は、連日の空爆に晒され、国内外への大量の避難民流出を伴いながら荒廃した。
戦線はドローンとAIにより戦略が一変し、米中が互角の戦闘を繰り広げる中、現代化に遅れた自衛隊は一方的に膨大な死傷者を出し続けた。尖閣諸島は人民解放軍に早期に占領され、先島諸島も一時占領を許した。
北朝鮮は中国に呼応し参戦。砲撃とミサイルで韓国を荒廃させながら日本にも弾道ミサイルで攻撃。戦線は膠着するも、ロシアは圧倒的軍事力を誇るNATO軍の猛攻の前にプーチン政権が崩壊。北朝鮮も難民の大量発生と国連軍の北上の前に敗北の危機となる。
北朝鮮の金正恩政権は焦燥感から、東京に向けて戦術核ミサイルを発射。さらなる核攻撃の予告を受け動揺したトランプ政権は、中国側との講和を開始。日本は事実上、中国の勢力圏とされ、米軍の撤退が決定。
公募という形にして実はデキレースで採用してもらって講師やらせてもらったけど
能力があまりにもないしちゃんとこないしでクビにされるとなって
泣いて誤魔化して自主退職という形にしてもらい逃亡したという告発文書
https://web.archive.org/web/20160709023020/http://www.rondan.co.jp/html/news/mori/aijin.html
前は能をテーマにした漫画をbookliveで探そうとすると能力って単語に対しても引っかかって難しいと書いたがそれより厄介なのを見つけたと言うのがこれ。
ノミは助詞のノミだろうが引っかかるしだにとかだって助詞もあるしいかだに乗るでも引っかかるし。
ゴキブリはごきちゃって漫画を見つけれたけど果たしてダニやノミが主題や主要な要素になってる漫画を見つけるにはどうすればいいだろうね
dorawiiより
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA512 https://anond.hatelabo.jp/20251122013414# -----BEGIN PGP SIGNATURE----- iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaSFlZQAKCRBwMdsubs4+ SIriAQDTDRtY/Gg0HStvoixz0rZhYgdrSNRu2f1i2SOsO67XngD+MVG3bs4RG8O6 8zWKfv3JwsLUxnjCdzpQZjQTMkj1wwc= =ApyB -----END PGP SIGNATURE-----
ttps://www.joanwestenberg.com/p/how-to-stay-sane-in-a-world-that-rewards-insanity
2016年頃から、私が知る最も聡明な人々が次々とますます愚かな発言をするようになっていきました。
これらの人々は、難解な学術論文を分析できる能力を持ち、理性を理解し、矛盾する二つの考えを同時に頭に保持しても思考が混乱しない、まさに「理性的な」人々でした。
しかし、何かが変わりました。
ある友人は「あらゆる主要ニュースは作為的に作り出された合意に過ぎない」と確信するようになりました。別の友人は、政治的な意見の相違を道徳的堕落の証拠とみなすようになりました。 さらに別の友人は、時に矛盾する様々な信念の緩やかな集合体である「リベラル」という言葉を、まるで人格障害であるかのように使い始めました。
共通する特徴:極端な立場を取ることで、彼らはより多くのものを手に入れていました。あらゆるところに陰謀を見る友人は支持者を集め、やがて聴衆を獲得し、最終的には7桁の収入を得るようになりました。あらゆる問題を二元論で捉えるようになった人物は、あらゆる前提を肯定してくれる既成のコミュニティを見つけました。以下同様です...
明確なインセンティブ構造が存在していました:理性的な態度はコストがかかり、極端な立場を取ることが利益をもたらすという構図です。
私たちは社会を蝕む病のように分極化について多く語りますが、重要なデータポイントを見落としています。それは分極化が効果的なマーケティング戦略であり、実際に効果を発揮しているという事実です。
それは確実に成果をもたらします。
特定の立場を明確に選び、一切の留保なくその立場を貫くことで、穏健な立場では得られないものを手にできます。不確実な世界において確かな確信を得られるのです。あなたを擁護してくれるコミュニティが形成されます。そして、複雑な問題を判断するためのシンプルな判断基準も手に入ります。
何よりも得られるのは、注目、関心、そして影響力です。
「この問題には複雑な側面があり、様々な立場に正当な主張が存在する」と述べるライターは、軽くあしらわれるだけでリツイートすらされません。 「私に反対する者は皆、悪意があるか愚か者である」と主張するインフルエンサーは、引用リツイートによって注目を集め、明確さを簡略化したその見解を評価するフォロワーを獲得します。
怒られたら、こちらも怒り、そのときに、もっとその怒気に勝る勢いの怒気をぶつければなんとかなると思ってしまう。
俺にとってしまえば「書き込む」こと自体が利口ぶってることになることなんだ。
他の人間とは背伸びに値する一線の低さが違う。哀れんでくれよ。
dorawiiより
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA512 https://anond.hatelabo.jp/20251121185913# -----BEGIN PGP SIGNATURE----- iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaSA38wAKCRBwMdsubs4+ SKyfAQDJ6y8i4GyZVVqPajimk7XjcD9HyMptcqVk9EC0BGUJsgD/Ywl2PDFxkUoe mxy98oSHhem0LS9XTEvtB40Nexa9jwE= =5Gm6 -----END PGP SIGNATURE-----
天才の1/10、1/100でいいから、自分のためのソフトウェアを書こう、と思ってたけど、
嫉妬とか、ある意味、自分も頑張ろう、みたいな気持ちもゼロで、天才の成果を眺められるようになってる…😟心が穏やかだ…
今日一日で色々進展があったのもある
まあ、人生というマラソンで例えるなら、自分は最後尾よりも遥かに後ろを、もう諦めて歩いている感じ…😟
誰もテープどころか、人がいないゴール会場に真夜中到着すれば、まあいいか、みたいな感じ…😟
他人の後追い
でも、やっぱり自分は他人にはなれないんだね、他人の能力をどんなにうらやんでも他人にはなれない…😟
自分がアプトムになりたいと思った頃のアプトムは、ガイバーに惨敗してたけど、
ハイパーゾアノイド五人衆を取り込んで、あらゆるゾアノイドの能力を合体させた最強ゾアノイドになり、
ネットワーク上に分散した多数のコンピューティング資源を連携させ、単一の高性能な仮想スーパーコンピューターとして機能させるという概念を実現した点にあります。これにより、以下のような具体的な成果や影響をもたらしました。
主な成果と影響
大規模計算の実現
科学技術計算分野において、分散したスーパーコンピューター群や多数のPCの計算能力を結集し、従来は不可能だった大規模なデータ分析やシミュレーションを可能にしました。
具体的な応用分野として、ナノテクノロジー、ライフサイエンス(ゲノム解析など)、気象モデリングといった分野の研究開発が挙げられます。
高速処理とコスト削減
専用のスーパーコンピューターを購入・維持するよりも低いコストで、それに匹敵する、あるいは超える高速な計算処理環境を実現しました。
既存のサーバーやPCの遊休リソースを有効活用できるため、設備投資の効率化に貢献しました。
計算資源を物理的な場所や所有者に関係なく、あたかも一つの資源であるかのように利用できる「仮想化」の概念を確立しました。
この技術は、大規模計算だけでなく、異なる研究機関のデータを連携させて新たな知見を生み出す「e-サイエンス」(電子科学)という研究手法の基盤となりました。
クラウドコンピューティングへの影響
グリッドコンピューティングで培われた、分散資源の管理・連携・仮想化といった技術や概念は、現在のクラウドコンピューティングサービスの基盤技術として継承・発展しています。利用者がコンピューティング資源の場所や経路を意識することなく利用できるという思想は、クラウドサービスの「いつでも、どこでも利用できる」という利便性に直結しています。
具体的なプロジェクト事例
NAREGI(ナショナル・リサーチグリッド・イニシアティブ)
日本では、世界水準の高速コンピューティング環境の実現を目指し、百テラフロップス級の計算処理能力を持つグリッド環境を構築する国家プロジェクトが推進されました。
産業技術総合研究所(産総研)などが、グリッド技術を駆使して日米の研究拠点間で超大規模データ処理を成功させた事例などがあります。
総じて、グリッドコンピューティングは、分散コンピューティング技術を大規模かつ体系的に応用し、科学技術の進歩と現代のITインフラの発展に不可欠な概念的・技術的基盤を築いたことが最大の成果と言えます。