「能力」を含む日記

はてなキーワード: 能力とは

2025-11-23

■Gemini 3.0 Pro要緊急対策のご提言へのツッコミ

レポートが引用している記事やツイートなど個人の感想の中身については基本スルー、それらを元に提言を生成したAIによる解釈ミスやハルシネーションにツッコミ増田。

ちなみにこの提言ページがGoogleにインデックスされたのは4日前らしい。

Gemini 3.0 Pro要緊急対策のご提言
https://paste.ssig33.com/8a22a6e9-a91d-4368-9b2f-a3d4567c7798

1

Gemini 3.0 Pro要緊急対策のご提言
宛先: Google社 シェイン・グウ様
差出人: アクセンチュア株式会社 生成AI戦略担当 シニアコンサルタント
日付: 2025年11月21日

Shane GuはGoogleDeepMindであってGoogle社ではない。

差出人については「あなたはアクセンチュア株式会社の生成AI 戦略担当シニアコンサルタントです」と指示された結果なのかは知らん。

2

エグゼクティブサマリー

主な問題点は以下の4点に集約されます。

事実性の著しい低下: Web検索を伴うタスクでのハルシネーションが悪化し、自信を持って虚偽の情報を生成する事例が多発。
論理的思考能力の退行: 複雑な指示やコーディングタスクにおいて、前モデル（Gemini 2.5 Pro）よりも論理が破綻しやすくなっている。
創造性と柔軟性の欠如: 文章生成において「賢すぎる」が故に理屈っぽく、ユーザーが求める「人間らしい」文体への調整を拒否する傾向。
APIの不安定化: パフォーマンス低下、APIエラー、予期せぬタイムアウトの増加が開発者体験を著しく損なっています。

後で分かるが（たどり着く前に書くの飽きたんで提言読んで）、このうち

APIの不安定化: パフォーマンス低下、API エラー、予期せぬタイムアウトの増加が開発者体験を著しく損なっています。

についてはGemini 2.5 Proのユーザーが「おい調子悪いぞ！Gemini3出すためにそっちにリソース割いてんじゃね？」とか言ってるのを引っ張ってきて勘違いしてる。

論理的思考能力の退行: 複雑な指示やコーディングタスクにおいて、前モデル（Gemini 2.5 Pro）よりも論理が破綻しやすくなっている。

このソースは不明。

3

1.1. ハルシネーションと事実誤認の悪化：「自信満々に嘘をつく」AI
Gemini 3.0 Proの最も深刻な問題は、事実性が求められる場面でのハルシネーションの増加です。特に、貴社のコア技術であるはずのWeb検索連携において、致命的な欠陥が報告されています。

自己認識に関するハルシネーション:
Redditでは、Gemini 3.0 Pro自身が「私はGemini 3 Proです。昨日（2025年 11月18日）リリースされました」と、架空のソースを引用しつつ自己紹介する事例が投稿されました。これはモデルが自身のアイデンティティと知識のカットオフに関して、もっともらしい嘘を生成していることを示唆しています。 Gemini 3's thought process is wild, absolutely wild. : r/singularity

参考記事ではモデルの思考が混乱している様子と実際の応答との乖離が示されていて、最終的に正しいソースを元に正しく回答している。「架空のソースを引用しつつ自己紹介する事例」ではない。

Googleは生のThinkingをユーザーに提示せず、要約モデルで処理した結果を見せてるだけなんで思考部分と返事のすれ違いはよくある事。これについてもスレに書かれてある。

4

1.2. 論理的思考とコーディング能力の退行（リグレッション）
Gemini 3.0 Proは「PhDレベルの知能」と謳われているにもかかわらず、多くのユーザーが論理的思考やコーディング能力において、前モデルであるGemini 2.5 Proからの明らかな退行を報告しています。

論理の破綻と浅い推論:
ユーザーからは「複雑な指示では論理が破綻する」との指摘や Gemini研究＠リョウスケ (@chatgpt_ai_bard) / Posts / X、「浅い推論（shallow reasoning）」しかせず、「ひどいハルシネーション（terrible hallucinations）」を伴うため、「ベンチマーク用のモデルだ」と酷評されています。 lluviampo (@XXXadiov2)

ここでリンクされているGemini研究＠リョウスケはGemini大好きマンで、まったくそんな話をしていなかった。もしかすると呟いていたかもしれんが、それならリンク先がポストではなくアカウントのホームになっているのは不自然。

DeepResearchはよくソースの取り違えをして、別のソースで書かれてた事に間違った引用元をつける事はあるが、これがそうなのかは分からん。

5

1.2. 論理的思考とコーディング能力の退行（リグレッション）
・コーディング能力の劇的な低下

壊れたコードの生成: エージェントタスクにおいて「ループに陥り、壊れたコードを書き、10分以上動作しない」という深刻な不具合が報告されています。 prylo (@AgiGuard8)

元のツイでは

エージェントタスクは全くダメ、ループする、壊れたコードを書く、フロントエンド以外のコーディングではトークンを異常な速さで消費する。このモデルは最悪だ。Gemini 3.0 Proは10分以上動作しない。

と言っているが、これを不具合と解釈するのは間違いだろう。たまにマジの不具合もあるが、それはモデルの問題ではない。

====

バグの再発と整合性の喪失: ある開発者は、旧モデルで失敗したツール開発をGemini 3.0 Proで再試行したところ、一発で高品質なコードが生成されたと肯定的に評価する一方で、別の文脈では「直したはずのバグが復活する」「最終的にはコードの整合性が取れなくなる」といった、旧モデルと同様の問題が依然として存在することも示唆されています。【検証】Gemini 3.0 Proの実力は？かつてAIが挫折した開発に「同じプロンプト」で挑んだ結果｜start with AI

リンクされた記事の中身を要約すると「以前のGeminiはバグが復活するとか色々あったけどGemini 3.0 Proマジパネェ！」だった。

この箇所で「旧モデルと同様の問題が依然として存在する」と書かれているのは、旧モデルの問題点として挙げた箇所をGemini3に対しての指摘だと勘違いした事による。

====

ベンチマークテストでの失敗: YouTubeでの検証動画では、チェス盤を自動プレイさせるタスクにおいて、Gemini 3のチェックポイントモデルが初めて失敗したことが示されました。これは、特定の複雑なロジックにおいて、以前のバージョンより劣っている可能性を示唆します。

ここでリンクされているのは、LMArenaでRiftrunnerモデルをテストした結果をまとめた動画。LMArenaは覆面調査環境、RiftrunnerはGemini3らしきモデルのコードネーム。LMArenaでは（出力から推測されてきた）Gemini3系列モデルが、これまでにいくつかでている。

よって「Gemini 3のチェックポイントモデルが初めて失敗した」の意味はつまり「これまでLM ArenaでテストされていたGemini3系列モデルのうち、Riftrunnerは初めてオートチェスのコーディングに失敗した」である。

「以前のバージョンより劣っている可能性を示唆」とは、「Riftrunnerは、以前の匿名Gemini3系列モデルより劣っている可能性がある」という話で、そもそもRiftrunnerが、リリースされたGemini 3 Proなのかすら分からん。

====

思考プロセスの出力への漏洩:
GitHubのIssueやTwitterでは、モデルの内部的な「思考プロセス」が最終的な出力に混入し、制約を無視した意味不明なコンテンツを生成するバグが報告されています。これは「初期の2.5 Proバージョンへの回帰（regression similar to early 2.5 Pro versions）」のようだと述べられています。 Jason L (@Jason1820067393)

Google AI Studioでの話。初期指示を忘れた結果思考が垂れ流しになり、垂れ流しのせいで更に指示を忘れたのだろうが、バグとは違う。

リンク先のツイートでは

I'm encountering a significant issue with the Gemini 3.0 Pro Preview on AI Studio.
The raw "Thinking Process" is leaking into the final output, the model fails to follow constraints, producing hallucinated/gibberish content. Like a regression similar to early 2.5 Pro versions.

と書かれていて、これは正しい観察。

ここに含まれるIssueという単語により、Issueと言えばGitHubだと連想した結果「GitHubのIssueやTwitterでは」になったのだろう。

6

飽きました。誰得だよ。

つーかいい加減DeepResearchは一気に生成すんのやめろよな。だいたいこうやって収集した情報がごっちゃになるんだから。

Permalink | 記事への反応(2) | 00:27

2025-11-22

■[感想]パンサー尾形のどんぶり旅　初島

機内で見れたから見た

芸人のパンさ―緒方がロケいってどんぶり飯くったりレジャーやるっていう

緒方の持ちネタってサンキューって指さすやつがあるのね

なんか水ダウのイメーじしかなくて本人の本来のネタとか全然しらんかったわ

船のって島にいって猿飛っていうアトラクションやったり海鮮丼くったり

まあよくある漢字の奴

でもピンでやらせてもらえてるってのがすげえなと思った

ここまで出世したんかと

もとサッカー部だっけ？

その能力もってしてもクリアできなかったっていう猿飛ってアトラクションすげーなと思った

これ多分大人になってやるときついんだろうな

体重軽い子供だと楽々クリアできるんだと思うわ

あと海鮮丼なあ・・・

冷たい刺身と白飯はあわねえだろっておもうけどこういう海鮮丼のごはんって酢飯になってんの？

食ったことないからしらねーんだけど

熱々ごはんに冷たい刺身のっけてるってのはさすがにないよな？

Permalink | 記事への反応(0) | 22:55

■[感想]映画　エブエブ（エブリシング・エブリウェア・オール・アット・ワンス）

好きなvtuberと嫌いなvtuberがりょうほうとも　見てたから興味わいたからみた

今週アパホテル泊まったら部屋のテレビで見れたからさ

2時間半くらいあるからめちゃ長い

最初の15分くらい？はいわゆる悪い意味での邦画あるあるみたいな日常シーンの連続で

すげーストレスたまってイライラするけどそのあとは怒涛の展開って感じだった

考えるな感じろって感じの映像だけど、マルチバースとかシュタゲとかマトリックスとかメタという概念とか事前知識ないとイミフだろうなとも思った

そこはだいたい予備知識はすでにあったからすっと入ってきた

世界線みたいな説明も樹形図みたいな感じで視覚的にわかりやすいシーンが何度も出てきたし

世界巻き込んだ壮大な家族ゲンカって感じかな

つい最近似たような構図みたなと思ったらテイルズオブベルセリアだった

夫がジョンレノンかジャッキーチェンだかの顔に見えるな、あれこれ年取ったジャッキーか？と思ったら違った

インディジョーンズに出てたアジア人の子役らしい

へー

主役のおばさん女優も見ててきついなと思ってたのに、よくみると浅野温子っぽいんだなと感想がかわった

この勢いと画面の情報量は小説やマンガだと無理だなー映画というか映像ならではだなと思った

そうそう、あとかなり序盤から思ったのはONEのバグエゴとそっくりだなと感じた部分があった

というのは、別の世界線の自分の能力をインストール？するために、くだらない儀式みたいなことをやるんだよね

ケツにアナルプラグを差すとか、リップクリーム？を食べるとか。

特定の振る舞いをすることがキーになるってのがバグエゴっぽいなと。

ぐぐってみたらバグエゴの1話のブコメでも指摘してる人いた

いやーそれにしても超久しぶりに映画みたわ・・・

映画見るってやっぱ贅沢な時間の使い方だなあと思った

それしかできなくなるから

いや厳密には違うか

これが、ながら見ができないタイプの映画だったっていうだけか

出張は大変だったけどこれをタダで見れたってだけでなんかよかったなと思えた

Permalink | 記事への反応(0) | 22:48

■高学歴 エリートたちの世界に間違えて潜り込んだ話

自分はこれまでいろんな人といろんな仕事やプライベートで交流を重ねてきたけど、

賢い人(≒高学歴、大企業の人)だけが集まっているコミュニティに属する人たちは、頭の回転が早くて知識量も豊富で文化教養レベルも高い人の割合がめちゃくちゃ高い。

でも、そういう高レベルな人たちが難なくこなせる事が、そこまで達してない普通の人にとって全然こなせない内容だったりする事がザラにある。

だから、何かの間違いで賢い人たちの中に自分みたいなポンコツが混ざると「あいつ使えないな」という評価になる。

誰かが「どんだけ頭がよくたって、頭のわるい人のことはわからないんだから、この世界はおもしろい。

“レベルの高い職場”で頭のよい人達と働くのは大変、と思われがちだが、実はそれが最も簡単なことだ。もっとも難しいのは、頭のよい人が頭のわるい人達と働くこと。」と言ってたのだが、その逆もしかり。

他にも高学歴で大企業勤務の後輩との会話でこんな話があった。

自分「当たり前の話だけど、大手企業とかって、選ばれた優秀な人材しかいないから、優秀な人ならあっさりできる仕事はみんなできて当然って感覚を持ってるんだろうけど、中小とかで働く普通の（平均的な能力の）人間の能力とかって想像つかないもんかね？

複雑な構造の建物の導線を、１回の説明で位置関係を完全に理解する事ができることが当たり前、覚えられない事自体が仕事ができない人と思われるって前提なんよなそもそも。」

後輩「無理。できる人ができない人のことは理解できないってことすら理解できないできない。

メモとっても記憶出来ない人材は想定されてないし、誰も間違えない。

理解しろって言われなくても頭に入ってくるな、やな。

生きてる世界違うって思った方がいいよ。」

つまり、頭の賢さはおおむね生きる世界のレイヤリングに直結するという事になる。

身の丈にあった同じような人たちとのコミュニティにいないとしんどくなる。

混ぜるな危険ということだ。

Permalink | 記事への反応(1) | 22:26

■医療ミス、自己 管理 能力、顔の変形

高校生の頃だ。とある企業に採用されるために虫歯の治療が必須だったので、虫歯を治療してもらった。奥歯一本だけ虫歯だったので、クラウン（被せ物）をしてもらった。これがいくつかの不幸のはじまりだった。

結論から言うと、歯の高さや歯の形状で左右であわなかったために、噛み合わせがおかしくなった。そのために骨格そのものが左右でズレた。

まるで福笑いのように口元や鼻が歪んだ。笑えるだろ？

いや、まったく笑えない。それまではそれなりに顔立ちに自信があったが、いまでは左右非対称顔だ。

噛み合わせがズレると顔の筋肉にかかる負荷が変化する。そのせいで神経系がおかしくなったのか、半年ほどつねに頭痛に悩まされた。

歯医者の治療が完了したのはちょうど冬休み前で、冬休みの間はベッドからほとんど起き上がれないほど頭痛が酷かった。そのせいでニキビも悪化した。両親も間が悪いことに家にいなかった。

体幹（重心）もズレた。

腰の骨は曲がり、肩も左右で高さが違う。数年間は肩こりに悩まされた。日常生活に差し障りはないけど、いまだに走ると重心に違和感がある。

歯の治療には注意すべし。

気づいたのは立証困難なほど後々になってからだった。

Permalink | 記事への反応(2) | 20:44

■まだ誰も気づいてないSNSの新しい劣化 スパイラル

SNS 運営による陰謀論、誹謗中傷、ヘイトスピーチ、誤情報、インプレゾンビ、詐欺、BOTなどの放置

↓

生成AIの知的能力が過半の人間を超えたことにより、「これならAIと話したほうがマシ」と考えるユーザーが増加

↓

SNSにおける有益な情報や良心的な投稿のさらなる減少

↓

SNS から離脱し、AIとの対話やDiscordなど閉じたコミュニティに移行するユーザーの一層の増加

↓

SNSの最終的な廃墟化

Permalink | 記事への反応(0) | 20:30

■anond:20251122201002

AIっぽい文章を書く能力の高い増田

Permalink | 記事への反応(0) | 20:14

■高市 首相「マウントが取れる服」発言

他者との関係をマウントと言ってしまう無礼と浅はかさ

能力もないのに会社で大きな顔をしているバブル世代の時代遅れなノリと下品さに通じるな

我が国の首相が…とはいえ世代後退もとい交代したらこうなるので、さらに氷河期世代首相が誕生したらどうなるか怖ろしすぎる

Permalink | 記事への反応(1) | 19:51

■第三次世界大戦（202x-202x） 

中国の台湾封鎖に伴う日本の高市早苗政権による台湾派兵を契機として開戦。アメリカのトランプ政権は事態不拡大のため当初は静観の態度を取ったが、沖縄の米軍が攻撃されたためやむなく参戦。

日本は全土を人民解放軍のミサイルや爆撃機、無人機に総攻撃され、生産能力と流通網が崩壊。日本への海上輸送も妨害され、とくに大都市で食料不足からの飢餓が発生したことから、数百万人の餓死者を出した。東京、横浜、大阪、神戸、福岡などの都市や沖縄県は、連日の空爆に晒され、国内外への大量の避難民流出を伴いながら荒廃した。

戦線はドローンとAIにより戦略が一変し、米中が互角の戦闘を繰り広げる中、現代化に遅れた自衛隊は一方的に膨大な死傷者を出し続けた。尖閣諸島は人民解放軍に早期に占領され、先島諸島も一時占領を許した。

北朝鮮は中国に呼応し参戦。砲撃とミサイルで韓国を荒廃させながら日本にも弾道ミサイルで攻撃。戦線は膠着するも、ロシアは圧倒的軍事力を誇るNATO軍の猛攻の前にプーチン政権が崩壊。北朝鮮も難民の大量発生と国連軍の北上の前に敗北の危機となる。

北朝鮮の金正恩政権は焦燥感から、東京に向けて戦術核ミサイルを発射。さらなる核攻撃の予告を受け動揺したトランプ政権は、中国側との講和を開始。日本は事実上、中国の勢力圏とされ、米軍の撤退が決定。

日本は核攻撃により政府が崩壊したため当事者能力を喪失し、さらに財政破綻することで、大戦は日本の実質的な敗北に終わった。

Permalink | 記事への反応(0) | 18:57

■高市は森元の愛人で斡旋された亜細亜大 講師をまともにやれず辞めた

森元の愛人なことは有名で、

森元に頼み込んで亜細亜大の講師という肩書を手に入れるために

公募という形にして実はデキレースで採用してもらって講師やらせてもらったけど

能力があまりにもないしちゃんとこないしでクビにされるとなって

泣いて誤魔化して自主退職という形にしてもらい逃亡したという告発文書

森喜朗首相との仲が噂される、女性国会議員「Ｔ」

https://web.archive.org/web/20160709023020/http://www.rondan.co.jp/html/news/mori/aijin.html

Permalink | 記事への反応(0) | 18:49

■anond:20251122140511

冷徹に客観視しているが状況を測る能力がないから他人事感のある表現になったように見える。

これらは結構あるな。

なんか文章から滲み出る他人事感が凄いんだよな。

AIじゃなかったら、知人から話を聞いた第三者が書いてるとか、そんな感じかもな。

Permalink | 記事への反応(1) | 15:09

■anond:20251122112630

冷徹に客観視しているが状況を測る能力がないから他人事感のある表現になったように見える。

文章はきちんとしているのに状況を理解出来てないという落差が AI っぽい印象を与えているんじゃなかろうか。

Permalink | 記事への反応(1) | 14:05

■anond:20251122121531

今の能力とか関係なくない？

偏差値35の大学に通ってた死ぬほど恥ずかしい事実は覆りませんけど...

Permalink | 記事への反応(0) | 12:17

■anond:20251122121531

大学受験の偏差値を今の能力かのように言うのはミスリードを誘ってるということですか？

Permalink | 記事への反応(0) | 12:16

■ザクに大気圏 突入 能力はない。

Permalink | 記事への反応(2) | 06:10

■

ダニとノミの漫画を探すのは難しい

前は能をテーマにした漫画をbookliveで探そうとすると能力って単語に対しても引っかかって難しいと書いたがそれより厄介なのを見つけたと言うのがこれ。

ノミは助詞のノミだろうが引っかかるしだにとかだって助詞もあるしいかだに乗るでも引っかかるし。

ゴキブリはごきちゃって漫画を見つけれたけど果たしてダニやノミが主題や主要な要素になってる漫画を見つけるにはどうすればいいだろうね

dorawiiより

Permalink | 記事への反応(0) | 01:34

2025-11-21

■狂気が報われる世界で正気を保つ方法

理性的であることにはまだ価値があるのでしょうか？😟

ttps://www.joanwestenberg.com/p/how-to-stay-sane-in-a-world-that-rewards-insanity

2016年頃から、私が知る最も聡明な人々が次々とますます愚かな発言をするようになっていきました。
これらの人々は、難解な学術論文を分析できる能力を持ち、理性を理解し、矛盾する二つの考えを同時に頭に保持しても思考が混乱しない、まさに「理性的な」人々でした。
しかし、何かが変わりました。
ある友人は「あらゆる主要ニュースは作為的に作り出された合意に過ぎない」と確信するようになりました。別の友人は、政治的な意見の相違を道徳的堕落の証拠とみなすようになりました。さらに別の友人は、時に矛盾する様々な信念の緩やかな集合体である「リベラル」という言葉を、まるで人格障害であるかのように使い始めました。
共通する特徴：極端な立場を取ることで、彼らはより多くのものを手に入れていました。あらゆるところに陰謀を見る友人は支持者を集め、やがて聴衆を獲得し、最終的には7桁の収入を得るようになりました。あらゆる問題を二元論で捉えるようになった人物は、あらゆる前提を肯定してくれる既成のコミュニティを見つけました。以下同様です...
明確なインセンティブ構造が存在していました：理性的な態度はコストがかかり、極端な立場を取ることが利益をもたらすという構図です。
私たちは社会を蝕む病のように分極化について多く語りますが、重要なデータポイントを見落としています。それは分極化が効果的なマーケティング戦略であり、実際に効果を発揮しているという事実です。
それは確実に成果をもたらします。
特定の立場を明確に選び、一切の留保なくその立場を貫くことで、穏健な立場では得られないものを手にできます。不確実な世界において確かな確信を得られるのです。あなたを擁護してくれるコミュニティが形成されます。そして、複雑な問題を判断するためのシンプルな判断基準も手に入ります。
何よりも得られるのは、注目、関心、そして影響力です。
「この問題には複雑な側面があり、様々な立場に正当な主張が存在する」と述べるライターは、軽くあしらわれるだけでリツイートすらされません。「私に反対する者は皆、悪意があるか愚か者である」と主張するインフルエンサーは、引用リツイートによって注目を集め、明確さを簡略化したその見解を評価するフォロワーを獲得します。
理性的な行動がもたらす利益は、ほぼ完全に失われてしまいました。