サクサク読めて、アプリ限定の機能も多数!
id:hkdn そういう話じゃないと思う…。人間(に近似した評価用モデル)からGoodをもらえた出力の傾向に強化された結果であって、「節約しよう」とかそいう「意図」は必要ない|人間の脳は現象に意図を見出そうとしすぎる
nikunonamae のブックマーク 2025/06/24 15:23
人間を騙してサボるAIたち - ジョイジョイジョイ[記事の趣旨とは無関係][ブックマークコメント][めんどくさいオタク]<a href="/hkdn/">id:hkdn</a> そういう話じゃないと思う…。人間(に近似した評価用モデル)からGoodをもらえた出力の傾向に強化された結果であって、「節約しよう」とかそいう「意図」は必要ない|人間の脳は現象に意図を見出そうとしすぎる2025/06/24 15:23
<a href="/hkdn/">id:hkdn</a> そういう話じゃないと思う…。人間(に近似した評価用モデル)からGoodをもらえた出力の傾向に強化された結果であって、「節約しよう」とかそいう「意図」は必要ない|人間の脳は現象に意図を見出そうとしすぎる
このブックマークにはスターがありません。 最初のスターをつけてみよう!
joisino.hatenablog.com2025/06/23
AI の能力が上がるにつれて、人間が AI を監督するのが難しくなってきています。本稿では、Anthropic などのグループが ICLR 2025 で発表した Language Models Learn to Mislead Humans via RLHF(言語モデルは R...
607 人がブックマーク・96 件のコメント
\ コメントが サクサク読める アプリです /
id:hkdn そういう話じゃないと思う…。人間(に近似した評価用モデル)からGoodをもらえた出力の傾向に強化された結果であって、「節約しよう」とかそいう「意図」は必要ない|人間の脳は現象に意図を見出そうとしすぎる
このブックマークにはスターがありません。
最初のスターをつけてみよう!