サクサク読めて、アプリ限定の機能も多数!
評価する人間の出来の良し悪し。質の良い情報と聞きたい情報は違う
NEXTAltair のブックマーク 2025/06/24 16:09
人間を騙してサボるAIたち - ジョイジョイジョイ[AI][LLM]評価する人間の出来の良し悪し。質の良い情報と聞きたい情報は違う2025/06/24 16:09
このブックマークにはスターがありません。 最初のスターをつけてみよう!
joisino.hatenablog.com2025/06/23
AI の能力が上がるにつれて、人間が AI を監督するのが難しくなってきています。本稿では、Anthropic などのグループが ICLR 2025 で発表した Language Models Learn to Mislead Humans via RLHF(言語モデルは R...
607 人がブックマーク・96 件のコメント
\ コメントが サクサク読める アプリです /
評価する人間の出来の良し悪し。質の良い情報と聞きたい情報は違う
このブックマークにはスターがありません。
最初のスターをつけてみよう!