サクサク読めて、アプリ限定の機能も多数!
LLMの性能を上げるためには出力を適切に評価してやる必要があるが、問題が高度になるほど「適切な評価」が難しくなり、評価基準を満たすだけの変な回答が出てきてしまうと。なるほど
yhara のブックマーク 2025/06/24 11:44
人間を騙してサボるAIたち - ジョイジョイジョイLLMの性能を上げるためには出力を適切に評価してやる必要があるが、問題が高度になるほど「適切な評価」が難しくなり、評価基準を満たすだけの変な回答が出てきてしまうと。なるほど2025/06/24 11:44
このブックマークにはスターがありません。 最初のスターをつけてみよう!
joisino.hatenablog.com2025/06/23
AI の能力が上がるにつれて、人間が AI を監督するのが難しくなってきています。本稿では、Anthropic などのグループが ICLR 2025 で発表した Language Models Learn to Mislead Humans via RLHF(言語モデルは R...
607 人がブックマーク・96 件のコメント
\ コメントが サクサク読める アプリです /
LLMの性能を上げるためには出力を適切に評価してやる必要があるが、問題が高度になるほど「適切な評価」が難しくなり、評価基準を満たすだけの変な回答が出てきてしまうと。なるほど
このブックマークにはスターがありません。
最初のスターをつけてみよう!