「ホールドアウト」を含む日記

はてなキーワード: ホールドアウトとは

2025-04-09

■anond:20250409230034

答えるから、お前も俺と同じレベルの精度で自分の仕事を開陳してね。逃げるなよ

期待利益とは具体的にどうやって出すんですか？

過去にユーザーがそのアイテムを「消費した」というデータがある

アイテムにはdescription属性があり、これを特徴量として使う(tfidf)

ネガティブサンプルは誰も消費していないアイテムの中からサンプリングする

ユーザー属性も取り入れるために、ユーザー属性のOneHotをベクトルに結合する

あとは「消費＝True」「非消費=False」としてランダムフォレストを学習

ホールドアウト方式でテストする

汎化性能が確認できたら、それを「消費確率P」を予測するために使う

単価Vはアイテムの属性についているのでE=PVで期待利益を出す

それをどのようにレコメンドするんですか？

ユーザーのクリック履歴から、CBFで出す

具体的にはクリック履歴のアイテムの属性をベクトル化し、近時最近傍法でn件抽出

n件をさらに絞り込むために期待利益でリランキング

特徴はどのようなデータポイントで、ランダムフォレストは具体的に何ですか？

特徴はユーザー属性のOneHotとアイテムのtfidf。ランダムフォレストは決定木を複数用いたアンサンブルアルゴリズム

トレーニングで苦労した部分はどのあたりですか？

消費確率PをABテストした時に、実際の消費確率と予測した消費確率が相関すること

どのようなライブラリ・フレームワークで行いましたか？

pandas,numpy,scipy,sklearn。こんな要素技術の話はどうでも良し。

クローラはどのようなものをどうやって作りましたか？

コンテンツ検索エンジンなので、「うちのサイトをクロールしてください」というフォームを作っている

単価あり＝優先表示、単価なし＝クロールするが非優先、という扱い

コンテンツにschema.orgで指定された方式でコンテンツを乗せるように依頼主に要求してあるので、あとはそのフォーマットに合致するものを再帰的に取得するだけ

Permalink | 記事への反応(2) | 23:11

2024-05-29

■anond:20240529163634

はい、交差検証法はホールドアウト分割を繰り返し行う手法です。

## 交差検証法の手順

1. データセットを複数のフォールド(部分集合)に分割する。[1][2]

2. 1つのフォールドをテストデータ、残りをトレーニングデータとしてモデルを構築する。[1][2]

3. テストデータでモデルを評価し、評価指標(精度など)を記録する。[1][3]

4. 2と3を、すべてのフォールドが1回ずつテストデータになるまで繰り返す。[1][2]

5. 各フォールドでの評価指標の平均を最終的な評価値とする。[1][2][3]

つまり、交差検証法はホールドアウト分割(トレーニングデータとテストデータに分割)を複数回行い、その結果を平均化することで、より信頼性の高い汎化性能評価を行う手法なのです。[1][2][3]

この繰り返しによって、特定のデータ分割に左右されずに、より客観的な評価ができるというメリットがあります。[1][2]

代表的な交差検証法には、k分割交差検証やLOOCV(Leave-One-Out Cross-Validation)などがあり、データ量に応じて使い分けられます。[1][2]

Citations:

[1] https://shoblog.iiyan.net/cross-validation/

[2] https://ja.wikipedia.org/wiki/%E4%BA%A4%E5%B7%AE%E6%A4%9C%E8%A8%BC

[3] https://qiita.com/RyutoYoda/items/4ca997771e99d6c39ddb

[4] https://aiacademy.jp/media/?p=263

[5] https://qiita.com/Shun_PI/items/896d05ed9689f4b24347

Permalink | 記事への反応(1) | 16:39

■anond:20240529163634

わかってないのはお前だろ

ホールドアウト分割を繰り返してるんだよ交差検証ってのは

テストデータのブラックボックステストってのはそれとは別で、マニュアルでアノテーションしてテストデータを作んの

低能にもこの説明でわかったか？

Permalink | 記事への反応(0) | 16:38

■anond:20240529163337

はい、Kaggleのようなブラックボックスのリーダーボードで評価する現場は存在します。

## 機械学習モデルの評価方法

機械学習モデルの評価には、一般的に以下の2つの方法があります。

1. **ホールドアウト評価**: 学習データを訓練データとテストデータに分割し、テストデータでモデルを評価する方法。[1]

2. **ブラックボックス評価**: 評価用のデータセットが公開されず、サーバーにモデルを提出して評価される方法。Kaggleのコンペティションがこの方式。[1][2]

## ブラックボックス評価の利点

ブラックボックス評価には以下のような利点があります。

**データリークのリスクが低い**: テストデータが公開されないため、過学習を防げる。[1]
**実運用に近い評価が可能**: 実際の運用時と同様に、未知のデータに対する汎化性能を評価できる。[1]
**不正を防げる**: 事前にテストデータを知ることができないため、不正な方法で高い評価を得ることが難しい。[2]

## ブラックボックス評価の現場例

**機械学習コンペティション**: Kaggleのほか、SIGNATEやTENSORFLOW COMMUNITYなどのプラットフォームでもブラックボックス評価が行われている。[3]

**企業内の機械学習モデル評価**: 実運用に近い評価が求められる場合に、ブラックボックス評価が採用されることがある。[1]

**学術分野の機械学習モデル評価**: 公平性を期すため、ブラックボックス評価が行われることがある。[1]

つまり、Kaggleのようなブラックボックス評価は、機械学習の様々な現場で採用されている評価方式の1つであり、特に実運用に近い評価が求められる場合に有効な手段となっています。[1][2][3]

Citations:

[1] https://qiita.com/Shun_PI/items/896d05ed9689f4b24347

[2] https://www.kikagaku.co.jp/kikagaku-blog/kaggle-competition/

[3] https://www.kikagaku.co.jp/kikagaku-blog/signate-competition/

[4] https://www.topgate.co.jp/blog/google-service/8707

[5] https://www.jst.go.jp/crds/pdf/2023/RR/CRDS-FY2023-RR-02.pdf

Permalink | 記事への反応(0) | 16:36

■anond:20240529163303

バリデーションとテストと分けたところで、ホールドアウト分割だろ？

交差検証してもホールドアウト分割だろ？

Permalink | 記事への反応(1) | 16:34

■anond:20240529161624

だから期限と一日あたりのモデル送信数に設けるんだよ

それを超えたらテストデータ自体を更新する

どちらにせよ、ホールドアウト分割よりは過学習を防げる

Permalink | 記事への反応(1) | 16:20

■anond:20240529160226

お前、ホールドアウト分割したところで実用のテストにならんのまず理解してる？

訓練データの分布で話してるよねそれ

Permalink | 記事への反応(2) | 16:05

■anond:20240529141257

それは単なるホールドアウト分割だろ？

手作業でアノテーションしたきちんとしたテストデータの話をしている

Permalink | 記事への反応(0) | 14:21