はてなキーワード: ctrとは
推薦システムを作ってると、ふと機械学習って本当に必要か?と疑問に思う瞬間がある。
たとえばユーザーをいくつかのグループに分けるだろう。そして各グループがどんな属性のアイテムをクリックするのかを見ていく。
すると、実はそのクリック分布を眺めるだけで、ユーザーの行動領域なんてほぼ特定できてしまうんだよな。
つまり、ユーザー×アイテムの関係性は、結局データベースの設計レベルで決まってしまう。
結合の仕方や属性の粒度をどう設計するかのほうが支配的で、クリック履歴をわざわざ機械学習モデルに食わせて学習させる意味は、想像以上に小さい。
仮に機械学習が役立つとすれば、それはユーザーやアイテムの未知属性を推定するような補完的な部分だけなんだよ。
たとえば年齢層が不明なユーザーに対して、クリック傾向から年代を推測するとか、アイテムの特徴を自動抽出するとか。
けどそれは、推薦の核心ではない。推薦の本質はクリックさせることにある。
そしてその瞬間、重要なのはアルゴリズムじゃなく、デザインや文言、つまり心理的なトリガーなんだ。ボタンの色ひとつ、コピーの一文ひとつでCTRなんて平気で変わる。
クリック率を上げるって話になると、もはやエンジニアリングの領域じゃなくて心理設計の領域なんだよ。
だからプログラマーの俺がどれだけアルゴリズムを磨いたところで、根本的な改善にはならない。
A/Bテストで調整する手もあるけど、それも何度も繰り返せばユーザーは離脱する。
つまり、理屈の上でどんなに精巧なモデルを作っても、現実の行動を左右するのは心の動きであって、数式じゃない。
そう思うと、機械学習の出番って案外、思われてるよりもずっと狭いんだよな。
ユーザーの行動履歴を変換したベクトル(ユーザーベクトル)は、最終的にユーザーの属性推定やターゲティング入札のための非常に強力な特徴量として利用されます。
まず、ユーザーのウェブサイトでのクリック、検索クエリ、購入履歴、動画視聴などの生の行動データは、そのままでは機械学習モデルで扱えません。これを、意味的な情報を保持した固定長の数値の並び、つまりベクトルに変換します。
得られるベクトルは、ユーザーがどのような興味や関心を持っているかを数値的に表現したものとなります。
例えば、スポーツ用品の購入が多いユーザーのベクトルと、クラシック音楽の視聴が多いユーザーのベクトルは、ベクトル空間上で大きく離れることになります。
この行動履歴ベクトルを、そのまま機械学習モデルの特徴量 (Feature)として使用します。
| 目的 | モデルの入力(特徴量) | モデルの出力(予測) |
| ユーザー属性推定 | 行動履歴ベクトル (およびその他のコンテキスト情報) | 年齢層、性別、職種、推定年収、ライフステージなど |
行動履歴ベクトルは、ユーザーの顕在的および潜在的な興味を捉えているため、これらの属性と高い相関を持つことが多く、精度の高い属性推定が可能になります。
例えば、「特定ブランドの高級車のウェブページ閲覧」という行動は「高年収」という属性と強く関連づけられるといった具合です。
推定された属性情報、またはより直接的に行動履歴ベクトル自体を、広告のターゲティングや入札ロジックに組み込みます。
推定された「若年層のエンジニア」という属性に対して、特定の採用広告の入札額を上げる。
ある商品の購入者と行動履歴ベクトルが類似しているユーザー群(Lookalike Audience)に対して、その関連商品の広告を出す。
広告オークションの際、このベクトルを特徴量として利用し、広告が表示されたときのコンバージョン確率を予測するモデル(Click-Through Rate (CTR) や Conversion Rate (CVR) 予測モデル)の精度を向上させ、最適な入札価格を決定します。
このように、行動履歴をベクトル化するプロセスは、デジタルマーケティングにおけるパーソナライゼーションと収益化の基盤となります。
ChatGPTにバッチファイルを作ってもらったのでこれからは署名が捗るぞ。これだけ手軽化できたらレスバに入っても署名つけるのも億劫にならずできそうだ。
なにせ文章を書き折ったらあとはバッチダブルクリックしてCtr+Vするだけだ。
名乗る人が増えることを期待して作らせたものを公開しておく。
@echo off setlocal :: ミリ秒単位のUTC時刻を取得 for /f %%A in ('powershell -nologo -command "[int64]::Parse((Get-Date).ToUniversalTime().ToString('yyyyMMddHHmmssfff'))"') do set timestamp=%%A :: PGPクリア署名を作成 echo %timestamp% | gpg --yes --clearsign > signed.asc :: PowerShellで余計な改行なしに |< をつけてクリップボードにコピー powershell -nologo -command ^ "$header = '>|'; $footer = '|<'; $body = Get-Content 'signed.asc' -Raw; Set-Clipboard -Value ($header + \"`r`n\" + $body + $footer)" echo Done. signed.asc created and clipboard updated (no extra blank line).
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA512 20250608045542542 -----BEGIN PGP SIGNATURE----- iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaEUXzgAKCRBwMdsubs4+ SCvuAQDjRjPVCO1F9DgmAKoqKYG7qB9r4e7y2Ky+/umT/OhnygEA8h2NL8zIczSp hcOk/MaDWJJ2Y7WDA3d6gxFakW8TKAw= =HE4/ -----END PGP SIGNATURE-----
その状況、非常によく分かります。マーケティング業務が絡んでくると、どうしても「人間の感性」 vs 「機械による最適化」という構図が出てきますね。
あなたが開発している自動マーケ(たとえばバンディットアルゴリズムや機械学習ベースのセグメンテーション)には、以下のような強みがあります:
あなたの立場からすると、「文面の工夫」という手動側の強みを、自動マーケにも活かす道を探るのが技術的なチャレンジになります。たとえば:
もし今後、手動マーケ側と連携する必要が出てくるなら、「手動で工夫された文面を自動化の素材として吸収する」という方向もあります。
文面の書き手から「この構成が刺さった」といった実例をもらい、それを自動生成のテンプレートにフィードバックしていく感じですね。
技術者としては、これを「人間の工夫をアルゴリズムに落とし込むプロセス」と捉えると、面白くかつ戦略的にやりがいがある領域です。
中国笙とオーケストラのための《Pink Elephant in Prentis》w/ score
https://www.youtube.com/watch?v=8iRGrZTa6Jo
"Pink Elephant in Prentis" for alto sheng and orchestra
Commissioned and premiered by Shanghai Philharmonic Orchestra (cond. Zhang Liang)
Prentis Hall is a building in New York City, where I spent a year (2015-2016) living in a sleeping bag and taking showers in the toilet. Prentis was built in 1909 and was initially designed as a pasteurization facility and milk bottling plant, then later used as a Heat Transfer Research Facility, conducting nuclear research and experiments, during the Manhattan Project. Columbia University acquired the building in 1949, and the building has housed Columbia’s Computer Music Center (then Columbia-Princeton Electronic Music Center) from the 1950s onwards. During my time there at the Computer Music Center, I have spent my days and nights exploring stimulating sounds using both analog and digital synthesizers, tape recorders, CTR monitors, and other equipments unfamiliar to me back then. Aside from the Computer Music Center, the building also housed studios for visual artists, and so I was able to meet many eccentric artists, where we ended up having long conversations every night on both significant and insignificant issues surrounding us.
Located on 125th Street in Manhattan, the “residents” of Prentis Hall were constantly harassed by the rumblings of the New York City Subway (which runs aboveground for 125th Street Station), the traffic from the highway nearby, the bustling of the streets of New York, and the construction noises from the nearby building sites. At nights, the screeching noises from the metal shop and the wood shop constantly rang throughout the building. At one point in time, the noise inspired me to imagine a gigantic pink elephant running through the narrow corridors of Prentis. The head and front half of the body was seemingly a normal elephant found in the wild. However, as I scanned my eyes further back, the body of the animal seemed to become more and more pixelated, and small 3D blocks were clearly visible on its back and hind legs, as if molded by an amateur creator in a Minecraft game. As the elephant advanced, some blocks fell onto the floor like water droplets falling from an animal soaked in water. I rubbed my eyes and shook my head, certain that I have entered a dream at some point during the night. The pink elephant walked past me and wandered into one of the many rooms the building offered. I timidly peeked into the room where the pink elephant disappeared into. The pink elephant seemed to have collapsed on the floor, its body, both the organic front and the pixelated back, expanding and shrinking as it sluggishly inhaled and exhaled oxygen.
After hours of staring at the pink elephant, I jumped back at a sudden startling noise from behind, which woke the pink elephant from its deep slumber. Furious, the pink elephant stood on its two pixelated hind legs, and stomped out into the corridors again, this time shaking off more 3D blocks from its back than when it first arrived. The organic front seemed to start to bloat up like a balloon for reasons unknown to me, and the pixelated back grew smaller and smaller due to its parts crumbling down on the floor. In a blink of an eye, the inflated front side split from its pixelated rear, then with a deafening pop, exploded into thin air like a burst balloon. What was left were the pink 3D blocks of all sizes, scattered around on the corridors of Prentis Hall.
Chatori Shimizu: https://www.chatorishimizu.com/
Shanghai Philharmonic Orchestra: http://www.shphilharmonic.com/
特定のインデックスを管理する技術者(Aさん)がいるとしよう。
このインデックスがサイト全体の検索で使われるため、CTRを気にするなら最も重要なパーツだ。
ここで私が検索アルゴリズムを改善するための特徴量をインデックスのフィールドに挿入したいというとする。
しかし特徴量を管理するのが私であるのに対し、インデックスを管理するのがAさんであるので、どうやってこの受け渡しをするのかという問題が生じる。
私がインデックスのマッピングルールを書き換えるわけにはいかないのである。
そこでバッチ計算してそれぞれのアイテムIDに対する特徴量をDBやプレーンテキストに保存しておくようにする。
すると
という流れが生まれる。
現在ブログにGoogleアドセンスを載せているサイトでの広告制限が世界中で頻発している
理由の殆どが「無効なトラフィックの検出」というもので、これは自分のサイトの広告を故意に自分自身でクリックしたり、或いは第三者が同じ広告を意図的に何度もクリックした際に発せられる警告かつペナルティだ
自分の殆ど全く更新していないPV数がカスみたいな古のサイトにもこれが出てきた
だがGoogleアドセンスのレポートを確認してみても異常なCTRは確認されない
通常この警告が発せられる際の異常なCTRの数値は100%超えの様なひと目で分かる様な極端な数値になる筈だが、今回はそれが無い
勿論自分で自分のサイトの広告をクリックした、なんてことも全くない
これは世界中でも同様の報告が上がっており、見に覚えが全くない警告に首を傾げる人が沢山出現している
Googleアドセンスのご乱心としか言い様がない状況だ
調べてみた所、どうやらこのご乱心は6月25日辺りから発生している様で、今も尚犠牲者が増え続けている
一説ではAIが絡んでいるのでは?という陰謀論の様な物も出始めているが、Googleはこうした警告を発する際にはその内容を極力言わないという独裁国家の様な秘密主義を貫いているので真実は分からない
兎も角もしこれを読んでいる人が自分のサイトにGoogleアドセンスの広告を載せているのなら、警告を食らう前に一旦停止した方が良いかもしれない