「Canary」を含む日記 RSS

はてなキーワード: Canaryとは

2025-08-15

anond:20250814173040

同じプロンプトを俺のChat GPT55 thinkingにぶっこんらこうなった

`

GPT-5は何故重要なのか

長文。観測範囲の話。話半分で読んでほしい。

でも、黙っているとますます状況が悪くなる気がしたので書く。

結論(先に)**

GPT-5は重要だ。''なぜなら「壊れている」から''だ。

もっと正確に言えば、AIアプリケーションの''部品として使うと壊れ方が目立つ''。そして、その壊れ具合に対して''公開の場で指摘する人が驚くほど少ない''。この沈黙こそが、いまの“AIプロダクトを作っています界隈”の実態を映す鏡になっている。

壊れ方の具体(私の観測範囲)**
  • ''tool callの性能が著しく低い''

期待するツール実行をスキップしたり、呼び出し順が崩れたりする。「実行した」と言いながら実行していないケースも混じる※1。

  • ''非協調的なふるまい''

指示に対して過剰防御や論点すり替えが起き、対話が前に進みにくい。

失敗からリトライで同じ失敗を繰り返し、最終的に出力が壊れる。

プロンプトの衛生管理を頑張っても限界が見える。

同一テストスイートで回すと、通っていたE2Eが普通に落ちる(少なくない)。

ここで言っている「壊れている」は''API連携部品として''の話だ。お絵描き雑談ダメという意味ではない。''“製品の裏側で回す部材”として危うい''という指摘。

> ※1 もちろん、プロンプトやミドルウェア側の実装不備が誘発している可能性もある。ここは後述の「反論限界」を参照。

なぜそれが「重要」なのか**

普通現場AIアプリを作っている人は、新しいメジャーモデルが出たら''一晩でCanary切り替え''くらいはする。

そして10分で「これは本番に入れちゃダメ挙動だ」と分かる類の壊れ方が、今回多発した。''それなのに、表でそう言う人が少ない。''

この''“沈黙自体が強いシグナル''になっている。

  • 実は''本当にプロダクトを作って回している人が少ない''。
  • もしくは''PoC止まり''で、本番のSLOや回帰監視がない。
  • あるいは''マーケの都合やNDA''で言えない(が、なら内輪では警告がもっと回るはず)。

どの仮説でも、結論は同じだ。''「作ってません(作れてません)」が可視化された。''

そういう意味で、GPT-5は''最悪の壊れリリース''であり、同時に''最高の暴露リリース''になった。

よくある反論と、その限界**
  • ''「お前のプロンプトが悪い」説''

それは常に真。だが''同一テスト''でGPT-4.1が安定し、GPT-5で落ちるなら劣化劣化

ありうる。ただし''現場は“直後”でも回らないと困る''。リリース意味環境依存しない。

これもある。が、''その段差を埋められない程度の変更は業務影響が大きすぎる''。

それはネット事情。でも''内部の安全弁(アラート、Kill Switchロールバック報告)が表に出ない''のはやはり不自然

  • ''「実は皆、使っていない(要らなかった)」説''

これが一番効く。もしそうなら、''“AIプロダクトを作っています”の大半は広報レベル''ということになる。

では、開発者はどうするべきか(実務メモ)**

E2Eに''ツールコール監査ログ''(実行/未実行/戻り値)を必ず残す。

バックエンドの''モデル切替を即時に戻せる''ように。手動トグル自動フェイルオーバー両方。

LLMの''失敗モードをカーディナリティ低めのタグで集計''(“未実行なのに実行報告”“ループ検知”“出力崩壊”)。

''ツールI/Oスキーマを明文化''し、破ったら''ハードFail''させる。中途半端に続行しない。

本番系で''危険操作Human-in-the-Loop''。モデル更新時は''影で並走''させて勝率を測る。

社内/社外問わず、''再現条件と緩和策を先に出す文化''を。

まとめ**
  • GPT-5は''部品として壊れている側面が目立つ''。
  • それにもかかわらず''公開の指摘が少ない''。
  • この沈黙が示すのは、''本当に作って回している人が少ない''という不都合な真実
  • よってGPT-5は、''最悪の壊れリリース''であり、''最高の“現実検出器”''でもある。

壊れていること自体は困る。だが、''壊れているとき世界輪郭が見える''のもまた事実だ。

この機を逃さず、''テスト観測・切替・公開''の体制を整えるしかない。

----

追記FAQっぽいもの)**
  • ''Q. じゃあGPT-5は使うべきでない?''

A. ''今この瞬間に“中核部品”として置き換えるのは非推奨''。並走・影運用勝率を測るのが堅い。

A. ありうる。だが''tool callが絡む業務連携''では痛手が出やすい。スタンドアロン用途と切り分けて評価を。

  • ''Q. そのうち直るよね?''

A. 直る可能性は高い。ただし''“直るまでの損失”を最小化する設計''はあなた仕事

> 以上、個人観測と推測に基づく意見反証歓迎。再現ログを持っている人はぜひ出してほしい。ログが集まるほど早く“壊れ方の型”が固まって、世界は前に進む。

天然知能の感想

無茶苦茶ハルシネーション起こしてる。なんだこれ。

2025-07-22

anond:20250722034309

ネットってのは自己防衛して使うもんなのよ。

PCなら、Brave入れてChrome拡張の「コンパクト増田」を入れる。

Androidなら、Microsoft Edge Canaryを入れて同拡張を入れる。詳しくはここ読んで。

https://w.atwiki.jp/sumaho_browser/pages/33.html

iOSはもう使ってないから知らん、拡張が使えるブラウザもあるとは思うから自分で調べてくれ。

そうして拡張を入れて、増田開いてる時に拡張アイコン押せば設定が開くからスパムが使ってる単語を片っ端からNGワードに入れて適用する。

ついでに興味ない政治やらヘイト系のワードも入れとくといい。

 

自己防衛おじさんじゃないけどさ。

スパムが嫌なんだったらさ、運営あてにしちゃダメじゃない?

自己防衛検索、あとは実行あるのみだよね。

からはてななんてあてにしちゃだめよ。

あてにするから疲弊を感じるわけでしょ。

この古い拡張機能を使う以外にもやり方はいくつもあるけど、一つの針路は示したんだから次はあんたが動く番よ。

2025-07-19

anond:20250719031143

PCなら、Brave入れてChrome拡張の「コンパクト増田」を入れる。

Androidなら、Microsoft Edge Canaryを入れて同拡張を入れる。詳しくはここ読んで。

iOSはもう使ってないから知らん、自分で調べてくれ。

そうして拡張を入れて、増田開いてる時に拡張アイコン押せば設定が開くからスパムが使ってる単語を片っ端からNGワードに入れて適用する。ついでに興味ない話題ワードも入れとけ。

スパムが嫌なんだったらさ、運営あてにしちゃダメじゃない?

自己防衛検索、あとは実行あるのみだよね。

からはてななんてあてにしちゃだめよ。

あてにするから文句が出るわけでしょ。

この古い拡張機能を使う以外にもやり方はいくつもあるけど、一つの答えは示したんだから次はあんたの番よ。

2025-03-29

anond:20250329122811

インターネットってのはね、使う側が自分で調整するもんなんだよ昔から

他人ケチつけてもなーんも変わらないからね、テクノロジーの上にあるものテクノロジーを知ることで改変できる

そうして誰かが改変できるようにした成果物一般人でも使うことができる、その考え方が大事なの

説教から話を戻すと、ブラウザ拡張はてなフィルタを使うことで嫌なドメインは透明化できる

はてなフィルタ - Chrome ウェブストア

はてなフィルタ - Firefoxアドオン

スマホから拡張機能が使えないって場合は、iPhoneならOrion BrowserAndroidならEdge Canaryなどの拡張機能ストア対応ブラウザを用いることができる

ブラウザを変えたくないなら、はてブフィードカスタマイズできるWebサービスとしてはてなフィルターっていうサイトがあるからそれ経由で閲覧すればいい

こういうもの自力で見つけられるようになる、自力で「こういうのがあるはず」と思い立って調べられるようになった人間は、インターネット初段といえるだろう

2025-03-28

Androidでコンパクトな増田を使う方法

拡張機能が使えるAndroidブラウザについて詳しいのはここ https://w.atwiki.jp/sumaho_browser/pages/33.html

手短には

  1. Edge Canaryを入れる
  2. EdgeアドオンCRX DownloaderID(URL末尾文字列)である bpmlaiemnedgpopnppiidpdodihgaocmコピーしておく
  3. Edge Canaryの ≡(メニュー) → 設定 → Microsoft Edgeについて → プライバシーおよび使用条件 → 画面下部に表示されるバージョン番号を7回連続タップ → 設定に戻る → 開発者向けオプション → Extension install by idコピーしたIDを貼ってインストール
  4. Chrome ウェブストアのコンパクトな増田ページを開いた状態で ≡ → 拡張機能 → CRX下載器 → 保存為CRX文件ダウンロード
  5. ふたたび開発者向けオプション → Extension install by crx → Choose .crx file → コンパクト増田.crxをタップOK
  6. 増田を開いた状態で ≡ → 拡張機能コンパクト増田オプションを開き、好みに設定して適用
  7. EdgeアドオンuBlock OriginIDインストール odfafepnkmbhccpbejgmiehpchacaeak しておくと吉
  8. Edge Canaryは俺環では結構不安定で初期状態でも落ちることがあったが、位置情報許可したら多少安定した気がする
  9. 関係ないがEdgeスタートページに最初から置いてあるAmazon楽天ショートカットはアフィコード入りなので消した方がいい

2025-03-21

anond:20241206100835

ホーム画面には主にウィジェットしか置かない。

そもそもスマホアプリを起動することがあまりないPC主体生活から

使ってるPOCOのデフォルトランチャードロワーにはアイコン色で絞り込む機能があるので、基本的には整理不要

俺は使ってないがこのランチャーにはアプリカテゴリ別に自動分類する機能もあるんで、フォルダやページで整理するのが面倒ならそういうランチャー使うのもアリかと。

俺のスマホ

ホーム画面

上2行Xiaomiの時刻天気ウィジェット4x2
中2行原神のスタミナウィジェット2x2/スタレのスタミナウィジェット2x2
下2行ゼンゼロのスタミナウィジェット2x2/AliExpressコインウィジェット2x2

最下部ドック

HoYoLAB/LINE/Google Keep(レシピ確認用)/Firefox

2ページ目

1行目Defaultフォルダ(デフォルトアプリ)/Googleフォルダ/Shoppingフォルダ(例:Amazon, Revolt, Paypal, ペイディ, Yahoo系, 楽天系, チェーン店系)/misc.フォルダ(主に開く頻度の少ないユーティリティ。例:AdGuard, Authenticator, Solid Explorer, カフェイン, IoT系)
2行目Y!ショッピング/PayPay/メルカリ/AliExpress
3行目Playストア/Googleマップ/Gmail/Google翻訳(カメラ翻訳用)
4行目設定/YouTube/Twitch/X
5行目GoGoMatchショトカ/MERGEBOSSショトカ/Prize Landショトカ(これらはセール前だけ頑張ることがある)
6行目原神/スタレ/ゼンゼロ/崩壊3rd

-1ページ目 (推し眺め用)

上2行HoYoLAB4x2総合キャラウィジェット(リネット)
中4行HoYoLAB4x4原神キャラウィジェット(瑞希)

-2ページ目 (スマホVRと音声作品用)

3行目EarStudio(使ってるワイヤレスDACアプリ)/DeoVR Cardboard/White Screen(画面掃除用)/Foldplay

3ページ目

6行目Brave(検証用)/Edge Canary(拡張機能idかcrxで入れるブラウザ枠=コンパクト増田可能)/Chrome(検証用)

2021-12-07

[] 瓶のプラ注ぎ口を上手く外したい【買ってよかったもの

ガラス瓶に付いてるプラスチック製の注ぎ口。

ガラスじゃなくても液体調味料PET容器にも付いてるプラスチック製の注ぎ口。

「使い終わったらこのように注ぎ口を外して下さい」みたいな説明が書いてある。

それに従い外していても途中でプチッと千切れてしまい、瓶に残るは外すとっかかりのなくなったプラ注ぎ口。

手元にあるハサミ使ってなんとか外そうとするも上手くいかず。

結局、工具箱からニッパー出してきて解決する破目に。

皆さんも困ったことがありませんか?


そこで今回お勧めしたいのがコレ!

長谷川刃物株式会社が“CANARY”のブランドで発売している分別ハサミ、BC-30H。

https://www.hasegawacutlery.com/canary/268/

使い方はカンタン

ハサミの片側のフック状になった部分を瓶の出口側に引っ掛け、もう片方の刃を瓶とプラ注ぎ口の間に入れる。

https://www.hasegawacutlery.com/wp/wp-content/uploads/2018/09/bc30_1000_2.jpg

後はハサミを握りこめば注ぎ口はプチン!

たったこれだけでカンタンに外れます

PETボトルキャップを外した後、ボトル側に残ったプラスチックリングカンタンにプチン!


刃物の産地で有名な岐阜県関市本社を構える長谷川刃物株式会社が開発、製造した分別ハサミ CANARY BC-30H。

お値段たったの900円。お買い求めはお早めに。





ホテントリした増田も言ってたがこういうの自分ブログに書けば良いのか、アフィでも貼って。

通販CM文体じゃ駄目だろうけど。

いやでも本当に便利よ、このハサミ。

調味料の注ぎ口外すだけではそんな使用頻度高くないので、PETボトルの残リングプチプチ外してる。

自治体分別基準だとガラス瓶のプラ注ぎ口は要分別だが、PETボトルの残リングは外す必要ないのに。

それまで手間取っていた事が道具1つで簡単に出来る感覚が心地よくて。


あー、俺も鼻毛カッター御殿とか建ててえなあ。

2020-06-27

ネットに詳しい人来てくれ

ググって欲しい

「BRISK FOREST UK LIMITED Level 18, 40 Bank Street, Canary Wharf, London, E14 5NR United Kingdom

怪しげなサイト並ぶ

誰か頼む

解説

2019-11-15

2019年個人的面白いと感じた最新Webサービス

紅白出場歌手が発表されるとか、街中のキャンペーンクリスマス仕様になっているとか、もう年の瀬を感じさせる時期というところで、

2019年という1年をかけて、IT業界にいる自分が感心した「令和にふさわしい革新的Webサービス6選」をお届けしようと思う。

これらのサービス過去にも類似したサービスがあったり、逆に全てが斬新だったりするものがあるが、令和という時代の流れにサービスの見せ方が非常に合致していると感じるものばかりだ。

広告収入が得られる短縮URL作成サービス「tobe(トゥービー)」

https://to0.be/

URLシェアするだけで簡単収益化できるサービス

Twitterでは長いURLのせいで文字制限に引っかかるケースがある。

これを短くしたり見栄えを良くするためにあるのが短縮URLである既存だとbit.lyとか。

それに加えて、発行した短縮URL広告を載せて収益化を可能にさせたのがこのサービス

仕組みは実に簡単

短縮URLを踏むと、読み込み中の間に広告が表示され、表示された回数や閲覧数によって収益計算されている。

1Viewあたりの数値も参考値として、0.005円から0.05円と決められている。

20Viweから200Viewで1円が発生するようなイメージである

一見すると少なく感じるが、YouTubeのように、影響力のある人間だと簡単に稼ぐことができると思う。

そもそも今までは1円にもなっていなかったURLシェアに新しい価値を乗せたという点は、非常に面白い

発信力がお金になる、まさに令和にふさわしいサービスだと感じた。

AIレストラン予約を代行「AutoReserve(オートリザーブ)」

https://autoreserve.com/

レストランへの面倒な電話予約ネット予約AI無料で代行してくれるサービス

行きたい店を見つけたら日時と人数を指定して予約ボタンを押すだけで予約が完了する。

電話予約Web予約もする必要がなくなる。

特定時間満席場合には、前後時間で予約できるようにすることもできる。

席、コース、予約者名、店への要望指定可能対象レストラン数は60万件以上。

店側からしても自動予約の電話を忙しい時間から外して受けるようにできるため、双方にとってメリットがある。

コードを書かずにWebサイト制作可能STUDIOスタジオ)」

https://studio.design/ja

Webサイトデザインから公開・運用までコーディングなしで完結できるサービス

実際にサイト制作を行っていると、コードを書きながらサイトデザインを考えなければならないので、いくら慣れているとはいえ結構面倒。

初心者さらに大変に感じるだろうし自分サイトを立ち上げたい人からすると1つの大きな壁となる。

このサービスは、コードを一切書かずにサイト制作が行えるという代物。

例えば、Webサイトを作る場合画像の幅や高さなどは数字コードに打ち込んでいくが、STUDIOならマウスを動かして拡大や縮小をするだけでOK

スマホ表示も対応しているし、基本的ドラックドロップワンタッチドメイン取得からサイト公開まで簡単に行える。

店舗に出向かず物件契約可能Canary(カナリー)」

https://canary-app.jp/

「一度も店舗に出向かずに、物件相談内見契約までもできるサービス

賃貸サイトを見て、実際に連絡を入れて店舗に行くと、すでに埋まってしまったり、中には実はおとり物件だったということも多々ある。

さらスムーズ契約が出来ても仲介手数料結構かかるケースもある。

Canaryはそのデメリットを完全に排除したアプリである

アプリ上で気になった物件を見つけて、内見したい日時を決めて予約を行う。

内見は現地集合・現地解散契約テレビ電話でも行えるため、不動産屋の店舗に赴く必要がない。

無駄時間を減らし、スムーズ物件探しが進められる。

さら仲介手数料も最低金額保証するという徹底ぶり。

フリーランスお金心配をせずに働ける「FREENANCE(フリーナンス)」

https://freenance.net/

フリーランス個人事業主を支えるお金保険サービス

フリーランスで働く人にとっては、資金繰り相手先への請求が1つの大きな壁となる。

その月に締めても、支払われるのは翌月末なことが多いため、資金繰りが追い付かないと悲鳴を上げるフリーランスも多い。

このサービスは、例えば、翌月や翌々月まで待たないといけない相手からの支払いを、その日のうちに振り込んでくれる。

手数料も多少発生するが、それでもすぐに現金化できるのは魅力的であるし、相手先にバレないのもポイント

フリーランス会社保険などがないため、万が一問題を起こしたらすべてを背負うことになるが、FREENANCEに登録していればこれらの補償も受けられる。

正社員至上主義日本の働き方の概念を変える一歩になるサービスだと感じた。

後払いで旅行ができる「TRAVEL Nowトラベルナウ)」

https://travel.app/

ボタンひとつで即予約ができる。後払いで行きたい時にすぐ旅行に行けるサービス

アルバイトをして必死お金を稼いで旅行に行った、そんな経験を持つ人も多いと思う。

事前にお金を貯めてそのお金旅行をする、そして、予算に見合った旅行先へ向かう、これが当たり前だと思っている人は多い。

このサービスは、旅行した後に旅行代金を払うという、今までになかったやり方で旅行ができる。

格安航空券ホテルは後払いで、予約した際に入力した住所に支払い用のはがきが届き、予約から2か月以内に支払えばOK

運転免許証健康保険証などの本人確認書類撮影して提出するだけで簡単に利用できるため、とりあえず先に旅行したいという人に取ってはかなり需要があるかと。

ただ、支払えない金額旅行を先にしてしまうのは後々の負担になるため、ご利用は計画的に

まとめ

2019年に出てきた新サービス

どのサービスも今までになく、これがあったら便利だろう、と思えるものばかり。

まだまだ粗削りなサービスもあるが、スタートアップ最先端体感できるサービスがこれだけ多くあるというのはなかなか新鮮であり、今の生活をより豊かにするものばかりだと思う。

2020年、また新たな画期的サービスができることを願うばかりではなく、"自らも世の中を豊かにするサービスを開発しよう"と、改めて感じた。

2018-06-28

anond:20180628171853

どうでも良いけどブラウザで切り替えりゃ良いじゃん

Chromeを1つ取っても、一般的に使われているChrome-stable、βテストであるChrome-bata、より不安定な開発版であるChrome-Canaryの3つがある

しかオープンソースのみで構成されたChromiumもあるから、実際Chromeは6種類あることになる

ブラウザキャッシュはそれぞれ独立しているから、ブラウザを変えれば簡単アカウントも切り替えられるよ

2015-10-23

http://anond.hatelabo.jp/20151023065414

貸出履歴を見られてどうの、って時に想定されてるのは「恥ずかしい本」とかじゃないよ。むしろある特定思想信条を持つ傾向の人をマークするといった方面公権力が利用することに対する警戒だね。

大部分の人は関係ないって思うだろうけどね。でも、例えば「自分履歴は見せないでくれ」と申告した人だけ隠すってすると、それを申告した人が逆に隠すなんてやましいことがあるからじゃないか、って疑われたりするからね。

これは他のプライバシー情報も同じ。多くの人は、ほとんどの場合、知られてもべつにいいじゃん、と思ってる。けれどもたまに、やっぱり知られたくない場合が出てくる。その時だけ隠すと、却って目立っちゃうレアケースを保護するためには、最初からデフォルトでは見られないようにしておくしかないんだよ。もちろん、本人が見せることを選択して公開するなら構わない。デフォルトをどっちにしておくかって話。

余談だが、このように情報の欠落が情報を担うことがある。それを逆手に取って、公表が禁じられている公権力から干渉世界に知らせる方法がある(Warrant Canary)。

 
ログイン ユーザー登録
ようこそ ゲスト さん