はてなキーワード: 機械翻訳とは
免責事項: めんどくさいからほぼ調べずに書くし、抜けてる話や間違ってる話もあると思う。
Mozilla系の日本語翻訳はmarsfさんとdskmoriさんの2人がメインでやってる (追記: 今確認したらひとりアクティブな人が新規参入してたので3人が正しかった)。
概ねSUMOはdskmoriその他全てがmarsfという棲み分けだが、お互いどっちの貢献もやることがある。
SUMOコミュニティ解散ってのはSUMOに関わる実質的な権限持ちはdskmori1人になりますって話かな?
正直、SUMOでメインで貢献してるdskmoriさんじゃなくてmarsfさんが文句言うんや?と疑問なんだけど、
Mozillaにとっては、SUMOとかいう誰もアクセスしてない限界集落サイトの話より、marsfさんがFirefoxのその他すべての翻訳を一手で担ってることが重要だよね。
「marsfさんがSUMOの貢献辞める」って言ったってそれ自体ではどうでも良いのだが、裏の意味は「俺の気持ち次第でFirefoxの翻訳終わらすことだってできるんだぞ」って警告と読むべきかもしれない。
SUMOはFirefoxのサポートサイトね。Firefoxの使い方に疑問が生じたときにみるところ。まあそういう用途で作られているというだけで、アクセスする人がいるのかいたって疑問だが。
想定読者は技術に疎いFirefoxユーザなので、「機械翻訳ならユーザーが自分でやるから不要」みたいな意見は全くナンセンス。
Firefoxの内蔵翻訳機能はプライバシー重視という建前の翻訳API破産防止のため、ローカルのCPUで動く設計になってる。必然的にMicrosoftやGoogleの翻訳より精度がかなり落ちる。ゆえにFirefox使って普通に英語版SUMO読むより、公式で精度よい機械翻訳提供したほうが、ずっと良い体験を提供できるよね。
また対抗をGoogle翻訳のような無料クラウド翻訳と考えるとしても、サポートサイトに特化するようファインチューニングした機械翻訳エンジンを使えばHelpを助けてと訳すような暴走も抑制できるから、これも公式による機械翻訳提供に優位性はある。
なお、統計上アドオン一切入れてないFirefoxユーザーが大多数なことからわかるように技術に疎いFirefoxユーザってかなり多いからね。
Firefoxはラピッドリリースで機能がコロコロ変わるので、ある時点でベストな翻訳になっててもすぐ時代遅れになる。
dskmoriさんなどができる範囲で貢献してたとはいえ、品質維持できる量ではなかったので、SUMOには、例えばすでに存在しない機能についての記述を含む記事が普通にあった。
これは比較的アクセスありそうな重要ページでも同じで、私もさすがに見かねて貢献したこともある。
Microsoftのプロ技術者向けサイトはもともと有償の翻訳者が訳してたのを機械翻訳に切り替えたのでこれは単純に劣化なのだが、SUMOについてはごく少数の素人が自分にできる範囲で訳していたという点を踏まえる必要がある。もともとクオリティが高かったとは言えないし、機械翻訳の精度もここ2,3年で異常に上がってるから過去の機械翻訳騒動をもとに騒ぐのが正しいとも思えない。
今回の事件で思い出すのがLibreOffice日本語チームのDramaね。LibreOfficeの翻訳のメイン貢献者の某氏がある日、日本語チームのメーリスで「何でお前らはまともな仕事ができんのんや」と長文でブチ切れて、チーム脱退を宣言した事件。理念は立派でもすでに敗北の流れは決定的で新たな貢献者の望みは薄い、希望の見えないまま最後に残った1人として惰性で維持するしかない、辛い。
今回は、LibreOfficeの事件よりはヤバさだいぶ低めだけど、「翻訳ガイドラインに従っていない」「新たな人間の貢献者を育てることができない」とか、SUMOボランティア翻訳の実情を思えば「何言ってんだ、現実をみろよ」という感想にしかならないし、CCライセンスで貢献してるのに、AI翻訳の学習に使うなも意味不明。
marsfさんは、某xkcdで言うところの「感謝なしに2003年からデジタルインフラを維持してきたネブラスカ州の無名個人」に位置する人で、もっともっと感謝されてしかるべきではあるのだが、SUMOの長年の構造的な問題に対し抜本的な解決に打って出たMozillaに対して、さもコミュニティが現在も十分に機能しているかのように反論してるのがとても印象悪い。どう見ても分かってない人ばかりがMozillaを炎上させている。
20年感謝なしに維持し続けるのは幻想が必要なのはわかるが、Mozillaとしてはそういう個人に依存するのは不健全でしかないので、現在marsfさんがやっているFirefoxほぼすべての翻訳も翻訳会社による有償翻訳に移行すべき。
https://x.com/AliYerlikaya/status/1954035806256968127
“Silahlı terör örgütüne üye olma" suçundan ulusal seviyede aranan M.Y. isimli şahıs JAPONYA’da yakalandı ve ülkemize iadeleri sağlandı.
https://yandex.com.tr/gundem/politics/11-suclu-turkiye-ye-iade-edildi-3340100
機械翻訳:
赤い通知により、国際レベルで指名手配されているジェム・チェブリム、メフメト・エネス・エゼル、エクレム・ユルマズ・テュム、ユミット・アルトゥンタシュ、シナン・コチ、ムラト・ギュルゲン、国家レベルで指名手配されているマフフズ・バンル、カディル・カン・ヘルヴァチュ、エフェ・ギュデク、ギョハン・シェン、マヒルカン・ユセルという犯罪者が逮捕され、トルコに引き渡された。
3
左翼団体が必死に難民だと主張していたマヒルジャンユエルはテロ組織に所属する単なる指名手配犯で
そりゃトルコには帰れないと主張するわな。
狂気に等しいと思う。
でも現実では全く駄目。
論文書くときに英語読めなすぎて機械翻訳に騙されてずっと「あれ?おかしくね?」みたいなのしょっちゅうやってたレベル。
ここ20年ぐらいはなんちゃって頭脳労働でエクセルおじさんしてるだけだから、高校レベルの問題も解けないと思う。
それでも「俺は賢い」と思ってるし、それだけが存在価値だと思ってるので、知能を証明するために色々アホなことやってる。
たとえば5chやふたばに行ってわざわざアホな言動してる奴を捕まえてはレスバでボコボコにしたり、WIKIやニコニコ大百科に変な記事作って承認世級満たしたりしてる。
配信直後の動画や漫画を高速消化してコメント欄でいいねを集めようと頑張ったりとか。
マジでくだらんと思うんだけど、たまにめっちゃ上手くいくと脳から色々ドバドバ出て「これで暫くは生きていけるな」って気分になる。
どうしたらいい?
カウンセリングか?
本当の本当にお勉強ができるお医者様達に「僕は貴方達より学生時代から偏差値10ぐらい低い生き物だったのに「俺は賢いぞ」と思い込んでるんです」って相談に行くのか?
ヤバイな。
「注目エントリ」が英語の“Delta/Alaska Airlines”など旅行サイトのFAQsばかりになっているのは、荒らしではなく 英語圏のFAQ系自動投稿ボット が Hatena Anond にリンクだけ貼って宣伝スパムしているからです。
●仕組みの推測
海外旅行系Q&AサイトやクルーズFAQページ — たとえば
“What age is senior discount on Delta?”
“What are the cheapest days to fly on Alaska Airlines?”
“How to Quickly Speak to a Disney Cruise Line Representative?”
→ こうした英文のFAQsを、ボットが巡回して自動で投稿しています。
自動クロール+リンク貼り付け — 特定のキーワード(航空会社名や「FAQ」など)を拾って、自前のページURLやアフィリエイトリンクに誘導する目的で投稿するスクリプト型ボットです。
Hatena Anond のアルゴリズムで「注目」枠入り — アフィリエイトリンクやあまり読まれていない投稿でも、外部リンクや特定タグを含む投稿が「注目エントリ」枠に引っかかってしまう仕組みがあるっぽいです。
✅ 対応策
注目エントリの基準が変わるか、投稿数やブクマ数のしきい値が改善されれば、こういったボット投稿は目立たなくなる可能性があります。
つまり、迷惑な荒らしではなく、アフィリエイト誘導目的のFAQ系英語ボットによる自動投稿で、Hatena の注目枠の脆弱性がつけ込まれている状況です。
〇
Q,ゆうてこんなんアフィリエイトにならなくない?どういうこと?
→ SEO効果がなく、外部への誘導リンクとしての価値は激減。
→ 日本語ユーザーには読まれず、クリックもされない。商品が売れるわけがない。
リンク先もGoogle検索や企業サイトのFAQでアフィタグすらついていないことも多い
→ 仮にクリックされても、報酬発生に繋がる仕組みになっていない。
🤖 じゃあ何が目的なのか?
投稿→一定の反応を見る→「クリック率」「タイトル生成の傾向」「削除されるまでの時間」などをログに取る
Googleは一次リンクだけでなく、二次・三次リンク網も解析対象にしてるので、そうした**“スパムSEOファーム構築”**の一環の可能性
RedditやQuoraでも同様のボットがいて、「英語圏でバンされにくいけど注目を集めやすい」サイトとして、はてながターゲットにされてる可能性
🧠 結論:
金儲けというより、実験or構造破壊を目的とした投稿の可能性が高い。
昔の2chスパムみたいに、商業性が低くても「Botが回ってる状態を作ること」自体が目的のケースもある。
それか、他言語投稿でも「注目エントリに入る」という 脆弱性の可視化かもしれません。
何かしらの金銭的リターンではなく、
「ボットが弾かれない程度の分量でいける」
このあたりが主目的だと考えられます。正直、ちょっと気持ち悪いです。
●
Q,この辺のbotはサイト運営側の規制でなんとかなるもんなの?
A,
結論から言うと、やる気があればサイト運営側で対処は可能です。
ただし、はてな匿名ダイアリー(Anond)のような匿名投稿制+老朽化した構造のサイトだと、以下の理由から完全対応が難しいか、遅くなる傾向があります。
✅ 運営側ができる対策(そして現実にはやってない/やりにくい理由)
Botの多くは海外IPや特定のBot用UserAgentを使う。
しかし:日本人がVPN経由で使ってる可能性もあるため、雑に弾くと正規ユーザーも巻き込む。
⇒ 最低限の日本語割合、閲覧数下限、はてブ数フィルタなどを加えれば一発で解決可能。
しかし:下手に改修すると正規ユーザーの目に触れる率が減る→運営へのクレームに繋がる懸念がある。
AIやLangDetectで「日本語じゃない」「FAQテンプレ構文」「外部誘導リンクのみ」の記事を弾く。
これは現実的だが、はてなは匿名投稿の自由を重視する風土なので、規制強化は避けがち。
→これは一番効果的だが、過去ログ検索機能が乏しい今のAnondに実装するのは工数が大きい。
海外の無料ブログサイト(たとえばTumblr、WordPress.com、Wixなど)はすでにこの手のBotを大規模ブロックしてます。
でも、「そこまでの深刻な被害じゃない」と認識されている限りは放置される可能性が高いです。
「注目エントリ」欄がスカスカになるよりは、Botでも埋まってた方が場が回ってる感が出る。
通報・苦情が一定数を越えない限り、“一部マニアが気づいてるだけの現象”として扱われている可能性が高い。
🧩 結論:
でもはてなは「匿名文化」と「運営の放任体質」のせいで Bot天国になりやすい設計。
IQで知性や仕事能力を測れるなら就活でもなんでももっと表に出てきていい指標のはずなんだよね
でもそうなってない
結構な会社で適性試験は導入してて、性格だけのこともあるけど、知識や処理能力を見るものも受けさせてるんだよね
だがIQテストを受けさせられると聞いたことはないし、実際に私がやったこともない
次に高IQの人が入会できるMENSAという組織についてみてみようか
MENSAはIQ130以上の人(※試験によって点数は異なるみたい)が入会できる組織でイギリス発祥だがJAPAN MENSAという
JAPAN MENSAのHPを見てみたところ、明らかに英語原文を機械翻訳に通して日本語で標記している所が多々見受けられる
まとものHP運用すら出来ない組織が高IQで構成されているって正気かな?
著名人のMENSA会員で頭いいなあと感じる人も確かにいるけど、頭はいいかもしれないけどぶっ飛んでいてこいつ使え無くね。みたいな人を
見ることも多い
私は日本語を話す日本人で、英語は少しできる程度だが、日本語だけでなく英語の動画もたくさん見ている。
素直にYouTubeの言語設定を日本語にしていると、「中途半端にやる気のある作者がいろんな言語に対応しようと一括で機械翻訳したと思われる、低クオリティな日本語タイトルの動画」をサムネ一覧の中にところどころ見かけることになってしまうので、言語設定を英語にしたい欲求に駆られることになる。しかし、だからといって英語にしてしまうと、今度は「日本人の作者が翻訳した英語タイトルの動画」を、たくさん目にすることになってしまう。ふつうの日本語のコンテンツを、わざわざ(翻訳がつたないこともある)英語タイトルで視聴するかどうか判別したくはない。
YouTubeとしては「動画作成者が複数の言語を用意していて、視聴ユーザーの言語設定と一致しているなら、その言語で表示してあげてるだけだぞ」ということだろうが、動画作成者が用意したクオリティに差のある複数の言語を一律で平等に扱うのではなく、視聴ユーザー側としても優先言語を複数設定できるようにした上で、動画内のネイティブ言語が日本語なら表示も日本語を、英語なら英語を優先してほしい。
ちなみに動画内の言語を本人の声を真似て音声翻訳する機能は、映画の字幕吹き替え論争よろしく好みの問題だろうが、私は好きじゃない。オリジナルな本人の肉声で聞きたい。あと、字幕機能も個人的には「あくまで話者の言語をそのまま文字にしてほしい」ことが多いのだが、YouTubeを英語設定にしているとデフォルトでは日本語の動画も「英語に翻訳した字幕」が表示されてしまうのが気に入らない。(そして字幕の変更は操作体験が悪い)
こんなことをYouTubeに直接要望しても何にもならんだろうから(いちおうフィードバックには送信する)、ここに吐き出しておく。
Claudeは日本語が上手いとは言うけど、コンテキストを与えなかった時はめちゃくちゃ適当な事がよくあるんだよな
ジャムとは?
ジャムるとは?
「ジャムる」(jameru)は日本語の俗語で、主に二つの意味で使われます:
混雑する・詰まる:「電車がジャムっている」のように、交通渋滞や人混みなどで動けない状態を表します。英語の"jam"(詰まる)から来ています。
音楽用語:バンドやミュージシャンが即興で演奏すること、または一緒に演奏することを「ジャムセッション」と言いますが、これを動詞化して「ジャムる」と言うこともあります。
んで
A1. ジャムの法則(定理)は、ソフトウェア開発やプロジェクト管理における経験則の一つです。この法則は次のことを述べています:
「進捗状況の報告は、プロジェクトの完了に近づくにつれて徐々に遅くなる。90%完了したという報告から実際の完了までの時間は、最初の90%を完了するのにかかった時間と同じくらいかかることがある。」...
A2. ジャムの法則(Jam's Law)は、主に生物学や医学で知られる原理で、個体数の増加と資源の限界に関する概念です。最も基本的な原則としては、「閉鎖された環境における生物の個体数は、指数関数的に増加した後、利用可能な資源の限界に達すると急激に減少する」というものです。...
まぁこういうのは日本語版「~の法則」がだいたい妙な用語で周知されがちな所に原因があるんだが
Mañana Principleが「マニャーナの原則」ではなく「マニャーナの法則」として輸入されたせいで機械翻訳するとManana's Lawになり、ニュアンスが変わってしまい検索しても関係ないページが引っかかりまくるとかな("法則"とはちょっと違うのでprinciple以外を選択する場合lawではなくruleが正しい)
そもそもThe Jam ProblemやThe Jam Experimentとして語られているものを「ジャムの法則」とか言い出したのはどこの誰だよ
話を戻して
ジャムの法則に関してはマーケティングや行動経済学などの語を挿入することで、細部の正誤はともかく目的としている解説を得られる
A. マーケティングにおける「ジャムの法則」(The Jam Paradox)について説明します。
これは、2000年にコロンビア大学のシーナ・アイエンガーとスタンフォード大学のマーク・レッパーによる有名な研究から生まれた概念です。彼らはスーパーマーケットで実験を行い、以下の結果を得ました:...
対してGPTは4o(新旧不問)時点でも日本語の「ジャムの法則」単体がOverchoiceやThe Paradox of Choiceと結びついているし
国産LLMは当然ながら、GeminiとDeepSeekもそのままでいい
Q. ジャムの法則とは?
A. 「ジャムの法則(The Jam Experiment)」は、心理学および行動経済学の分野でよく引用される現象で、選択肢が多すぎると逆に人は選べなくなるという法則です。これは「選択のパラドックス(Paradox of Choice)」とも呼ばれます。...