はてなキーワード: 幼女とは
増田です。 DMM傘下のAlgomaticが提供していた「にじボイス」がサシュウを発表した。
プレスリリースには「法的な権利侵害はなかった」「パラメータ調整の結果、偶然似てしまった」などと書かれているが、これを真に受けている人は少し冷静になったほうがいい。
「日本の法律では学習は合法だ!」「日俳連の圧力に屈した!」と騒ぐ擁護派もいるが、今回の件はそんな単純な話じゃない。
これは「AI技術の敗北」ではなく、「ある企業が吐いた嘘と、杜撰なデータ管理が露呈して自爆した」というだけの話だ。
盲目的に企業を擁護する前に、技術的な事実関係の「答え合わせ」をしておこう。
なお、あくまで技術的な根拠を示しているだけであって、問題があると断言できないことは断っておく。
まず、擁護派が盾にする「著作権法30条の4」について。 確かに今の日本の法律では「情報解析」が目的ならば、元データが何であれ(おそらくエロゲーから音声を抽出したデータセット『moe-speech』であっても)、それをAIに食わせてAIモデルを作るだけなら、一応は適法とされている。 そこだけ切り取れば、違法ではないと言い張れる余地はある。
Algomaticが行っていたのは、一般的な基盤学習にとどまらず、「特定のキャラクター(=特定の声優)を狙い撃ちしたFine-tuning(追加学習)」である疑いが極めて濃厚だという点だ。
『moe-speech』は、親切なことにキャラごと(声優ごと)にフォルダ分けされている。 ここから特定のフォルダを選んで、「その声優の声質や演技の癖」を再現するために個別学習(Fine-tuning)を行う。 これはもはや「データの統計解析」ではない。特定個人の実演の「デッドコピー(模倣品)の作成」だ。 これをやると、生成された音声には明白な「依拠性」が生まれる。つまり「パラメータ調整で偶然似た」のではなく、「その声優のデータを意図的に使って似せた」ことになる。これはパブリシティ権や人格権の侵害に問われる可能性が極めて高いラインだ。
Algomaticは「適切な権利処理を行った」「声優から許諾を得た」「パラメータ調整で作った」と主張していた。
しかし、有志による技術検証によって、その主張と矛盾する証拠がいくつも出てきている。
「にじボイス」の音声を分析すると、キャラによって音量が不均一だったり、明らかに古い年代のマイクで録ったような「こもった音」が混在していることが判明している。 もし公式が言うように「統一されたスタジオでプロを呼んで新規収録」したなら、こんな品質のバラつきが出るはずがない。 これは、録音環境も年代も異なるバラバラのゲームデータ(moe-speech等)を寄せ集めたと考えるのが自然だ。
検証の結果、有名声優の声と音声の特徴量が「ほぼ本人」レベルで一致するキャラが多数発見されている。 「パラメータ調整で偶然似た」と言うが、声の高さや速度はいじれても、その人特有の「骨格からくる響き」や「微細な演技の癖」まで偶然一致することは、AIでもまずまずあり得ない。 元データとして「その人の声」を食わせない限り、ここまでの再現は不可能だ。
これも動かぬ証拠だ。 元ネタの『moe-speech』には、作成者の抽出ミスで「幼い女の子の祖父の声(老人男性)」に、誤って「幼女(女性声優)」のタグが付いているという有名な汚れ(エラー)がある。
これを踏まえて、にじボイスに実装されていた「ある老人キャラ」の声を解析モデルにかけると、どうなるか。 なんと、「この老人の声は、〇〇(特定の女性声優)である」という判定が出たのだ。
意味がわかるだろうか? にじボイスのモデルは、「このおじいちゃんのダミ声=あの女性声優の声だ」という、moe-speech特有の「間違った知識」を学習していたということだ。
もしAlgomaticが主張するように、スタジオで老人役の声優を収録したなら、そのデータに「女性声優」のタグが付くわけがない。 これは、「タグ付けミスすら直されていないネット上のデータを、中身の検品もせずにそのまま学習させた」という、言い逃れのできない証拠(トレーサビリティ)になってしまっている。
今回のサービス終了は、日俳連の理不尽な圧力によるものではない。
「自社開発」と謳っておきながら、実際はネットのデータを検品もせずに流用していた事実が、技術的な証拠によって明るみに出そうになったため、これ以上の追及を避けるために店を畳んだ。
そう見るのが妥当だ。
「AI推進派」を自認する人たちにこそ言いたい。 もし本当にAIの発展を願うなら、こうした「産地偽装」のような振る舞いをする企業を擁護してはいけない。
それは真面目にコストを払い、権利処理を行い、クリーンなデータセットを構築しようとしている技術者への冒涜であり、ひいてはAI技術そのものの社会的信用を地に落とす行為だ。
「AIだから何でも許される」わけではない。 技術は魔法ではないし、嘘はいつか必ずバレる。
今回の件を「可哀想なAIベンチャーがいじめられた」と総括するのは、あまりにも事態の本質を見誤っている。
以上。
十月二十九日、本家旧twitter・現Xで「皆がそろそろ忘れていそうなもの」として「対多」が挙げられ、それがバズった。
【参考】https://x.com/ankoromoch6421/status/1983190305592750425
そのせいで、一時的に人口が増加した。「青鳥民帰宅希望」みたいな投稿もちらほら見られたが、現時点では落ち着いている。平日昼間の場合、十分に一回くらいの投稿しかないことも多く、いたって平穏なタイムラインである。忙しい現代にあっては、こういう場所もあってよい。なお、twitterが落ちたかどうかとかを確認しに来る人も結構いるみたいで、これは初期のころから変わっていない。
「枝豆」や「猫」荒らしも大分落ち着いてきたのだが、単純に人が減っただけかもしれない。過疎だが、平和な集落のようだ。心無いレスをする人はゼロではない。ただし、一部は単に語調を整えるひらがなが使えないので、ぶっきらぼうに見えているだけかもしれない。あと、ジョークで書いているつもりでも、ジョークとわかりづらいのも、偽中国語の難しいところか。
現在十五日目。毎日いろんな質問をする。例えば十一月十七日は「貴方、交際経験有?又、交際何日間?」であった。意外と盛り上がっている。
「魔魔~」「抱子~」とつぶやく。寂しいんだろうな……。この季節は一人だとつらいよね(八時十一分追記:よく考えたら晩秋以外にも普通に投稿があったわ……)。
性格には「楽天力一卜”男」。楽天カードのCMを脱法カタカナを交えて叫ぶ。YouTube広告のパロディ。ときどき「ASMRの邪魔をするな」とレスがつく。
「其晩 青虫 腹痛因泣」などと、エリック・カールの絵本の一説を投稿する。
僕もこの絵本大好きだったな。
安価で小説を書いてくれてた人。全部偽中国語なのにとても頑張ってくれてた。
以前書いた、「本日幸運品物」とラッキーアイテムを教えてくれる人のパロディで「本日不要品物「労働」皆糞一日!」と締めくくる。なお、本家「本日幸運品物」の人は、一週間ほど連続して、ラッキーアイテムが「金木犀」だったことがある。
「女子高生太腿最高也!」の亜種。基本的にノロケなのだが、時々「こういうプレイをした」と妙にきわどい発言がある。なお、同一人物かは不明だが、彼女に膝枕をしてもらえない人を煽る人もいた。彼女さんは九つ年上らしい。基本的にノロケを聞くのは好き。ただし彼女さんのためにあまりきわどいことを書くのはやめましょう。
自称高校生の女性で、お尻を叩くと喜ぶ。一度スレッドが百まで伸びた。
男女問わず、夜や休日に人恋しくなって構って欲しがる人は結構見かける。猥談をしてたと思ったら、普通に雑談になったり。きっとみんな寂しいんだろうな。一度雑談ですごく盛り上がってときに、「リアルで会いたい」と女性が言ったが、男性は「私は年上すぎる。やめておきなさい」と答えてた。ちゃんとしてる。
前からいたけれど書き忘れていた。あたたかくて気持ちがいいので子どもを抱っこして寝たいらしい。怖い。返信は大抵「通報!」。
お下品すぎる。
囧の顔の棒人間のAAが猫を虐待している投稿を繰り返す(日本刀で斬ったり鍋で煮込んだりしている)。往年の2ちゃんねるの虐待スレのような闇を感じる。すぐに投稿を消す。この人は前からいたが書き忘れていた。
「女子高生太腿最高也」「御早之屁」の人はずっといる。古事記原文を投稿している人は、二代目か三代目の天皇の辺りにまで話が進んでいる。ここまで来たら本人にとってはマジに勉強になっていそう。
あと、よく見る返信としては恋愛に悩む人に対して、「我斗交際如何?駄目?総……」ってのがある。
「実八私八」の人は投稿を全部消したが、模倣犯がいるのでまだ見かける。
女子とイチャイチャしたいと呟いていた「我中三男子可愛女子戸居茶居茶死体」君は、最近女子と手をつなぐことに成功した模様。良かったね! でも、近所のイオンに誘ったら断られてしまったらしい。次があるさ。受験頑張ってね。
後、交際相手がほしいと嘆いていた人は、無事に仕事が見つかったみたい。応援してる。
さて、対多は無事に一周年を迎えられるか(一番最初のバージョンが十二月十日、一度鯖落ちして現バージョンになっている)。まさか一周年を機に閉鎖ってことはないよね、大丈夫かな。
以上〠
昨日ツイッターが鯖落ちしたらしく、大量の避難民が押し寄せ、「青鳥落?」という投稿がものすごい勢いで並んでいた。ほとんどの人が「罰」「乂」と呼ばないのが面白い。
男性とは性染色体がXYで、女性とはXXの人だと思っていたんだよね。
難しいのはXXYで生まれる人とか、半陰陽として男女両方の生殖器を持って生まれる人とかが極少数いて、科学者から見てもどちらにも当てはめようがなくてめちゃくちゃ難しい、ここが議論のしどころなのかなと思ってた。
あとXYで生まれたけど体を手術で変えることを望み、実際に男性器を切除して女性器を形成する手術を受けた人。これについてはもう女性で良いのではないかと思うようになった。
睾丸がなくなっていると男性ホルモンも減るし、女性ホルモンを打ち続ければ見た目も女性化していくしね。
最近、XYで生まれ男性器がついており、手術しない。見た目は普通の男性。そして性的対象は女性。ただ自認が女性なので戸籍を女性に変更してくれ、女湯にも入るという人が数人出てきてる。
意味がわからない。完全な男性でしかないじゃん。染色体も性器も完全に男性なんでしょう?男性でしかない。自認って言ったもの勝ちすぎて科学の要素がゼロ。論外過ぎない?
論点ってXXYや半陰陽のような生物学的に分類が難しい人が中心になるはずでは?なんで論外な人が女性を名乗ろうとしているの?戸籍変更の権利を訴えてるの?
無いよそんな権利。合法的に女湯に侵入して幼い少女の全裸を観察したい異性愛者の性犯罪者じゃん。実際、男性器つきのまま女湯に入って幼女を触ったとかSNSに投稿しているし。犯罪者をちゃんと取り締まってほしい。