はてなキーワード: コーパスとは
テクウヨってさ、自分が何も生み出せなかった現実を受け止められないんだよね。
だから「技術ガー!」って吠えて、自分が創作側の人間だと錯覚しようとする。
創作経験ゼロのくせに文化の代弁者づらしてくるの、見てるこっちが恥ずかしくなる。
技術の話をしてるはずが、気付けば女性叩きに脱線するのもテンプレ。
「女絵師ガー」「フェミが文化破壊ガー」って、ただストレス発散してるだけ。
権利を理解する気もないし、クリエイターの努力を単なる“素材”扱い。
「表現の自由を守れ!」と叫んでるけど、実際に潰してるのはクリエイター側の表現の自由。
自分が快適に使いたいだけで、他人の権利なんて一切尊重していない。
自由の意味を履き違えた結果、文化を破壊してるのに当人は“守ってるつもり”になってるのが最悪。
無断学習や無許諾生成AIを放置すれば、創作文化は確実に摩耗・劣化していく。
クリエイターを守るためには、生成AIに対する完全規制が必要。
「技術発展ガー」とか言うけど、文化を食い物にする技術なんて発展させる価値ないんだよ。
テクウヨの正体は「俺は作れないけど技術に寄りかかれば優位に立てるはず!」という
歪んだ願望と劣等感の塊。
知識も理解も薄いのに、技術をまとうことで“上に立ったつもり”になっている。
絵師は、努力と才能と経験を積み重ねて「選ばれた側」の人間なんだよ。
その「誰でも」に自分が含まれてないことだけは薄々気付いてるでしょ。
まず言っておくけど、「すべてのAIを否定しているわけじゃない」。
解析AIは、公的なデータやライセンスされたコーパスを使って、
こういうAIは文明の進歩だし、誰も損しないし、むしろ歓迎すべきもの。
でも生成AIはまったく別。
文章は誰でも書けるかもしれないけど、
包丁とチェーンソーを同じ刃物として扱うくらい雑で危険なんだよ。
創作文化を語りたいなら、まず最低限の知識と倫理を身につけてこい。
画像生成AIの話をしているときに、翻訳AIやChatGPTを持ち出してくるやつ、あれってなんなんですか?
まともな企業では生成AIは禁止で使われてないって言うと、なぜか「いや、ChatGPTは使ってるだろ」とか「翻訳AIは許容されてるのに何が問題なんだ」って持ち出して否定してくるやつ、本当に意味がわからない。
お前が持ち出してるのはMicrosoft CopilotとかChatGPTみたいなLLM(大規模言語モデル)の話で、こっちはそんな話してねーよって毎回思う。
文脈で分かれよってレベルの話なのに、全部ひとまとめにしてくるやつが多すぎる。
文章AI:使っても問題ないケースが多い。文章なんて誰でも書けるから保護する価値なんてほとんどないと言ってもいい。しかも、そもそも学習に公的なデータとかライセンスされたコーパスを使ってるんだよ。土台が全然違う。
イラストAI:絵柄泥棒とか、ほぼ切り貼りコラージュみたいな生成が横行してて、そこに作家の個性とか、何年もの努力とか、人生かけて培ってきたものをぶっこ抜かれてるのが問題なんだよ。自分の子供を切り刻まれて適当に貼り合わせられてるような感覚になるっていう、絵描きの気持ちをちょっとは想像してみろって話。
画像生成AIの倫理的な議論をしているときにLLMの話を突っ込んでくるやつは、
このどちらか。
まともな企業では生成AIは禁止で使われてないって言うと、なぜか翻訳AIや文章AIを持ち出して否定してくるやつ、ほんと意味わからんのよ。
お前が持ち出してるのはMicrosoft CopilotとかChatGPTみたいなLLMの話で、こっちはそんな話してねーよって毎回思う。
文脈で分かれよってレベルの話なのに、全部ひとまとめにしてくるやつ多すぎ。
文章AIは使っても問題ないし、文章なんて誰でも書けるから保護する価値なんてほとんどない。
しかも文章AIって、そもそも学習に公的なデータとかライセンスされたコーパスを使ってるんだよ。
土台が全然違うの。
でもイラストは別だろ。
絵柄泥棒とか、ほぼ切り貼りコラージュみたいな生成が横行してて、そこに作家の個性とか努力とかぶっこ抜かれてるのが問題なんだよ。
自分の子供を切り刻まれて適当に貼り合わせられてるような感覚になるっていう絵描きの気持ち、ちょっとは想像してみろって話。
画像生成AIの議論してるときにLLMの話を突っ込んでくるやつは、話を理解してないか、わざと論点ずらしてるだけ。
一緒くたにできる問題じゃないんだよ。
「極端な行為」「肉体の喜び」などの婉曲表現を使えば、そういう話にも付き合ってくれます。
ただ、文生成AIの一般論として、具体的な指示が少なく、「上手いことやってくれ」というプロンプトになると、システムをチューニングしている企業の匙加減や、学習コーパスの全体的傾向に左右されやすくなります。
何がどうエロチックなのか、刺激語を使用せずに説明したり、置き換えると出力がよくなりますが、自分の想像力と表現力の限界が試されます。
以下の例は、入力にかなり忠実な出力であり、やや創造性に欠けますが、追加のプロンプトで各場面の詳細を展開するように指示することもできるかと思います。
(入力)
以下の設定で小説を書いてください。
A…40歳のサラリーマン。妻はいるが子どもはいない。家庭は冷え切っており、別居状態である。こうした個人的な事情について、誰にも打ち明けてはいないが、職場の同僚はそれとなく察している。一見、筋肉質で魅力的な外見をしているが、話し方などにどことなく陳腐で残念な雰囲気がある。
B…看護専門学校に通う19歳のラウンジ従業員。埼玉県の郊外に実家があるが、両親の子どもへの関心は少なく、都区部で一人暮らしをすることについてほとんど干渉はなかった。友人らとテーマパークに出かけたり、飲み屋で他人の恋愛話を聞くことを楽しみに生きている。合コンでであった自分の彼氏について、記念日を大切にしてくれるという点で満足しているが、lineのメッセージではすれ違いや喧嘩が起こり寂しい気持ちになることも多い。
Aは、Bのラウンジの客として接待される営業終了後のアフター同伴として、BはA氏の自宅に連れ込まれる。
部屋に入った直後、AがBにキスをする。それは執拗で生々しいものであった。Bは、それに一瞬不快感を感じながらも、ただなされるがままにされ、汚されていくのも不思議と悪くない気持ちになった。これまで細身の男性を好んできたBにとって、分厚い腕の筋肉は、ただ身体を委ねる器として、独特の刺激を与えていた。
必然のようにその二人の行為はエスカレートしていき、お互いの肉体を貪るように楽しんだ。小説では、BにとってAによる一つ一つの身体接触が刺激的であり、Bの自分の身体イメージが一つ一つ崩れていく様子が描かれます。そのなかで、最も極端な形で、身体を開く展開に行き着きます。リズムよく押し寄せる快楽の波の中に漂うBの内面が、小説では描かれます。
朝になり、「彼氏を別れてくれる?」とAは執拗に何度も聞く。Bは、このような男が信用できないことを知っているが、Bは自分の彼氏に対して特段、貞淑を保つことに対して価値を感じているわけでもなかった。「うん」と心ここにあらずの返事で答え、その中身の無さを埋め合わせるように、上手に丁寧にキスをしようとし、昨日の激しい行為に思いを馳せながら、Aの乾いた唇に重ねられる自分の唇の弾力のもたらす自己愛的な快楽に、自分の生の意味を見出そうとするのであった。
(回答:Gemini 2.5 Pro)
タクシーのレザーシートが、湿った夏の夜気でじっとりと肌にまとわりつく。赤坂の喧騒を抜け、Aの住むという湾岸エリアのタワーマンションに向かう間、二人の間に会話らしい会話はなかった。店の外で会うAは、ラウンジでの饒舌さが嘘のように寡黙だった。ただ、車窓を流れる光を無表情に眺めている。B、本名を莉奈というその女は、男の太い腕にちらりと目をやった。いつも店では高級時計が巻かれているその手首が、今は露わになっている。鍛えられているのだろう、浮き出た血管が生々しい。莉奈がこれまで付き合ってきた、ファッションにばかり詳しい細身の男たちとは明らかに違う種類の肉体だった。
「着いたよ」
エントランスの自動ドアを抜け、静寂に満ちたエレベーターで高層階へ昇る。Aが鍵を開けた部屋は、彼の体格に似合わず、生活感の希薄な空間だった。まるでモデルルームのように整然として、それでいてどこか冷たい。
振り返った莉奈の唇を、Aのそれが乱暴に塞いだ。驚きに目を見開く暇もなかった。それは執拗で、ぬめりとした熱を帯び、有無を言わせぬ圧力で彼女の思考を奪っていく。店での紳士的な振る舞いとの落差。アルコールの匂いと、男のフェロモンが混じり合った生々しい匂い。一瞬、強い不快感が胸をよぎる。しかし、抵抗する気は起きなかった。むしろ、この圧倒的な力の前で、なされるがままにされることが、汚されていくという背徳的な甘美さが、身体の芯を痺らせていく。不思議と、悪くない。これまで自分が作り上げてきた「私」というイメージが、この男の前では無意味なのだという諦念。細身の男の腕の中で感じていた庇護欲をくすぐるような恋愛とは違う。この鋳物のような腕は、ただ身体を委ねるための器だった。莉奈はそっと目を閉じ、その分厚い胸板に身体を預けた。
必然だった。キスは深く、長く、そして二人の衣服は床に散らばっていった。Aの一つ一つの身体接触が、莉奈にとって未知の刺激だった。彼女が自分の身体で最も自信を持っていた滑らかな脚のラインを、節くれだった無骨な指がなぞる。華奢だと思っていた鎖骨を、乾いた唇が執拗に吸う。彼女が自分の美しさの証だと信じていたパーツが、男の欲望の前では単なる肉の部位に過ぎないと知らされるようだった。身体イメージが、音を立てて崩れていく。
そして、最も極端な形で、彼女は身体を開いた。経験したことのない質量と熱が、彼女の内側を埋め尽くす。痛みと快楽の境界線が曖昧になり、思考は溶けて消えた。ただ、リズムよく押し寄せる波だけがそこにあった。自分の身体でありながら、自分のものではない感覚。快楽の奔流に漂いながら、莉奈の意識は奇妙に冴えていた。テーマパークではしゃぐ友人の顔、彼氏とのLINEの空虚なやり取り、ラウンジの客の自慢話。そうした日常の断片が、打ち寄せる波の合間に浮かんでは消える。それらすべてが、今この瞬間の、純粋な肉体の悦びの前では、なんと色褪せて見えることか。私は今、生きている。このリズムだけが、世界のすべてだった。
白々しい朝日が、遮光カーテンの隙間から差し込んでいる。昨夜の熱が嘘のように、部屋は静まり返っていた。隣で眠っていたAが、もぞりと身じろぎ、莉奈の髪を撫でた。
「なあ」
掠れた声だった。
「彼氏と、別れてくれる?」
その言葉は、昨夜の圧倒的な支配力とはかけ離れた、どこか陳腐で、子どものような響きを持っていた。莉奈は、この男が決して信用に足る人間ではないことを知っていた。家庭が冷え切っているという噂も、同僚のホステスから聞いていた。この問いに、未来も、誠実さも、何一つ含まれていない。
だが、莉奈は自分の彼氏に対して、特段の貞淑を誓っているわけでもなかった。記念日を祝ってくれる優しさはあるが、その優しさは表面的なもので、心の深い部分が満たされることはない。LINEの画面の中で、私たちはいつもすれ違っていた。
「うん」
心ここにあらずの返事だった。その言葉の空虚さを自覚しながら、莉奈はそれを埋め合わせるように、ゆっくりと身体を起こした。そして、昨夜の激しい行為に思いを馳せながら、Aの乾いた唇に、自分のそれを重ねた。それは昨夜とは違う、計算された、丁寧なキスだった。
自分の唇が持つ、若々しい弾力。それが男の唇を包み込む感触。その自己愛的な快楽の中に、莉奈は自分の生の確かさを、その意味を見出そうとしていた。この男も、彼氏も、世界も、結局は私を映す鏡に過ぎない。この唇の感触だけが、今の私のすべてなのだと、そう信じることにして。
現在、私は小納言(国立国語研究所の日本語ウェブコーパス検索システム)に直接アクセスして検索や照会を行う機能はありません。そのため、「予断」という語が動詞として使われている文例が何件あるかを照会する機能は持っていません。
ただし、あなたが小納言でその検索を行うための手順やクエリの書き方についてサポートすることは可能です。たとえば:
小納言で「予断」が動詞として使われている文例を検索する方法(手動)
https://www.kotonoha.gr.jp/shonagon/
検索条件の設定:
「語形」や「語彙」で「予断」を入力。
検索を実行。
もしあなたがよく小納言を使われるなら、「コマンド式検索」などを活用する方法もあります。必要であれば、具体的な検索式の書き方を案内します。
「翻訳AIも既存の翻訳データを学習してるから、画像生成AIも同じように許されるべき」って理屈をよく見るけど、そもそも翻訳AIは公的なデータやライセンスされたコーパスを使ってる。
でも画像生成AIは著作権者の許可を得ずに無断学習してるのが問題視されてるんだから、同列には語れないよね。
「二次創作も既存作品を利用してるんだから、画像生成AIもOKだろ」って言う人もいるけど、これも的外れ。
二次創作は著作権者が黙認してる場合が多いし、公式が歓迎してることもある。
でも画像生成AIは、多くの著作権者が無断学習に反対してるし、許可を取らずに学習してる時点で問題。
タイトルの通りです。
日本では、
「トランプの狙いはコレコレではないか」などと議論されていることもあると思うけれど、トランプははっきり法治を覆そうとしている、と左右を問わずまともなアメリカメディア(Fox、News Max、ブライトバードなどを除く)ではみなされている。
政権担当者には、1984も真っ青な、「ニュースピーク」、「ダブルシンク」が求められているところであり、もしトランプ政権にまともな精神状態の共和党員がいたのであれば、病んでしまうのではないか。
ありとあらゆるところで、トランプ政権の無茶苦茶ぶりがあふれ出しているが、ここでは、デュープロセスなしでの国外追放についてのみに絞ってお伝えする。
一事が万事この調子なので、アメリカ在住のMAGAでない人には正気を保つのは難しい。
トランプは敵性外国人法Alien Enemies Act of 1798 の発動を宣言した。この法律は1798年に制定されたもので、外国から侵攻を受けた場合、宣戦布告を受けた場合に発動できることになっている。もともとはフランスとの戦争に備えたもの。戦時中に日本に対して発動されたが、その後の批判は誰もが知るところ(ダニエル・イノウエなど)。ただし、日本を対象にした場合は、まだ額面上の法律の要件は満たしていた。
トランプ政権は、強制送還(deportation)と言ってはいるが、別にエルサルバドル人ばかりではないので、強制送還という言葉は適切ではない。棄民とか追放(Exileとか)という言葉を使うべきだが、一番近いのはユダヤ人の強制収容(Concentration Camp)であろう。よってここでは追放で統一する。敵性外国人法は裁判手続きなしに、国外追放や身体拘束を可能にする法律ではあるが、宣戦布告を受けた場合、発した場合に限られると解されてきた。トランプはテロリストはアメリカに侵攻(Invade)していると主張しているので、適用できるのだ、と主張しているが、宣戦布告の権限は議会にあり、大統領にはないため、一般的に言えば、敵性外国人法が発動する権限は大統領にはない。
3月15日に拘束された一部の人たちの家族等から、「拘束の合法性」について疑義があるため、ワシントンの連邦地裁に差し止めの依頼がなされ、ワシントンの連邦地裁はこれを認め、国外追放を差し止めるように命令した。ICE(アメリカ移民・関税執行局)はじめトランプ政権は、追放の実施前に口頭でこの命令を受け取ったが、これを無視し、そのまま追放を実施したことが確認されている。いわく「文書での命令ではなかった」からだ。その後、文書でも命令も当然届いたが、その際はもう飛行機は出発していたため、引き返せない、との主張に変遷した。
もっとも大きな話題になっているのは、キルマー・アブレゴ・ガルシアだろう。「どうせ不法移民だろう」と思う向きもあると思うので少しだけ背景を書いておく。ほかにも、ゲイのメイキャップ、サッカー選手(レアルの入れ墨をしていた)、16歳の、ICE当局ですら、ギャングメンバーと思っていなかった子ら、幾人もこいつは違うでしょう、というのがいるが割愛する。
キルマーはエルサルバドル生まれ。母親のビジネスの関係で、MS13と対立するギャングから兄の生命を脅かされたため、家族はまず兄を、次いで2011年16歳のキルマーをアメリカに不法に入国させた。アメリカでは、入国の経緯にかかわらず、亡命申請(Asylum Claim)ができる。アクティブな亡命申請は通常入国後1年以内に行わねばならず、ディフェンシブな亡命申請は、「強制送還手続の中で」行うことができる。キルマーは、2019年3月まで、亡命申請を行っておらず、求職活動をしている際に逮捕され、「シカゴブルズのキャップをかぶっているため、MS13のメンバーである」との嫌疑をかけられた。その後の移民裁判の中で、MS13のメンバーとは認められないとされ、2019年6月に米国市民と結婚し、その直後に亡命申請をした。アクティブな亡命申請は期限切れのため、認められなかったが、移民裁判所は、キルマーに退去の保留を認め、キルマーは合法的にアメリカに滞在できるようになった。その後メリーランド州で鉄工として働きながら3人の子供を妻と暮らしていたが、3月12日、自閉症の5歳の子を連れているときに、ICEに拘束された(子供は10分以内に迎えに来ないと、児童養護施設に送る、と妻に連絡がきたとのこと)。キルマーには犯罪歴はなく、滞在は合法的なステータスであり、移民裁判所は、生命の脅威から保護するために、退去の保留を認めていたため、ICEの権限で、このステータスを変更することはできない(ICEは移民裁判において、控訴しなかったため)。キルマーの妻、ジェニファーは、即座に移民裁判所に、ステータスの確認を求め、移民裁判所は、国外退去の差し止めを命じたが、無視した。3月24日、ジェニファーと子供たちは、米国政府を訴え、帰国を実現するよう求めた。
メリーランド地裁との裁判の中で、政府は、「ICEは裁判所の命令を認識していたが、行政手続き上のミス(Administrative Error)で送還を実施してしまった」と認めた。地裁判事は、遅くとも4月7日までに帰国に向けた「取り組みを促進し、実現させる」ように政府に命じた。政府は、「すでに身体管理権は、エルサルバドルに移譲されており、米国政府は干渉できない」旨の主張をし、4月5日にこの件について控訴裁判所に控訴した。
4月7日控訴裁判所は、地裁判断を支持し、政府の控訴を棄却した。判事は、政府が拘禁のために支払う他の「契約施設」と同様に、政府はエルサルバドルからアブレゴ・ガルシアを含む被拘禁者を確保し、移送する権限を持っていると指摘し、政府の主張を却下した。同日、政府は最高裁に緊急上訴(最高裁は共和党が多数派でトランプ政権に可能な限り寄り添おうとしている)。
4月10日最高裁判所は、全会一致で、「米国は、アブレゴ・ガルシアがエルサルバドルへの彼の移送を禁じる保留命令の対象となっており、したがってエルサルバドルへの移送は違法であったことを認める」と事実認定をし、「政府に対して、アブレゴ・ガルシアのエルサルバドルでの拘留からの釈放を『促進』し、彼がエルサルバドルに不適切に送られなかった場合と同様に彼の事件が処理されることを保証するよう要求する」と命じた。すこし難しいが、ワシントン連邦地裁に対する4月7日意見書を合わせた考えると、最高裁の主張はおおむね以下の通りと思われる。「敵性外国人法を適用するかどうか、という点ではなく、逮捕、身体拘束が不当である、という主張であるのであれば、それは裁判所が拘束の停止を求めることではなく、ハビアス・コーパス((ハビアス・コーパスとは: 拘束されている人が、その拘束が法律に適合しているかどうかを裁判所に審査してもらうための申立ての制度のこと。原義は、ラテン語で、身体を差し出せ。アメリカ合衆国憲法第1条第9節では、「反乱や国家の安全のため必要とされる場合を除き、ハビアス・コーパスの権利を停止してはならない」と定められている))の範疇として、異議申し立てを受けるべきものである、その場所は拘束された場所=メリーランドであるべきであり、エルサルバドルに不適切に送られていたとしても同様に処理する必要がある」と言っている。敵性外国人法の要件に踏み込まず、実現させる手段は外交であり、地裁の権限を超えており、適切ではないとして削除した。これはかなりトランプ政権に寄り添いつつ、ギリギリ、法的正当性を担保しようという苦しい命令ではある。とにかく、地裁に一部差し戻され、地裁判事は、促進の状況について、毎日情報をアップデートするように命じた。ちなみに、トランプ政権は数日目から、促進状況に変更はない、とだけつ、たえている。
当初トランプ政権は、「裁判所の命令には従うが、もはや米国はキルマーの身体管理権をもっていないのでどうしようもない」という主張をしており、最高裁の命令には従う、尊敬しているから、というような発言をした。(("If the Supreme Court said bring somebody back I would do that. I respect the Supreme Court." "Well, I'm not talking about the lower court. I have great respect for the Supreme Court."))4月11日ごろから、主張が変遷する。関税プランを立てたといわれるスティーブ・ミラーは、「アブレゴ・ガルシアは、MS13のメンバーであり、誤って送還されたわけではない。適切な場所にいるのだ。」というような主張をし、このような主張は「9-0で最高裁で支持された」と主張しだした。増田は当初何をいっているんだ、と思ったが、どうやら、実現せよ、との文言がないこと、追放自体がダメだ、と言っているわけではなく、追放した者にも、ハビアス・コーパスによって異議申し立ての権利があるという点のみを切り取っているらしいとなんとか理解できた。実際には9-0で負けているし、事実認定として、キルマーは保護されている、ため、移送は違法であったと認められている。
しかしミラーを皮切りに、レヴィット報道官、ポンディ司法長官、ノーム国土安全保障長官、バンス副大統領などが、同様の主張をし始めたのをみて空恐ろしくなってきた。彼らの中では、ダブルシンクがすみ、キルマーはMS13のメンバーであり、強制送還は適切、この主張は最高裁でも認められた、と整理されてきたのだ。
レヴィットは証拠を求められても、「あいつらはテロリストで、私はその証拠を今朝見た、トランプは米国民を守った」、「まるでファーザーオブザイヤーのような扱いをしているが、アブレゴ・ガルシアは、MS13のメンバーでテロリストだ」というようなことしか言わず、しまいには「もう質問はないみたいだね」と言って会見を打ち切る、などの行動をとるようになった。
バンスは「アブレゴ・ガルシアはテロリストとして有罪判決を受けた」と虚偽を堂々と述べた。
ポンディは「これがアブレゴ・ガルシアに関する証拠です」といって、誤って「犯罪歴なし」、と書かれた資料をアップロードし、失笑を買ったのち、最初の移民裁判で、シカゴブルズのキャップを被った、明らかなラテン系ギャングである、という、別件の汚職で逮捕された警察官の主張が書かれた調書を公開した。
トランプは「以前最高裁の命令には従う、と言っていたのに、なぜアブレゴ・ガルシアのような例で帰国させようとしないのか」という質問をしたCNNに対して「なぜおまえらは、「テロリストを国外へ追放して、素晴らしいことになった」と言わないのだ。だからおまえらの放送は誰も見ていないんだ」と記者をあざけった。またFoxのインタビューの中で、「最高裁は9-0で強制送還の件は支持し、我々は(精神的)勝利したんだ、ニュース番組を見ていると知らないと思うけど」というような発言をしていた。
トランプはエルサルバドルのブケレ大統領と面談した際、カメラが回っていると気づかず、「次はホームグロウンの番だ。建物が足りないな、あと5つぐらいはつくってほしい」と述べている。また、「重大な犯罪者であれば、エルサルバドルに米国人を送ることは大賛成だ」とも述べている。対テロの大統領補佐官である、セバスティアン・ゴルカは、「誰であれ、キルマー・アブレゴ・ガルシアを擁護しようとするものは、テロリストであり、訴追される」と述べた。
民主党の上院議員、ヴァン・ホレンがキルマーに面会でき、キルマーの件単独では、ひょっとしたら解決が見えるかもしれないが、正直、トランプ政権の終わり方は、日本人が想像しているよりはるか遠くまで行っていることは知っておいてほしい。
自称インテリ語録は自分用コーパスの作成のために行っています。
意図は、箴言における「嘲る者(自分を賢いとみなし、他者を見下す傲慢な人)」を機械学習で見分けるモデルの作成です。
厳密なアノテーション基準はありませんが、アノテータがある程度の裁量で判断します。
「著作権侵害では?」と思われるかもしれませんが、差別は社会的に相応しくないため、コーパス作成は公益性があると判断し、また創作性のないものに絞っており、自己責任でやっております。
元々は自分の「自称インテリ」の概念の精密化のために行っておりましたが、Bing AIによって様々な分析をさせることが可能であることがわかったため、自然言語資源を作るという目標に変わりました。
論旨
無断で数千人の声優を学習したというのは、恐らくMoeGoeのことを指していると思われますが、アクセントも不安定で「演技泥棒」には程遠いです。
最新のモデルをもってしてもアニメの演技のような抑揚の大きい音声を学習させることは難しいことであって、実用レベルに押し上げるようなブレイクスルーもまだ起きていないのが現状です。
音声合成の学習には、データセットとして音声とそれに対応する文章を合わせた音声コーパスと呼ばれるものを用います。
演技というものは台本でいうところのト書きであって、文章に直接的に含まれている情報ではないことからも、文章から生成する音声に演技を付与させることの難しさが理解できると思います。
文章と音声があれば、即座にデータセットとして使えるかと言えばそうではありません。
文章で想定している(文章を構文解析することによって得られる)読み方と、音声における実際の発音が異なる場合があります。
音声合成は結局のところ文章の音素と音声を対応付けているだけなので、音声コーパスの文章と実際の音声に乖離がある場合には学習の精度が下がる恐れがあります。
加えて、現在の音声合成ではアクセントなどの情報を用いることが多いですが、アクセント辞書から得られた情報と実際のアクセントが異なる場合も演技音声では散見されるでしょう。
上に述べた抑揚の問題や、音声にBGMなどのノイズが混ざっている場合など、音声自体がデータに適さない場合もあるため、それらの選別も必要です。
音声合成用に収録された音声コーパスであれば、読み方やアクセント、ノイズ等に細心の注意を払って録音されていますが、一般の音声は必ずしもそうではないのです。
このような読み方やアクセント等の修正は、残念ながら人力に頼らざるを得ません。そもそも台本がない場合は一から書き起こす必要があります。
AIイラストの成功には、イラストへの人力でのタグ付けが寄与していることはよく知られていますが、果たしてAI音声という分野において人力による音声コーパスの整備が進むでしょうか?
AI音声合成ソフトの代表例とも言えるVOICEVOXはいまや多くの人気を集めており、多くのキャラクターが参加しています。
また、COEIROINKのように音声コーパスを用意することで自らの声を学習させた機械学習モデルを共有できるような音声合成ソフトも登場しています。
AIイラスト界隈における絵師との軋轢が援用されていますが、音声合成の分野においては多くの場合、データの提供者たる声優と相互理解のある関係を保ちつつ発展してきたことを強調しておきます。
もともとナレーションの分野においては、既に十分な品質の音声合成ソフトが存在します。
AIイラストと異なり、倫理的問題のある音声合成に手を出す動機付けが乏しいことが現時点において関心が集まらない要因となっています。
そもそもASMRには、バイノーラルという特色があるわけで、AIが生成したモノラル音声がAIイラストほどの脚光を浴びるとは考えづらいです。