この画像を大きなサイズで見る対話型AIが最も得意とする言語は何か。多くの人は英語や中国語を思い浮かべるかもしれない。実際にインターネット上ではこの2つの言語の情報が多く、ChatGPTやGoogleのGeminiなど、主要なAIモデルの性能を支えているのもこれらの言語だ。
しかし、2025年に発表された26言語を調査した国際研究によると、最もAIが理解しやすい言語は英語でも中国語でもなかった。
トップに立ったのは、意外にもポーランド語で、英語は6位、中国語は21位にとどまった。言語の構造がAIの理解力に大きく影響していたのだ。
ちなみに日本語は15位という結果だった。では詳しく見ていこう。
26言語でAIの理解度を比較
アメリカのメリーランド大学、マイクロソフト、マサチューセッツ大学アマースト校の研究チームは、対話型AIがどの言語を最も理解しやすいのかを調べるために、「ワンルーラー」と呼ばれる新しい評価テスト(ベンチマーク)を使って26言語の比較を行った。
ワンルーラーでは、AIに十万語規模の文章を読み込ませ、その中に埋め込まれた情報を探させたり、複数の記述をまとめて答えを導かせたりする課題が出される。
文章を読むだけでなく、長い文脈を保持する力、必要な部分を抜き出す力、指示文の意図を正しく読み取る力、そして文全体から結論を導く推論力など、複数の能力が同時に試されるように設計されている。
たとえば「干し草の中の針探し(Needle in a Haystack)」というテストでは、数万語にも及ぶ長文の中にわずかに書かれた答えを探し出す必要があり、情報検索力と推論力の双方が求められる負荷の高い課題として知られている。
今回の比較では、アメリカ企業のOpenAIのChatGPT、GoogleのGemini、MetaのLlama、そして中国企業のAlibabaが開発するQwenの4つの主要モデルが同じ条件でテストされた。
複数企業のAIが横並びで比較されたことで、言語ごとの理解度の違いがより明確に示されることになった。
この画像を大きなサイズで見るポーランド語が1位に、英語と中国語が予想外の順位
今回の結果で最も意外だったのは、ポーランド語が平均88%と、AIにとって最も理解しやすい言語として首位に立った点である。ポーランド語はスラヴ語に分類されるが、英語やフランス語と同じアルファベット(A・B・Cの文字)を使って書かれている。
研究チームは、文法的な規則性の高さを理由の一つとして挙げている。語尾の変化によって文中の関係が明確に示されるため、長い文脈の中でも意味のつながりを見失いにくいとされる。
さらに、ポーランド語の学習データは量こそ多くないものの、内容が比較的整っており、誤字や崩れた文章が少ない傾向があるという。AIにとっては学習データの量だけでなく、文の一貫性や品質が理解度に影響する可能性が示唆された。
一方で英語は曖昧な表現が多いことや、同じ綴りで異なる意味を持つ語が多いことが、長文処理において不利に働いたとみられている。中国語は単語の区切りを示す空白がなく、文字そのものに複数の意味が含まれているため、AIが文を区切って処理する段階で誤差が蓄積しやすい構造を持つ。
学習データが豊富であるにもかかわらず、英語が6位、中国語が21位にとどまった背景には、こうした言語構造の違いが影響したと考えられる。
この画像を大きなサイズで見る日本は15位、その他の言語のランキング
今回のテストでは、ポーランド語が1位となったほか、続いてロシア語、フランス語、イタリア語、スペイン語が上位を占めた。
これらの言語はいずれもアルファベットを使用し、文法的な規則性が比較的明確である点が共通している。
一方、日本語は26言語中15位という結果だった。
日本語は漢字・ひらがな・カタカナの三種類の文字を併用し、単語の境界が明確でないという特徴を持つ。AIが文章を読み取る際には文を細かく区切る「トークン化」と呼ばれる工程が必要だが、日本語ではこの区切りが難しく、処理の段階で誤差が生じやすいとされる。
語順が柔軟で、主語や目的語が省略されることも多いため、文脈を把握するには前後の関係をより慎重に追う必要がある。
こうした構造的な特徴が、日本語の理解度に影響した可能性がある。
以下は、研究チームが発表した26言語の理解度ランキングである。
言語別AIの読解精度ランキング(※64K・128K平均)26言語対象
1位 ポーランド語 (88%で最高精度)
2位 ロシア語
3位 フランス語
4位 イタリア語
5位 スペイン語
6位 英語 (世界最大の学習データ量)
7位 ウクライナ語
8位 スウェーデン語
9位 ポルトガル語
10位 ドイツ語
11位 ノルウェー語
12位 オランダ語
13位 ハンガリー語
14位 デンマーク語
15位 日本語
16位 チェコ語
17位 ベトナム語
18位 フィンランド語
19位 ペルシア語
20位 セルビア語
21位 中国語 (データ量は多いが低精度 )
22位 韓国語
23位 スワヒリ語 (東アフリカで使われる言語)
24位 タミル語 (南インドおよびスリランカで使われる言語)
25位 セソト語 (南部アフリカで使われる言語)
26位 ヒンディー語(インドの主要言語)
※「64K」「128K」は、AIが一度に読み込む文章量を示す数字で、それぞれ約6万字分と12万字分の長文に相当する。今回のテストでは、この長さの文脈をどれだけ正確に理解できるかが比較された。
この研究成果は『One ruler to measure them all: Benchmarking multilingual long-context language models(arXiv:2503.01996)』(2025年9月30日付)に事前公開された。
追記(2025/11/15) タイトルの「以外」を「意外」に変更して再送します。
References: Arxiv / Polish May Be the Most Effective Language to Prompt AI, According to New Study















英語がトップじゃないってすごく意外です。 エスペラントはどうだろうとか思ったり。
言語学者じゃないけど…… 日本語って同音異義語が多いんですよね。 その代わり漢字で意味を特定しやすいです。 単語の切れ目の問題は「ぎなた読み」とかで日本でもわりと知られている話だし、是正というか改善する見込みもないので今後も変わらないでしょうね。 でも、漢字とひらがなとカタカナという三種の文字のおかげで、これは名詞または何かの省略形(漢字)、これは外来語またはオノマトペ(カタカナ)など日本語を言語学的に学んでない私でさえわかるくらい良いところが多いと思ってます。 特に数字や一部の記号(!や?等)を除く表意文字って漢字くらいしか残ってなくない?とも思ってます。 韓国の人は漢字嫌いなようなのですが、きっと漢字+ハングル(と可能ならカタカナに相当するハングル)があればすごく便利なのになとも思います
1980年代初頭まで、ハングルは漢字交じりでした。
かの国ではそれを日帝残滓の一部として、捨てたのです。
一部で復活させようとする動きもあるようですが、まぁ、無理でしょうね
頭が赤い魚を食べる猫←これも混乱するだろうなあ
語順が自由なせいでどれが主語でどれがどれを修飾してるのかは文脈依存
ヒンディー語って難しいんだな
日本語が15位ってのは意外と高い順位だと思ったけど、下位はそもそも学習サンプルが少ないんじゃないかという言語が多いからこのぐらいの順位になるのかな。
中国語は漢詩とか読むと、レ点や返り点が無いと文章構造が分かりにくいと感じる。現代中国語も同じようなものなのだろうか。
あと漢字の種類の多さと常用漢字に似ていながら意味が違う字に惑わされるけど、これはAIには関係ないか。
中国語は確かに、
・過去形・現在形・未来形の時制がなく、どれも同じ形。
それでも現代中国語はまだ「了」を付ける完了形(過去とは限らない)とかはあるが、
基本的に前後の文脈や、いつの話かを示す副詞などから判断するしかない。
ニュース等の時系列では注意が必要。
・「動詞+名詞」の2語が、「述語+目的語」なのか「修飾語+体言」なのか判然としない。
例えば「炒飯」は、「飯を炒める」という行為にも、「チャーハン」という料理名にも使える。
・日本人だと漢字を見ながら何となく流し読みで大体の意味は拾えなくもないが、
たまに突如として全く意味不明な文字列の塊に出くわすことがある。
何かと思えば、たいてい外国語の単語や人名・地名の音訳。
なまじ表意文字なだけに、単なる借音でも 字面から意味を見出そうとしてしまいトツボに嵌まる。
あたりが独特だなと感じる。
へー 時制がないんだ?母国語外国言語の人はニュースになれるの大変そう
日本語も、過去形⇔非過去形(現在・未来)だけで
英語のテストだと未来形を「私は明日~~するだろう」「明日~~する予定です」みたいに自然な会話ではわざわざしないような持って回った“未来形だと理解しています”アピールの書き方にしたり(普通の日本語会話では「明日~~する」で事足りる)、
過去形と完了形が同じ形で区別が不明瞭だったりする(どちらも「~~た」)。
補足。
完了形も、英語テストや古文の現代語訳だと殊更「~~してしまった」と書くことがあるが、
それが表す日本語の意味は通常、完了ではなく「後悔」。
意外と最下位付近じゃないのね
エスペラント語読み込ませたら理解度どんなもんになるんだろうか
ポーランド語は意外だけどそれ以外はAIでもそんな感じなんだ?
ロシアは高校生からプログラミングというかハッキング教えてるっぽいけど
言語的な相性も良かったのね
AIと仲良くするためにポーランド語を学ぼう
ロシア語2位なんだ。
あんま知らんから想像だけで「ダヴァイ」ってどうやって理解したら良いのかもわからん言葉なのかもしれないな〜くらいに思ってた。
印欧祖語と関係あるのかと思ったけどアラブの方はあんまりないし、ポーランド露ウクライナあたりからヨーロッパにかけてが上位なんだね
恐らく寒いからカロリー節約があるんだと思う
あまり口を開かないでいいように、なるべく短く簡潔に
体温維持を最優先でって結果があるのかもしれない
アフリカのほうは子音が多いんだったっけ、表現の豊かさに割り振ったままでも
済んでるんだと思う
その理屈で行くと日本語でも東北弁の方がAIに向いてるってことになるな?
ラテン語やギリシャ語、古北欧語などについても知りたかった
ヒエログリフとかは簡単なのかなぁ
エスペラント開発者のザメンホフはポーランド人では?と思って検索したら正解だった。
AIと(日本語入力で)質問や検索やりとりする時は句読点をやたらと入れとく癖がついてきてる。主語もおなじような意味の別表現もいちいちくりかえしてでも何度も入れる。
拘束するつもりで拘束されてる。
学習させる前提でつくる資料は長文化やヒトにとっては省略されなさすぎて読みにくいものに変化していくのだろか。AIの進化・変化とヒト側言語の変化・対応とどっちがはやいかな。
>ポーランド語の学習データは量こそ多くないものの内容が比較的整っており、誤字や崩れた文章が少ない傾向 ~~AIにとっては学習データの量だけでなく、文の一貫性や品質が理解度に影響する可能性が示唆され…
各言語の学習データの質と量を揃えないと
データが複雑で多岐にわたる…データが膨大で煩雑ならやっぱ解りづらそう
AIは行間読むのも苦手だろうし たぶん文学より論文の方が理解し易い みたいな
最近の若者は逆ポーランド記法って知らないのかな
ググったらプログラミングには良いらしいけど
算数苦手な自分には余計にこんがらがったわ
そして、Mind (プログラミング言語)で
縛りのある日本語文章も壊滅的であることが判明してしまうわけだ
「言語の違い」なんて人がAIに抱く一番脆い幻想なんだろうな
だって情報の集積がプロなんだもの あの人ら
挨拶の途中で咳をしちゃったかな?くらいの違和感しか感じていないと思うよ
キリル文字とラテン文字があるがやっぱアルファベット文字使ってる国がやっぱ上位だね
非アルファベット圏じゃ日本語がトップかな?
AIの日本語理解時の弱点は想像通りだけど
AIにとって日本語の理解しやすい点とかが逆に知りたいな
なるほど。。。
フランス語は
他言語の人からしてみれば、数字を表す言葉も変な計算しなきゃいけないけど、
そういう前提はなしに単語として扱う訳でコンピューターとしての処理は簡単になるんやな
中国語って語順が英語と似てるって聞くけど、AIの読解力だと下の方なんだ?
AIに聞くばっかりでユーザーが訂正とかしてAIに学習させたりしないのかしら?
パッとおもいつくので北京、広東、台湾と、文字や発音まで別言語、一括りに学習できんと思う
あのレベルで最下位じゃないんだ。今のところ、音読みになったり訓読みになったりする漢字の読み方が完璧になる日が来るとは思えないんだけど。
清国の公用語である満州語は言語学的にはツングース諸語に分類される膠着語
公文書は満州語かペルシャ語
今の中国はゲルマン語ベースの文法に、明治時代の日本から単語や語用を大量に輸入して、更に簡体字を導入してる
日本語は古語グループの言語なんで、ゲルマンに古語日本が混じって簡体字が参戦したチャンポンミックス新語というカオスな言語
アラビア語が入ってないのはなぜ?
世界の話者数ランキングでは5位(日本語は11位)なので当然調査されるべきだと思うのだが。
タイトルにある「以外」は「意外」の変換ミスだよね?