年末も押し迫り、年内にやり終えるべき仕事も仕舞わなければ、机の上に積み上げた資料の片づけもしなきゃと思う、今日この頃です。
さて、本題です。
最近、「必要」だから、というより「方針」としてサイトの多言語化案件が増加してきているように思います。
2020年のオリンピックに向けて、もしくは開催決定を1つのキッカケとして、Webサイトの再整備をしようとする社会の動きなのかも知れません。
多言語化を推進する目的や動機はともかく、多言語で発信した情報が読まれて、ユーザーにとっても発信者にとってもその目的が果たせれば、大変結構なことかと思います。
多言語サイトでコンテンツを例えばexample.jp/en/のように言語ごとにルート配下でディレクトリ分けしたり、/?language=enのようにクエリで区分したりしているのをよく見かけます。
中にはURLを替えずに、同一URLのまま表示言語を切り替えるオシャレなサイトもありますし、言語ごとにドメイン(もしくはサブドメイン)を独立させてしまっているサイトもあります。
しかし、大多数はディレクトリで分けているかクエリで言語区分を分けていると思います。
書きたかったのは、そこで使われているコードについて、です。
ざっと多言語サイトを見ていくと、言語の数は日本語、英語の2言語に、韓国語、簡体字の計4言語、もしくは繁体字を加えた5言語ほどのサイトが多いのですが、そこでよく見かけるコードは下記。
言語 | 言語コード | 国コード | その他 |
---|---|---|---|
日本語 | ja | jp | japanese など |
英語 | en | – | englishなど |
韓国語 | ko | kr | – |
簡体字 | zh-CN(cn) | cn(※1) | sc (Simplified Chineseから) |
繁体字 | zh-TW(tw) | (※2) | tc (Traditional Chineseから)、zh-HKなど |
※1:簡体字は中国以外にもシンガポール、マレーシアで使用
※2:繁体字は台湾、香港、マカオで使用
英語のENは言語コードなのに、日本語は国コード(JP)、韓国語(朝鮮語)も国コードのKRを使っているパターンを多く見かけます。
これは日本のサイトに限らず、世界的に日本語はJPとしているところが多いようです。
話が脱線しますが、過去に韓国の気象庁がJAPという省略を使って日本語ページを公開していました。
http://web.kma.go.kr/jap/
公的な機関ともあろうサイトがJAでもJPでもJPN(日本国の3レターコード)でもなくJAPを使ったのは、うっかりというより確信犯のような気もしますが、日本のネット民の騒ぎを知ったのか、現在ではJPNに修正されています。
さて、ややこしいというか、選択肢として悩むのは簡体字と繁体字です。
簡体字であれば「ZH-CN」もしくは略して「CN」、もしくはSimplified Chineseから略して「SC」などがありますし、繁体字であれば「ZH-TW」もしくは略して「TW」、もしくはTraditional Chineseから略した「TC」といったところです。
簡体字のCN、繁体字のTWは、中華人民共和国の国コード(CN)と台湾の国コード(TW)から由来というより、単にZH-を省いたと見るべきかと思います。
繁体字には香港系というところで香港でも営業している外資系のホテルサイトでzh-TWではなく「zh-HK」を使っているところがありましたが、私が見た限りではレアケースのようです。
そうやって眺めていくと、特に日本語と韓国語ですが、いかに国コードと言語コードを混在して使っているサイトが多いことか!
逆に、言語コードに統一して使用していたサイトは、探すのが結構大変でした。
例えば下記。
http://100tokyo.jp/
80言語以上に対応していた「100 Tokyo」(言語選択の記述ソースから)や、GoogleやYoutube、日本航空などはhttps://www.jal.com/日本語(JA)、英語(EN)、韓国語(KO)、簡体字(zh-CN)、繁体字(zh-TW)と、言語コードを使用していました。
ただ、GoogleやYoutube、JALなどは、言語選択とリージョン選択(どこのエリア情報を出すか)があるので、言語は言語コード、リージョンは国コードと厳密に分けているのだろうと思います。
そんな「どの言語」で「どこの情報」を出すか、という必要があるサイトでなければ、言語と国のコードが混在しても問題ないでしょう。
区分けとしたら、日本語を母国語にしているのは日本だけなので、言語(JA)でも国(JP)でも確かに影響はないです。
韓国語(朝鮮語)も国境があるのは大韓民国(KR)だけなので、これも特段影響はないでしょう。
でも、個人的にはちょっとキモチワルイです。
意味があって国コードにした、というサイトも当然少なくないはずなので、どうしてそうしたのか、(私のほんの小さなモヤモヤを解決するために)ご存知の方がおられたら教えていただけると幸いです。