JPNIC Blog JPNIC

完成間近:日本語ルートゾーンラベル生成ルール(LGR)提案書ドラフトまでの道のり

dom_gov_team 

●はじめに

10月に開催された第69回ICANN会議(バーチャル年次総会)に対する第59回ICANN報告会が、2020年12月3日に開催されました。ここではICANN会議からの報告とともに、株式会社日本レジストリサービス(JPRS)の堀田博文氏から「Root Zone LGRおよび日本語生成パネル(JGP)について」というタイトルで発表がありました。これは、2015年の発足以来日本語生成パネル(Japanese Generation Panel, JGP)で取り組んでいた、国際化ドメイン名(Internationalized Domain Name, IDN)の日本語に関するルートゾーンラベル生成ルール(Label Generation Rules, LGR)の検討が最終段階に至り、提案書ドラフトが公開されたため、LGR検討の背景・経過とドラフトの紹介をするという内容でした。

本稿は、この発表をご紹介することで、日本語ルートゾーンLGRに関して皆さんに知っていただくことを目的としていますが、既に公開されている堀田氏の発表資料と、日本語生成パネルによる日本語LGR提案書ドラフトの概要版が、経緯と提案内容を簡潔にまとめてあり、とても分かりやすいので、ぜひともご一読いたきたいと思います。ここでは、これらの内容を、さらにかいつまんでご説明するに留めます。

●ルートゾーンLGRと生成パネル

ルートゾーンLGR(ラベル生成ルール)とは、ルートゾーンに適用される、つまりトップレベルドメイン名(TLD)ドメイン名を形成するラベル(文字列)を規定するルールです。新たなgTLDの2012年募集から、IDNの文字列もTLDとして新設することができるようになりました。これによってさまざまな言語、さまざまな文字種のラベルがTLD文字列となり得るため、各言語・文字種ごとのLGRと、全文字種を含むTLD空間全体を規定するLGRが必要となりました。ICANNでは各言語のLGRの規定は、その言語のコミュニティに委ねる方針をとり、言語・文字種ごとに、その言語コミュニティの専門家によってLGRの生成パネル(Generation Panel, GP)を組成することになりました。日本語については、レジストリ/レジストラ関係者やDNS/IDNといった技術、言語、ポリシー策定などに関する専門家、知財関係など各コミュニティを代表するメンバーからなる日本語生成パネル(JGP)が2014年に発足し、日本語ルートゾーンLGRの検討を進めてきました。JGPは、その活動に関する情報提供のためにWebサイトを開設しています。JPNICは、事務局機能をJPRSと分担するとともに、前村昌紀がパネルメンバーとして参画しています。ICANNではこういった各言語・文字種ごとのGPの他に、それらGPで検討された各言語・文字種に関するLGRを統合してTLD空間全体に適用されるLGRである、ルートゾーンLGRの設計を統括する、統合パネル(Integration Panel, IP)が設けられています。

●検討の焦点

日本語ルートLGRを検討する上での議論の焦点は、三つほどありました。中国語、韓国語との共用を踏まえた異体字の定義、異体字ラベルの削減、視覚的類似ラベルの抑制です。

1点目は異体字の扱いに関して、ccTLDであるJPドメイン名に導入されている、日本語JPドメイン名の第2、第3レベルの文字列規則には異体字の定義はなく、例えば「広」と「廣」などは別の文字として扱われています。一方、同じく漢字を利用する中国語については、ccTLDである.cnや.twでは「广」や「廣」、「広」などは異体字として定義され、同じ文字として扱われます。今回のルートゾーンLGRでは、異体字を特に必要としない日本語に対して、中国語、韓国語ではルートゾーンLGRでも異体字を定義する方向にありました。TLDには複数の言語が乗り入れるため、中国語や韓国語で異体字である文字は、日本語でも異体字としなければ混乱の元になると考えられます。そこで、日本語LGRでは、中国語LGR、韓国語LGRで異体字とされるものは、異体字として受け入れることにしました。この中には「機」と「机」、「葉」や「叶」のように、日本語では別の意味を持つにもかかわらず、中国語では繁体・簡体の関係にある異体字といったものも含まれます。

2点目は、異体字ラベルの削減です。異体字を設けると、異体字を持つ文字複数からなるラベルには、組み合わせの数だけ異体字ラベルが発生するということになりますが、利用者の混乱の元になります。これに対して提案書ドラフトは、申請されたラベル自体と、これを常用漢字に置き換えた異体字ラベルのみを使用可能として、それ以外の使用を禁止することで、異体字ラベルの削減を図りました。

3点目の視覚的類似ラベルの抑制は、もともとJGPが取り組んでいた「同じ意味で異なる形」の異体字に加えて、ICANNからの要請に基づいて、「異なる意味だが視覚的に極めて似通った」文字も異体字として定義する方針を受け入れ、Unicode consortiumConfusable Characters List(錯視が起こりやすい文字のリスト)から、認知実験を経て10組の文字を異体字として定義しました。

この3点のうち、特に3言語での共用に掛かる調整と認知実験の実施に特に時間を要したのが、日本語ルートゾーンLGRの検討に6年間もの時間が掛かっている要因です。

●今後

日本語ルートゾーンLGR提案書のドラフトは、2020年10月15日にICANNの統合パネル(IP)に提示されるとともに、JGP Webサイトで公開されました。ICANN報告会でも報告されたように、IPからも新たな検討項目が提示されるなど、今後は提案書の詰めの作業が進んでいきます。意見も募集されていますので、ご関心のある方は提案書ドラフトをご覧いただき、お気づきの点があれば日本語生成パネル事務局までぜひお知らせください。

 

●参考資料

第59回ICANN報告会発表資料:JPRS堀田氏「Root Zone LGRおよび日本語生成パネル(JGP)について」
https://www.nic.ad.jp/ja/materials/icann-report/20201203-ICANN/icann59-6-hotta.pdf

日本語生成パネル:日本語LGR提案書ドラフト(v0.15)をICANN関係者に提示
https://j-gp.jp/topics/20201015-01

日本語生成パネル:日本語LGR提案書(v0.15)の概要
https://j-gp.jp/日本語LGR提案書ドラフト(v0.15)の概要

日本語生成パネル:日本語LGR提案書(v0.15)
https://j-gp.jp/日本語LGR提案書

JPNIC:ICANNが新gTLD日本語ラベルのルールを検討するグループ「日本語生成パネル(JGP)」の設立を承認
https://www.nic.ad.jp/ja/topics/2015/20150318-02.html

JPNICインターネット用語1分解説:ルートゾーンLGRとは
https://www.nic.ad.jp/ja/basics/terms/rootzone-lgr.html

JPNICニュースレターNo.61/2015年11月発行:日本語生成パネル(JGP)のご紹介
https://www.nic.ad.jp/ja/newsletter/No61/0520.html