JPNIC Blog JPNIC

News & Views コラム:デジタル時代の日本語表記に向けて – 日本語組版処理の要件(JLReq)の現場から

pr_team 

メールマガジンで配信したインターネットに関するコラムを、このブログでもご紹介しています。2021年7月は、国際標準化関連の活動で活躍なさっている慶應義塾大学/W3Cの下農淳司さんに、デジタル時代における日本語組版処理の要件に関する取り組みについてお書きいただきました。Webや電子書籍で当たり前のように用いている日本語表記が、どのような活動によって成り立っているのかを垣間見ることができます。

 


Webや電子書籍で使われるHTMLとCSSですが、2019年に縦書きがCSS仕様(*1)として勧告化される(*2)など、活発に開発が続いています。World Wide Web Consortium (W3C)では、国際化活動(*3)の中で多種の言語の要求を実現するために、組版処理の要件のとりまとめ(*4)や齟齬解析(*5)などを通じてCSSとの議論を行っていますが、日本語についてもまだまだやることが数多くある状況です。リフロー前提の電子表示では、ルビ処理や行長処理などにおける職人技の経験則を、規則へ明確な形で入れる必要があります。また、歴史の長いプロトコルを想像していただければ似たような状況かとは思いますが、日本語組版においても活版印刷以降の全角を基準とする組版の歴史の中で、活版や手動・電算写植時代の技術的制約からくる要件などもあり、完全デジタルでのWeb時代には不要と思われる制約も存在します。

例えば、最近オープンデータの中で話題になった1文字の数字は全角で、2文字以上は半角で並べるという謎に見える規則は、活版の時代に全角何文字で構成される行で行末を揃えるために簡単な方法として採用された方法が生き残っているものです。そして、Web上も含めよく議論になる、全角文字と欧文文字の間の半角空白を入れるかどうかという論戦について、読みやすさの観点での調査では六分アキ程度が望まれるものの、活版印刷の時代は最小の活字で四分だったので四分が使われ、電子処理になって文字コードでは半角・全角しかない中で半角が挿入されるようになった、などがあります(後者に対してはCSSで自動アキ調整を行うための処理を議論中です)。

今の流行りのDXの議論にも通じるものではありますが、Webや電子書籍という自由に細かく処理可能になった中で、本来実現すべき本当に読みやすい組版に対し、JIS X 4051 (*6)などの紙時代における歴史的な技術的制約による妥協の産物も混じった組版要件が、本当にユーザーを向いた望ましいものであるのか。また、ディスレクシア(文字情報の処理に困難さを持つ症状)の方々を含めたアクセシビリティーの確保や、デジタルでの新しい可能性の追求など、理想に近づいていくためにはまだまだ調査・議論が必要なところです。

まだ端緒についたところではありながら、何を実現すべきかというところの議論から実際のCSSなどの仕様やブラウザ実装への流れへ向けて、着実に一歩一歩進んでいけば、と思っています。

(*1) https://www.w3.org/TR/2019/REC-css-writing-modes-3-20191210/
(*2) https://www.w3.org/2019/12/pressrelease-css-writing-modes-rec.html.ja
(*3) https://www.w3.org/International/
(*4) https://www.w3.org/TR/jlreq/
(*5) https://www.w3.org/TR/jpan-gap/
(*6) https://www.jisc.go.jp/app/jis/general/GnrJISNumberNameSearchList?show&jisStdNo=X4051

 


■筆者略歴

下農 淳司(しもの あつし)

2010年京都大学理学研究科博士課程修了。2018年10月まで東京大学カブリ数物連携宇宙研究機構特任研究員。2018年11月より慶應義塾大学大学院政策・メディア研究科特任講師、W3C/Keio Team Staffとして活動。