« 郵便不正事件・障害者団体元会長の控訴審が結審 | トップページ | やっぱり出来ない、こども園への統合 »

2011.01.21

日本字のコードを増やすのだそうだ

朝日新聞より「日本IT界の鬼っ子「外字問題」解消を 経産省が着手

2011年1月21日8時45分

「外字(がいじ)」。コンピューターで使う漢字として日本工業規格(JIS)が定めた約1万字に含まれない、規格外の文字たち。

文字化けや正常なデータ通信ができない原因になり、IT業界にとって悩ましい、この「外字問題」を一気に解消しようというプロジェクトが始まった。パソコンで文章を書くときの使い勝手は大きく変わるのか――。

例えば「渡辺」の「辺」。
JIS規格には「邊」「邉」をあわせた3文字しか含まれないが、100字近い異体字があるとされる。

約58万人分の戸籍を扱う東京都足立区。区役所のパソコン画面には49もの「辺」の異体字が現れた。戸籍などを管理するコンピューターシステムに区が登録したものだ。名前に未登録の漢字がある住民が転入するたびに増え、今では外字全体で約5千もある。

外字を作るのは区職員。パソコンで、1文字に30分ほどかけて点描する。完成後は庁内や出先機関にある千数百台のパソコンに登録する。

さらにややこしいことに、新たに作った一つの漢字を外字登録する際、区が割り当てる文字コード番号はコンピューターシステムごとに異なる。メーカーが違うことなどが理由で、例えば住民基本台帳システムの個人情報を国民健康保険のシステムにそのまま転送しても同一人物とは認識されない。

このため、区はコンピューターがデータをやりとりする際に文字コードを変換するシステムを約1億8千万円かけて導入した。

足立区戸籍住民課の初鹿野(はじかの)学課長は

「どの自治体にもある問題。膨大なコストがかかるが、システムが変われば作り直し。無駄でしかない」。
こうした問題は企業でも同じだ。異体字を正字に直して登録するケースもあるが、金融機関などでは、公的書類と照合する本人確認の妨げになるとして対応が分かれる。

プロジェクトを進めるのは経済産業省と大手IT企業。民間側の協議会は昨年12月6日に発足し、コンピューターで日本語を扱うのに不可欠なソフトを作っているマイクロソフト、ジャストシステムなど9社・団体が加わった。マイクロソフトの加治佐俊一CTO(最高技術責任者)は「外字問題という、世界でも例のない日本固有の問題が解決に向かう」と語る。

経産省が動いたのは、官民ともにインターネットによる電子的な手続きの導入が進むなか、正しい人名表記を扱う必要に迫られると考えたためだ。

法務省が幅広い電子化を目指して04年にまとめた「戸籍統一文字」(5万6040字)をもとに5万8713字のデータベースを作る。

世界共通の文字コード体系「ユニコード」に反映させ、あらゆるコンピューターで人名や地名を網羅する狙いだ。

外字の存在はネット上の同じサービスを大勢の個人や企業が共有する「クラウド」化を妨げ、日本が世界的な流れに取り残される原因にもなりかねないとされ、解決が急がれている。

政府側でプロジェクトを統括する経産省の平本健二さんは「1980年代から続く問題を解決したい」と語った。

普及が進む電子書籍についても成果が期待できる。日本文芸家協会副理事長で芥川賞作家の三田誠広さんは

「文字が1万字しか使えないのは大きなネックだ。特に人名が表記できないのは致命的欠陥。文学書や歴史書を正確に電子書籍化できない」
と語る。

一方で、懸念の声もある。

国立国語研究所の高田智和准教授は

「戸籍や地名にはすでに使われていない異体字や誤字も多い。いたずらに使える字を増やすのでなく、使われているかどうかで仕分けるのが先ではないか」
という。

プロジェクトが完了すれば、パソコンの日本語変換で「渡辺」の候補は現状の3から一気に22に増える。

JIS規格を決める際、多くの異体字を集約した東京外語大の芝野耕司教授(言語学)も

「多くの漢字が画面上に並ぶ中から、延々探せというのか。漢字を増やすことはコンピューターにとって意味のある行為かも知れないが、人にとっては使い勝手が悪化するだけだ」
と話している。

何とも悩ましい話ですね。

ワープロが出来た当初「ワープロの文字は活字と同等に扱って良いのか?」という議論がありました。
プリンターでドットの集まりとして示した文字と、活字の文字が同じとみるかどうか?という話ですね。

ぞの後に、コンピュータの文字コードが規格化されたのですが、かなり色々な文字を組み込まない規格になりました。

そもそも文字の規格化というのは、ある意味でキリがないわけで、無制限に異字体を組み込むというのは間違っているでしょう。
実用上で困るのが、人名であれば人名に使われる文字についてだけ組み込むというのでも良いかと思います。

例えば、地名などで昔の名前の文字は使っていない、といった場合にその時代の文字をコンピュータで扱えなくてはならない、との考え方はまずいと思います。
あくまでも、現時点での実用性の範囲の中だけで文字数を増やすべきでしょう。

1月 21, 2011 at 07:58 午後 もの作り |

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/2299/50647697

この記事へのトラックバック一覧です: 日本字のコードを増やすのだそうだ:

コメント

電話帳登録なんかは、割といい加減でして、近い文字でごまかすこともあります。例えば齎藤さんを齋藤さんにしちゃったりして、まあ、正式登録ではありませんから、ひとつの考えかたですね。
以前の同僚にもっとめずらしい文字遣いの人がいまして、○財ではなく、○戝でした。その人は、あきらめていたのでしょうか、三文判なんかは、○財で代用していました。

戸籍のほうも、異字体を普通の字体に変える「改姓」は、ほぼ無条件に認められるそうです。

投稿: mimon | 2011/01/22 1:17:24

コメントを書く