漢字

 日本語用パソコンの場合,搭載されている漢字は JIS X 0208 で定められた6,879字と ASCII 文字(ローマ字,数字など)。 さらに,JIS X 0212 で補助漢字として6,067字が規格化されたが,これを搭載したパソコンはまだない。 さらに JIX X 0213 で第三,第四水準漢字が企画化されが,それでも常に『漢字が足りない』状況でである。 日本語以上に多くの漢字を必要とし,多数の漢字を搭載している中国のコンピュータでも事情は同様で, 日本,中国,韓国のコンピューターの宿命として,常に外字の問題が付きまとう。

 漢字入力でうまく変換されない場合,難解な漢字は,まず別の読みで入力してみる。 音読みでは変換されなくても,訓読みで可能なことも(逆のケースも)ある。 または,熟語で可能なこともある。 前者は日本語ワープロが生まれて以来の古典的なテクニックである。 少し面倒だが,手書き入力も有効で,読み方がわからなくても変換できる。

 2006年12月12日にニンテンドーが発表した調査結果では『パソコンを始めて漢字が書けなくなった70%,読める漢字が増えた15%』という結果だった。 調査対象は10〜15歳の“こども”400名,35〜40歳の“大人”400名。


当用漢字
 1946年11月,国語審議会の答申に基づき,内閣告示として公布。 1850字を日常生活で使う範囲とした。


教育漢字
 1948年公布,当用漢字のうち881字である。 当用漢字音訓表や字体表も出ている。


常用漢字
 1981年10月に内閣告示された“常用漢字表”に記載されている漢字のこと。 当用漢字に代わるものとして告示。 一般の社会生活における漢字使用の目安とされ,日常生活で日本語を表記する『目安』として1945字が定められた。 専門分野や固有名詞は対象としていない。



人名漢字別表

 1951年に92字が制定,1976年に26字が追加。 1981年10月,告示。166字を含む。 1990年に188字が追加された。



JIS 漢字コード

 日本工業規格がワープロ,パソコンなどで漢字を使えるように,文字や記号に付けた番号。 Unicode に中国・韓国の漢字と共に採用されが, 作家たちから使える漢字が少ないとの反発がある。
1978年に発表。1983,1990,1997,2000年に改正された。

 日本では,JIS X 0208 にて第一水準および第二水準を定めている。 第一水準では,特殊記号 147文字,数字 10文字,ローマ字 52文字,平仮名 83文字,カタカナ 86文字,ギリシア文字 48文字,キリル文字 66文字,罫線素片 32文字,漢字 2,965文字の計 3,489文字。 第二水準として 3,388文字を定めている。
また,JIS X 0212 にて補助漢字として 6,067文字を,JIS X 0213 にて第三水準および第四水準として 4,344文字を追加している。 だだし,JIS X 0213 と JIS X 0212 に重複する文字がある。
 さらに,JIS X 0208 系とは別に ISO-10646 の翻訳版として JIS X 0221 を定めている。 この第1面のみを使った 16ビットコードとして使うことが許されており,このコードが Unicode と一致している。
 2005年現在一般的に使われているコード体系は,コンピューターの能力が現在に比べて低いころ,使用頻度の高い字を優先して制定されたため, 例えば JIS 第1・2水準漢字に含まれるのは合わせて7,000字弱となっている。 特に問題になっているのが地方自治体の合併に伴う戸籍データベースの統合で,市町村毎に異なる外字セットを持っている場合,戸籍を扱う作業に大きな手間がかかるという。 そこで,戸籍データのやり取りができるように XKP というシステムが考えられた。 XKP では,基本的に文字を UNICODE で扱いそこに無い字を外字として定義する。 このままだとデータをやり取りできないため,フォント・読み・画数・親字などを記した外字データベースと外字を含んだテキストを併せてやり取りする。


 JIS での漢字コードは,面−区−点をそれぞれ 1〜94 までの 10進数で表されているが, コンピュータでの実装は,以下に示す何れかのコードによる表現を用いている。

ISO-2022-JP いわゆる JIS コードによる表現
 区,点コードにそれぞれ 20h を足した値を上位,下位 8ビットとした 16ビットコード。
 面の切り替えは,エスケープシーケンスを用いる。

Extented Unix Code(EUS)による表現
 コード割り当ては,以下のようになっている。
 ・第1バイトの MSB が 0 なら,残りの 7bitを使って,ASCIIコードを割り当てる。
 ・第1バイトの MSB が 1 なら,各バイトの MSB を 1にした JISコード表現を割り当てる。(第一水準,第二水準)
 ・第1バイトが 8Eh なら,続くバイトに JIS 8単位符号のカナ文字を割り当てる。(半角カナ)
 ・第1バイトが 8Fh なら,続くバイトに各バイトの MSB を 1にした JISコード表現を割り当てる。(第三水準,第四水準,補助漢字)

Shift JIS(MS 漢字コード)による表現
 コード割り当ては,以下のようになっている。
 ・第1バイトが 81h〜9Fh,第2バイトが 40h〜7Eh, 80h〜FCh の 5828文字(第一水準,第二水準)
 ・第1バイトが E0h〜EFh,第2バイトが 40h〜7Eh, 80h〜FCh の 3008文字(第二水準)
 ・第1バイトが F0h〜FCh,第2バイトが 40h〜7Eh, 80h〜FCh の 2444文字(第三水準,第四水準)


 戦後すぐに制定された当用漢字表で読み書きの平易化を目指した書体が採用され,その後の1981年制定の常用漢字表で,漢字表記に関するルールが制定されている。 常用漢字表では手書きの簡易文字と印刷物での難しい表記の統一は行われず,さらに常用漢字表にない漢字(表外漢字)については,2000年に『表外漢字字体表』が制定されるまで『どの表記が正しいのか』という疑問が解決しないままだった。 常用漢字表制定から20年ほどの間に急速にワープロ等が普及したことで,こうした表外漢字に関する統一表記がないまま表外漢字の利用が進んだ。 JIS X 0213:2004 の登場は,これを再統一するための動きの一環である。


JIS X 0213:2004
 従来の規格で示されている漢字の例字形のうち,168文字に変更が加えられた。 また,従来は同一の文字コードで表現されていた異字体のうち,10文字を別の文字として新たにJISコードを与えた。


78JIS 漢字
 1969年から情報処理学規格委員会で作業が開始され, 行政管理庁の基本漢字資料,日本生命人名表などを参考にまとめられた。 第一水準,第二水準を合わせて6355(6349?)字である。 漢字コードとしては,ISO が1973年に定めた規格に基づく最初のもの。


83JIS 漢字
 約300字を簡略字体に変更した。


90JIS 漢字
 JIS 補助漢字 5801 字が追加される。


97JIS 漢字
 1997年の改正版。 第一水準は常用漢字を中心に2965字。 第二水準は3390字から成る。


新JIS漢字(2000JIS 漢字?)
 現代の日本語を表記するに十分な文字を定めた。 第三水準、第四水準として3685字が加わる。


JIS X 0213:2004『新JIS』
 第3・第4水準漢字などが追加されているほか,『葛』や『鴎』など一部の文字で旧 JIS が採用していた字形(いわゆる『JIS 字』)が変更され,一般の辞書や活字と同じ字形に統一されている。



戦後の漢字の年表

1946年 当用漢字表(1850字)と現代かなづかいが告示
1948年 当用漢字音訓表,教育漢字(881字)告示,国立国語研究所が開設
1949年 当用漢字字体表
1951年 人名用漢字別表(92字)
1973年 当用漢字改定音訓表告示
1976年 人名用漢字追加(28字)
1978年 JIS 漢字コード制定(計6349字)
1981年 常用漢字表(1945字),人名漢字別表(166字)
1983年 JIS 漢字コード一部訂正
1989年 小学校学習指導要領改定(学習漢字1006字)
1990年 JIS 補助漢字(5801字),人名用漢字追加(118字)
1993年 ユニコード制定
2000年 JIS 第三水準、第四水準制定(計3685字)



CJK 統合漢字

 中国,台湾,日本,韓国で使用される漢字を統合した特殊な文字セット。 China,Japan,Korea の頭文字をとってこう言う。 Unicode,ISO 10646 に採用された。



漢字 ROM

 漢字フォントを記録した ROM,今のパソコンでは OS またはデーターとして HD などから読み込まれる。 昔はオプションだったり、標準搭載は第1水準だけで第2水準がオプションだったりした。 常用漢字しか載せてないのもあった。 PlayStation は常用漢字分しか搭載してないらしい。



京都大学人文科學研究所 附属 漢字情報研究センター

 東洋学および漢字文献などの収集・研究を行っている研究所(らしい)。
サイト:
http://kanji.zinbun.kyoto-u.ac.jp



戻る 日本語『か』最初のメニュー