先日、フォントのことをちょっと書きましたが、日本語の文字について気になったことがあったので調べてみました。
くの字点にも文字コードがあるのね
電子書籍で、著作権切れの文学作品が無料だったりするので、大正時代の小説とかをたまに読んだりします。その中で下図のような、"くの字点"と呼ばれる踊り字がよくでてきます。
これで「にやりにやり」と読みますが、"くの字点"の部分は2文字分の長さになるので、どうやって出してるんだろうと不思議に思ってました。
調べてみると、ちゃんとUnicodeにあるんですね。二つの文字(U+3033 と U+3035)の組合せになります。縦書き専用文字ということですかね。
kindleで文字の大きさを最大にしてみると、二つの文字の間にわずかな隙間が出ていました。
機種依存文字はなにかと面倒ですが
青空文庫では現代仮名遣いに直してあって、こういう踊り字は使わないようにしているようですが、昔の文学作品は旧仮名遣いのほうが雰囲気がでますよね。
椎名林檎さんは意図をもって歌詞にこの"くの字点"が使っているようです。CDを買った人にしか、伝わらないのでは と余計な心配をしてしまいます。
データとして扱う場合、機種依存文字は使わないようにしたいものですが、人名はそうもいきませんよね。名前の漢字が普通に変換しても出てこない という方は、本人もまわりの人も、いろいろ気苦労があるんじゃないでしょうか。「はしごだか」ぐらいは第一、第二水準に入っていてほしいところです。