Unicodeコンソーシアム発足当時,Unicodeの設計は次の4つの原理に基づいて行われていた[1].
# | 原理 | 説明 |
---|---|---|
(1) | 国際性 | 一般的なテキストのやりとりで使われるすべてのも文字を包含する,十分に大きな文字レパートリーを備える. |
(2) | 高い効率 | 解析を簡単にする. ソフトウェアが状態を保持したり,特殊なエスケープシーケンスを探したり,文字を識別するために前後のバイトを調べたりする必要をなくす. |
(3) | 一貫性 | ソート,検索,表示,編集が迅速に行えるようにするため,いつでも一貫して同じ長さの文字コードを使用する. |
(4) | あいまい性の除去 | どの16ビット値も,いつでも同じ文字を指すようにする. |
ё
をつくってもよいことになっている.
ウムラウト記号て,何にでもつけられるわけじゃないと思うんだけども.
ё
とe+¨)が同じ文字と評価されるように
“canonical ordering”というルールを定めている.
[結合済みのёはU+00EB LATIN SMALL LETTER E WITH DIAERESIS,等価な結合文字はU+0065 U+0308となっている.
参考 The Unicode Character Code Charts::C1 Controls and Latin-1 Supplement]