普通に考えれば,英語で文書をつくれば,どんな端末でも正しく表示できる文書になりそうな気がする.しかし,現実にはそうならない(文字化けしてしまう)ケースが意外に多い. というのも,“英語”というのが何を意味するかなのだけど,これが“英語版Windows”の意味だと残念ながらそうはならないからだ. 英語版Windowsは,CP1252(Windows-1252,Code Page 1252)という文字コードを使っていて,ASCII printableの範囲にない文字が普通に使えてしまう.
よくある文字化けの例が,“he痴"のような例で,CP1252のアポストロフィー(0x92)が文字化けしたもの.つまり,“he’s”が日本人には(日本人って,日本語版Windows/CP932を使っている人の意味ね)“he痴”に見えてしまうというわけ.
じゃぁ,どうして英語圏の人は,普通のASCIIコード内の「'」(0x27)を使ってくれないのかなのだけど,どうも英語圏の人はシングルクォートとアポストロフィーを兼用するASCIIの「'」の字体を不格好だと感じるかららしい.そのため,Wordなどにもアポストロフィーとして使用している場合は0x92に自動で変換(オートコレクト)する機能がついていて,軒並み0x92にかわってしまうとのこと….
[1] | Wikipedia > Windows-1252 |
[2] | Wikipedia > Microsoftコードページ932 |
[2] | Okumura's Blog > アポストロフィの悩み |