英語なのに漢字がでる?

普通に考えれば,英語で文書をつくれば,どんな端末でも正しく表示できる文書になりそうな気がする.しかし,現実にはそうならない(文字化けしてしまう)ケースが意外に多い. というのも,“英語”というのが何を意味するかなのだけど,これが“英語版Windows”の意味だと残念ながらそうはならないからだ. 英語版Windowsは,CP1252(Windows-1252,Code Page 1252)という文字コードを使っていて,ASCII printableの範囲にない文字が普通に使えてしまう.

よくある文字化けの例が,“he痴"のような例で,CP1252のアポストロフィー(0x92)が文字化けしたもの.つまり,“he’s”が日本人には(日本人って,日本語版Windows/CP932を使っている人の意味ね)“he痴”に見えてしまうというわけ.

じゃぁ,どうして英語圏の人は,普通のASCIIコード内の「'」(0x27)を使ってくれないのかなのだけど,どうも英語圏の人はシングルクォートとアポストロフィーを兼用するASCIIの「'」の字体を不格好だと感じるかららしい.そのため,Wordなどにもアポストロフィーとして使用している場合は0x92に自動で変換(オートコレクト)する機能がついていて,軒並み0x92にかわってしまうとのこと….

Links

[1]Wikipedia > Windows-1252
[2]Wikipedia > Microsoftコードページ932
[2]Okumura's Blog > アポストロフィの悩み

はたいたかし
2010-03-01 初稿
トップ > 開発ツール > Unicode