「文字バケ」というのは,本来は可読なテキストファイルのはずなのに, エディタなどで開いて読もうとすると意味不明な文字列が表示されてしまう現象のことです. 文字化けを起こす典型的なケースは,ファイルと端末の漢字コードがあっていないことです. 実際には下の例のように表示されます.
$
」記号がたくさん現われること,ところどころに「^[
」という文字が現われることが特徴です.^[$BJ8;z2=$1$C$F!$$3$s$J46$8$G$9$+!)^[(B ^[$B!p%^!<%/$,$$$C$Q$$8+$($^$9$h$M!%^[(B
\225\416\232\211\602\602\202\001C \202\202\202\012\002\402\202\602\201H
漢字コードの不一致が原因で起こる文字化けは,漢字コードを変換すれば簡単になおります.
漢字コードの不一致による文字化けは,
nkf
というプログラムを使って漢字コードを変換することで簡単になおすことができます.
例えば,文字化けを起こして正しく読めないファイルのファイル名を
mojibake.txt
とすると,
$ nkf -e mojibake.txt > yomeru.txt
というコマンドを実行すると,yomeru.txt
に変換された結果が保存されます
(「$
」はプロンプトですので入力してはいけません.
タイプするのはnkf
以降の部分です).
エディタでyomeru.txt
を開くと読めるようになっているはずです.
nkf -e mojibake.txt
」の「-e
」は,EUCコードに変換することを指示するオプションです.
-e
」,JISに変換したい場合 は「-j
」,
Shift-JISに変換したい場合は「-s
」を指定します.