トップページへ
ヘルプのトップへ
0:パソコン操作の
:基礎知識
:画像の基礎知識
:文字化けについて
1:HP の作り方
まず始めに…
2:画像ファイル整理
Vixの使方
3:サーバーへの
ファイル転送ソフト
FFFTPの設定
4:ペイントの使い方
5:ホームページビルダー
6:エックスプローラーの
使い方
7:HP制作リンク集
8:メールの使い方
(OutlookExpress)
9:検索デスクの活用
インターネットを
有効に使う
10:フリーソフトの利用
11:圧縮・解凍ソフト
について
12:Vix を「窓の杜」から
ダウンロードする
13:Vixの
「簡単」ダウンロード
(初心者の方は、こちらからダウンロードして下さい。解凍ソフトが不要です)
|
「文字化け」 って、何? どうすれば治るの?
メールやホームページを見ていて、たまに意味不明の文字や記号が並んだページが表示された経験がありますか。
この現象を、「文字化け」と言います。
1:「文字化け」がおきたとき、修正する方法
ホームページの場合
「文字化け」とはこんな状態のことです。
「表示」→「エンコード」→「日本語(シフトJIS→ECU)」に変更します。
ちゃんと読めるようになりました。
メールの場合
「表示」→「エンコード」→「日本語(自動選択)」を選んでみましょう。
これでも治らなかった場合は、
「エンコード」→「その他」→「日本語(シフトJIS)」もしくは「日本語(ECU)」
を選んでみて下さい。
(これで治らない場合は、中身を見ることは出来ません。諦めるしかありません。)
(外国からのメールの場合は、その国名を選んでみて下さい)
2:「文字化け」のおきる原因
何故、「文字化け」は起きるのでしょう。
「エンコード」という「文字コード」を間違ったことにより、「文字化け」が生じます。
プラウザなどは、文字コードを自動的に判断して、漢字を表示していますが、たまに間違うことがあるためです。
3:「文字コード」とは?文字コードとその歴史
パソコンの中では、全てが2進数の数字で表されていることはご存じですね。
文字も同じく、漢字毎にある数字が割り当てられています。
例えば、「秋」という文字は、次のような数字で定義されています。
「一太郎」の文字パレットで、「文字情報」を表示させてみましょう。
どうしたことか、何と、4種類もの数字が割り当てられています。
「JIS」=3D29
「シフトJIS」=8F48
「区点」=02909
「Unicode」=79CB
(数字は、16進数という方法で表示されています)
ちょっと文字コードの歴史の話をします。
パソコンが急速に進歩してきた裏には、いろんな試みがありました。
元々、パソコンは、「アルファベット・数字・記号」しか扱えなかったのです。
「A」=41 「a」=61 「1」=31 というふうに決められていました。
8ビットで構成される1バイトは、最大256の数を表すことが出来ましたから、「アルファベット・数字・記号」だけなら、1バイトあれば充分でした。
(これを、1バイト系文字 と言います)
1バイト文字(256個)の中には、少し余裕があったので、カタカナを組み込むことができました。
当初のパソコンは、カタカナしか利用できなかったのです。
(メールソフトなどで、「半角カタカナは使用しないでください」とあるのは、この文字のことです)
しかし日本人は、これでは不便なものですから、何とか漢字を表示させようとしました。
漢字は文字数が多いものですから、1バイト(256)では表し切れません。
そこで、「2バイトで1つの文字を表す」方法を考えました。これを、「2バイト系文字」・「区点コード」と言います。
「JISコード」として統一したのですが、メーカー毎に特殊な文字を登録したりして、たくさんの方言があります。
「機種固有文字」というのがそれです。
当時、1バイト系文字と2バイト系文字を使い分けるために、…1バイト系」…「KI]…2バイト系…「KO」…1バイト系…と「KI」・「KO」(エスケープシーケンス)で2バイト系文字を挟んで区別していました。
しかし、これではファイルは大きくなるし、不便なので、マイクロソフトが別な規格を作りました。それが、「シフトJIS」です。
1バイト系文字で使われていない(半角カタカナで使っていた)1バイトと、もう1バイトで漢字を表す、という規格です。
漢字の処理は大変便利になり、今も、ワープロや多くのOA機器に使われています。
一方、パソコンの世界(マイクロソフトの世界)とは別に、インターネットなどのネットワークで使われるサーバーコンピューターでは、「UNIX」というOSが広く普及しています。この「UNIXワークステーション」の内部では、「ECU」というコードが使われています。
ネットワークではいろんな機種の(文字コードが違う)コンピューターが繋がる訳ですから、複数の文字コードを内部で切り替えて使う方法を取り入れています。
インターネットでは、「シフトJIS」がまだまだ多く使われていますが、「ECU」を勧めているサーバーもあります。
また、「1つのホームページ内では、1つのコードを使用する」ことを義務づけている検索エンジンもあります。
1つの国の中で使うには「シフトJIS・ECU」で充分だったのですが、インターネットが急速に発展し、多くの国・多くの言語がネットで繋がるようになると、文字数が飛躍的に増え、国毎に規格が違うのでは、不便が生じます。
そこで、全世界で共通の文字企画を作ることになりました。それが、「Unicode」です。
今後は「Unicode」が主体になっていくそうです。
現在、日本では「シフトJIS」がまだまだ全盛です。
少し前のワープロや表計算ソフトでは、この「シフトJIS」しか扱えないからです。
いま、インターネット上のホームページには、「シフトJIS」と「ECU」が混在している状態です。
ホームページビルダーでも一太郎でも、ファイルを出力する時に、漢字コードを選べるようになっています。
コード体系によって違う数字を使っているものですから、これを間違うと一番上の写真のような表示になってしまうのです。
ホームページを作る場合は、このコード体系を統一しておく必要があります。
1ページ目は「ECU」で、そこからリンクしている2ページ目は「シフトJIS」なんてことをしたら、プラウザソフトが迷ってしまいます。文字化けのおこる原因になります。
HTMLファイルの中で、次の1行があります。
<META http-equiv="Content-Type" content="text/html; charset=EUC-JP">
(「シフトJIS」の場合は、charset=SHIFT−JIS となっています)
最後の、「charset=EUC-JP」が、「このページは、「EUC-JP」で書いていますよ!」という合図なのですが、この表示がない場合や、間違った表示がされている場合などで、「文字化け」がおこります。
自分のホームページはどのコード規格で書いているか、気を付けましょう。
|