トップページへ

ヘルプのトップへ

0:パソコン操作の
  :基礎知識
  :画像の基礎知識
  :文字化けについて

1:HP の作り方
   まず始めに…

2:画像ファイル整理
    Vixの使方

3:サーバーへの
  ファイル転送ソフト
  FFFTPの設定

4:ペイントの使い方

5:ホームページビルダー

6:エックスプローラーの
  使い方

7:HP制作リンク集

8:メールの使い方
  (OutlookExpress)

9:検索デスクの活用
  インターネットを
    有効に使う

10:フリーソフトの利用

11:圧縮・解凍ソフト
    について

12:Vix を「窓の杜」から
   ダウンロードする

13:Vixの
  「簡単」ダウンロード

 (初心者の方は、こちらからダウンロードして下さい。解凍ソフトが不要です)

「文字化け」 って、何?  どうすれば治るの?

メールやホームページを見ていて、たまに意味不明の文字や記号が並んだページが表示された経験がありますか。
この現象を、「文字化け」と言います。

1:「文字化け」がおきたとき、修正する方法

ホームページの場合
  「文字化け」とはこんな状態のことです。
    

  「表示」→「エンコード」→「日本語(シフトJIS→ECU)」に変更します。
    

  ちゃんと読めるようになりました。
    

メールの場合
  「表示」→「エンコード」→「日本語(自動選択)」を選んでみましょう。
    

  これでも治らなかった場合は、
  「エンコード」→「その他」→「日本語(シフトJIS)」もしくは「日本語(ECU)」
    を選んでみて下さい。
    (これで治らない場合は、中身を見ることは出来ません。諦めるしかありません。)
    (外国からのメールの場合は、その国名を選んでみて下さい)
    

2:「文字化け」のおきる原因
何故、「文字化け」は起きるのでしょう。
「エンコード」という「文字コード」を間違ったことにより、「文字化け」が生じます。
プラウザなどは、文字コードを自動的に判断して、漢字を表示していますが、たまに間違うことがあるためです。
3:「文字コード」とは?文字コードとその歴史
パソコンの中では、全てが2進数の数字で表されていることはご存じですね。
文字も同じく、漢字毎にある数字が割り当てられています。
例えば、「秋」という文字は、次のような数字で定義されています。
  「一太郎」の文字パレットで、「文字情報」を表示させてみましょう。

どうしたことか、何と、4種類もの数字が割り当てられています。
「JIS」=3D29
「シフトJIS」=8F48
「区点」=02909
「Unicode」=79CB
  (数字は、16進数という方法で表示されています)

ちょっと文字コードの歴史の話をします。

パソコンが急速に進歩してきた裏には、いろんな試みがありました。
元々、パソコンは、「アルファベット・数字・記号」しか扱えなかったのです。
「A」=41 「a」=61 「1」=31 というふうに決められていました。
8ビットで構成される1バイトは、最大256の数を表すことが出来ましたから、「アルファベット・数字・記号」だけなら、1バイトあれば充分でした。
(これを、1バイト系文字 と言います)

1バイト文字(256個)の中には、少し余裕があったので、カタカナを組み込むことができました。
当初のパソコンは、カタカナしか利用できなかったのです。
(メールソフトなどで、「半角カタカナは使用しないでください」とあるのは、この文字のことです)

しかし日本人は、これでは不便なものですから、何とか漢字を表示させようとしました。
漢字は文字数が多いものですから、1バイト(256)では表し切れません。

そこで、「2バイトで1つの文字を表す」方法を考えました。これを、「2バイト系文字」・「区点コード」と言います。

「JISコード」として統一したのですが、メーカー毎に特殊な文字を登録したりして、たくさんの方言があります。
「機種固有文字」というのがそれです。

当時、1バイト系文字と2バイト系文字を使い分けるために、…1バイト系」…「KI]…2バイト系…「KO」…1バイト系…と「KI」・「KO」(エスケープシーケンス)で2バイト系文字を挟んで区別していました。

しかし、これではファイルは大きくなるし、不便なので、マイクロソフトが別な規格を作りました。それが、「シフトJIS」です。
1バイト系文字で使われていない(半角カタカナで使っていた)1バイトと、もう1バイトで漢字を表す、という規格です。
漢字の処理は大変便利になり、今も、ワープロや多くのOA機器に使われています。

一方、パソコンの世界(マイクロソフトの世界)とは別に、インターネットなどのネットワークで使われるサーバーコンピューターでは、「UNIX」というOSが広く普及しています。この「UNIXワークステーション」の内部では、「ECU」というコードが使われています。
ネットワークではいろんな機種の(文字コードが違う)コンピューターが繋がる訳ですから、複数の文字コードを内部で切り替えて使う方法を取り入れています。

インターネットでは、「シフトJIS」がまだまだ多く使われていますが、「ECU」を勧めているサーバーもあります。
また、「1つのホームページ内では、1つのコードを使用する」ことを義務づけている検索エンジンもあります。

1つの国の中で使うには「シフトJIS・ECU」で充分だったのですが、インターネットが急速に発展し、多くの国・多くの言語がネットで繋がるようになると、文字数が飛躍的に増え、国毎に規格が違うのでは、不便が生じます。
そこで、全世界で共通の文字企画を作ることになりました。それが、「Unicode」です。
今後は「Unicode」が主体になっていくそうです。

現在、日本では「シフトJIS」がまだまだ全盛です。
少し前のワープロや表計算ソフトでは、この「シフトJIS」しか扱えないからです。
いま、インターネット上のホームページには、「シフトJIS」「ECU」が混在している状態です。

ホームページビルダーでも一太郎でも、ファイルを出力する時に、漢字コードを選べるようになっています。
      

コード体系によって違う数字を使っているものですから、これを間違うと一番上の写真のような表示になってしまうのです。

ホームページを作る場合は、このコード体系を統一しておく必要があります。
1ページ目は「ECU」で、そこからリンクしている2ページ目は「シフトJIS」なんてことをしたら、プラウザソフトが迷ってしまいます。文字化けのおこる原因になります。

HTMLファイルの中で、次の1行があります。
<META http-equiv="Content-Type" content="text/html; charset=EUC-JP">
(「シフトJIS」の場合は、charset=SHIFT−JIS となっています)
最後の、「charset=EUC-JP」が、「このページは、「EUC-JP」で書いていますよ!」という合図なのですが、この表示がない場合や、間違った表示がされている場合などで、「文字化け」がおこります。

自分のホームページはどのコード規格で書いているか、気を付けましょう。