民放で云う「テレビ東京」的なサイトを目指すネタ系ウェップログ&たまに日記でうっほっほ
RSS更新情報

カテゴリ: コンピュータ | コメント(4)

2006070902.jpg
何でも、Windowsに付属しているメモ帳(Notepad)で
半角4文字+半角3文字+半角3文字+半角5文字
の文字列を保存後、再度ファイルを読み込むと文字化けする現象が発生するとの事です。
スラッシュドット ジャパン | Windowsのメモ帳(notepad)に文字化けするバグより引用。

4+3+3+5byteの文字列、例えば“tiny bug for nards”と書き込んで保存し、再度ファイルを開くと文字化けして表示されるというもの。
ファイルを開くときにANSI文字コードを誤ってUnicodeと判定するために発生する問題であるようだ。
バグの報告を探してみたが、マイクロソフト社関係のサイトからは見つけることができなかった。

ANSIかUNICODEかを判別する為にファイル内文字列を見てたと思うんですが、その情報が不足してた事による誤判定って感じですね。
ただ、試しに上記文字列直後に半角スペースを1文字追加した保存した所、文字化けせず普通に表示。
んー、どういった判定方法やってるんだろう、訳わからんですねー。
尚、解決手段としてNotepadの起動オプションで手動でコード判別させてやる方法があります。

C:\>notepad.exe /A [ファイル名]

「/A」を指定するとANSIと認識する為、上記文字化けは発生しなくなります。
(ちなみに「/W」はUnicodeと認識)
コマンドプロンプトから起動してやるか(面倒臭いけど)ファイルの関連付け、ショートカット等で設定してあげれば良いかと。
まぁ、一番いいのは「秀丸」使う事なんですけどね。
【関連リンク】
27B Stroke 6 元記事


投稿者: Udoso | 投稿日: 2006/07/09 04:35 PM | コメントを書く

カテゴリ「コンピュータ」の最新記事

4 件のコメントがあります。

  • 1
    ひびき says:

    今思ったんだけど、記事の文字列の組み合わせと、うどそさんの書いてる文字列の組み合わせが違いますねー。

  • 2
    Udoso says:

    ああ、それはスラドから情報入手したからっす。
    元記事(海外)は「Bush hid the facts」とブッシュ体制を皮肉ったネタから始まったみたいで、それが海に渡ってスラドで掲載された際に、主旨が代わったっつーかどーでもよくなったのかどーとか。

  • 3
    ひびき says:

    ん?
    半角4文字+半角2文字+半角2文字+半角5文字
    4+3+3+5byteの文字列
    これどっちでもいいってことっすか?というか文字列じゃなくて文字数の組み合わせが違うんすよね。

  • 4
    Udoso says:

    あああああああああ解った、激しく把握した。
    思いっきり間違ってましたねぇ。
    こっそり直しておきました、っつーかすんませんでした。
    正しくは
    「半角4文字+半角3文字+半角3文字+半角5文字」
    です、はい。

Udoso へ返信する コメントをキャンセル

メールアドレスが公開されることはありません。

すし家
商品リンク
業界初!人工知能を搭載した近未来商品リンク集その名も (※特許出願中)
最終更新:
2018/03/29 10:13 PM

Copyright© 1998-2024(鼠) Sugi-Udoso All rights reserved.

▲ページの先頭へ▲