文字コード変換
Shift_JIS・EUC-JP・UTF-8・JIS を相互変換(ブラウザ内処理)
入力テキスト
変換設定
UTF-8・Shift_JIS・EUC-JP・JIS など「バイト指向」の変換先では、結果を16進ダンプ(バイト列)で表示します。 読める文字列が必要な場合は変換先に「UTF-8」または「Unicodeエスケープ」を選んでください。
変換結果
完全ローカル処理
すべての変換はブラウザ内で実行されます。ファイルやテキストはサーバーに送信されません。
文字コードについて
UTF-8
世界中の文字を扱える現在の標準。Web・JSON・最近のアプリはほぼUTF-8です。可変長(1〜4バイト)で日本語は3バイトが基本。
Shift_JIS (CP932)
古いWindowsや一部の業務システム・CSVで使われる日本語コード。Excelで開く想定の.csvがこの形式のことがよくあります。
EUC-JP
かつてのUNIX系サーバーや古いメールで使われた日本語コード。ログや旧システムのエクスポートで見かけます。
JIS (ISO-2022-JP)
主に古い電子メールで使われたエスケープシーケンス方式の日本語コード。7ビットで安全に送れるのが特徴です。
自動判定
バイト列の特徴から文字コードを推定します。短い文章や記号のみの場合は判定が難しいことがあります。
文字化けの原因
「保存した文字コード」と「開いた側が想定した文字コード」が食い違うと文字化けします。正しい変換元を指定すれば直せます。
使い方のヒント
- Excel用CSVを作る - UTF-8のCSVが文字化けする場合は、変換先を「Shift_JIS」にして保存し直すと開けることがあります。
- 古いファイルを今のアプリで開く - Shift_JIS/EUC-JPの.txtを「UTF-8」に変換すれば最近のエディタで正しく表示できます。
- 文字コードが分からない - ファイルモードに読み込めば自動判定し、UTF-8プレビューで内容を確認できます。
- プログラム用の文字列 - 「Unicodeエスケープ」を使うとソースコードに埋め込める \uXXXX 形式にできます。
変換できない文字について
Shift_JIS・EUC-JP・JIS には収録されていない文字(一部の絵文字や特殊記号など)があります。それらの文字は変換先で「?」などに置き換わる場合があります。