文字コード変換

Shift_JIS・EUC-JP・UTF-8・JIS を相互変換(ブラウザ内処理)

入力テキスト

変換設定

UTF-8・Shift_JIS・EUC-JP・JIS など「バイト指向」の変換先では、結果を16進ダンプ(バイト列)で表示します。 読める文字列が必要な場合は変換先に「UTF-8」または「Unicodeエスケープ」を選んでください。

変換結果

完全ローカル処理

すべての変換はブラウザ内で実行されます。ファイルやテキストはサーバーに送信されません。

文字コードについて

UTF-8

世界中の文字を扱える現在の標準。Web・JSON・最近のアプリはほぼUTF-8です。可変長(1〜4バイト)で日本語は3バイトが基本。

Shift_JIS (CP932)

古いWindowsや一部の業務システム・CSVで使われる日本語コード。Excelで開く想定の.csvがこの形式のことがよくあります。

EUC-JP

かつてのUNIX系サーバーや古いメールで使われた日本語コード。ログや旧システムのエクスポートで見かけます。

JIS (ISO-2022-JP)

主に古い電子メールで使われたエスケープシーケンス方式の日本語コード。7ビットで安全に送れるのが特徴です。

自動判定

バイト列の特徴から文字コードを推定します。短い文章や記号のみの場合は判定が難しいことがあります。

文字化けの原因

「保存した文字コード」と「開いた側が想定した文字コード」が食い違うと文字化けします。正しい変換元を指定すれば直せます。

使い方のヒント

  • Excel用CSVを作る - UTF-8のCSVが文字化けする場合は、変換先を「Shift_JIS」にして保存し直すと開けることがあります。
  • 古いファイルを今のアプリで開く - Shift_JIS/EUC-JPの.txtを「UTF-8」に変換すれば最近のエディタで正しく表示できます。
  • 文字コードが分からない - ファイルモードに読み込めば自動判定し、UTF-8プレビューで内容を確認できます。
  • プログラム用の文字列 - 「Unicodeエスケープ」を使うとソースコードに埋め込める \uXXXX 形式にできます。
変換できない文字について

Shift_JIS・EUC-JP・JIS には収録されていない文字(一部の絵文字や特殊記号など)があります。それらの文字は変換先で「?」などに置き換わる場合があります。