🧰ツールボックス

文字コード判定

テキストのバイト列から文字コードを推定。16進ダンプ表示。UTF-8・Shift_JIS・EUC-JP対応。

21
文字数
46
UTF-8バイト数
マルチバイト
文字種別
🔍 文字コード推定結果
高いUTF-8有効なUTF-8マルチバイトシーケンス検出
低いShift_JIS (推定)日本語文字を含むが、このツールの入力はUTF-8
低いEUC-JP (推定)日本語文字を含むが、このツールの入力はUTF-8
📊 文字別詳細(先頭50文字)
文字UnicodeUTF-8 (HEX)バイト数
U+3053E3 81 933
U+3093E3 82 933
U+306BE3 81 AB3
U+3061E3 81 A13
U+306FE3 81 AF3
U+0020201
WU+0057571
oU+006F6F1
rU+0072721
lU+006C6C1
dU+0064641
!U+0021211
U+0020201
U+65E5E6 97 A53
U+672CE6 9C AC3
U+8A9EE8 AA 9E3
U+30C6E3 83 863
U+30B9E3 82 B93
U+30C8E3 83 883
U+0020201
🎉U+1F389F0 9F 8E 894
💾 16進ダンプ (UTF-8)
00000000  e3 81 93 e3 82 93 e3 81 ab e3 81 a1 e3 81 af 20  |............... |
00000010  57 6f 72 6c 64 21 20 e6 97 a5 e6 9c ac e8 aa 9e  |World! .........|
00000020  e3 83 86 e3 82 b9 e3 83 88 20 f0 9f 8e 89        |......... ....|

❓ よくある質問

文字コードとは何ですか?
文字コードは、文字をコンピュータで扱うための数値の割り当て規則です。代表的なものにUTF-8(Unicode)、Shift_JIS、EUC-JPがあります。UTF-8が現在の標準で、世界中の文字を扱えます。
UTF-8とShift_JISの違いは?
UTF-8はUnicodeの符号化方式で世界中の文字を表現可能。Shift_JISはWindows日本語環境で広く使われた文字コードで、日本語文字を2バイトで表現します。現在はUTF-8の使用が推奨されています。
文字化けの原因は?
文字化けは、テキストの文字コードと、それを読み取る側が想定する文字コードが異なる場合に発生します。例えばUTF-8のファイルをShift_JISとして開くと文字化けします。
BOMとは何ですか?
BOM(Byte Order Mark)はテキストファイルの先頭に付与される特殊なバイト列で、文字コードを識別するための目印です。UTF-8のBOMは EF BB BF の3バイトです。