文字コード判定
テキストのバイト列から文字コードを推定。16進ダンプ表示。UTF-8・Shift_JIS・EUC-JP対応。
21
文字数
46
UTF-8バイト数
マルチバイト
文字種別
🔍 文字コード推定結果
高いUTF-8有効なUTF-8マルチバイトシーケンス検出
低いShift_JIS (推定)日本語文字を含むが、このツールの入力はUTF-8
低いEUC-JP (推定)日本語文字を含むが、このツールの入力はUTF-8
📊 文字別詳細(先頭50文字)
| 文字 | Unicode | UTF-8 (HEX) | バイト数 |
|---|---|---|---|
| こ | U+3053 | E3 81 93 | 3 |
| ん | U+3093 | E3 82 93 | 3 |
| に | U+306B | E3 81 AB | 3 |
| ち | U+3061 | E3 81 A1 | 3 |
| は | U+306F | E3 81 AF | 3 |
| ␣ | U+0020 | 20 | 1 |
| W | U+0057 | 57 | 1 |
| o | U+006F | 6F | 1 |
| r | U+0072 | 72 | 1 |
| l | U+006C | 6C | 1 |
| d | U+0064 | 64 | 1 |
| ! | U+0021 | 21 | 1 |
| ␣ | U+0020 | 20 | 1 |
| 日 | U+65E5 | E6 97 A5 | 3 |
| 本 | U+672C | E6 9C AC | 3 |
| 語 | U+8A9E | E8 AA 9E | 3 |
| テ | U+30C6 | E3 83 86 | 3 |
| ス | U+30B9 | E3 82 B9 | 3 |
| ト | U+30C8 | E3 83 88 | 3 |
| ␣ | U+0020 | 20 | 1 |
| 🎉 | U+1F389 | F0 9F 8E 89 | 4 |
💾 16進ダンプ (UTF-8)
00000000 e3 81 93 e3 82 93 e3 81 ab e3 81 a1 e3 81 af 20 |............... | 00000010 57 6f 72 6c 64 21 20 e6 97 a5 e6 9c ac e8 aa 9e |World! .........| 00000020 e3 83 86 e3 82 b9 e3 83 88 20 f0 9f 8e 89 |......... ....|
❓ よくある質問
文字コードとは何ですか?
文字コードは、文字をコンピュータで扱うための数値の割り当て規則です。代表的なものにUTF-8(Unicode)、Shift_JIS、EUC-JPがあります。UTF-8が現在の標準で、世界中の文字を扱えます。
UTF-8とShift_JISの違いは?
UTF-8はUnicodeの符号化方式で世界中の文字を表現可能。Shift_JISはWindows日本語環境で広く使われた文字コードで、日本語文字を2バイトで表現します。現在はUTF-8の使用が推奨されています。
文字化けの原因は?
文字化けは、テキストの文字コードと、それを読み取る側が想定する文字コードが異なる場合に発生します。例えばUTF-8のファイルをShift_JISとして開くと文字化けします。
BOMとは何ですか?
BOM(Byte Order Mark)はテキストファイルの先頭に付与される特殊なバイト列で、文字コードを識別するための目印です。UTF-8のBOMは EF BB BF の3バイトです。