文字コード判定

テキストのバイト列から文字コードを推定。16進ダンプ表示。UTF-8・Shift_JIS・EUC-JP対応。

入力テキスト

文字数

UTF-8バイト数

マルチバイト

文字種別

🔍 文字コード推定結果

高いUTF-8有効なUTF-8マルチバイトシーケンス検出

低いShift_JIS (推定)日本語文字を含むが、このツールの入力はUTF-8

低いEUC-JP (推定)日本語文字を含むが、このツールの入力はUTF-8

📊 文字別詳細（先頭50文字）

文字	Unicode	UTF-8 (HEX)	バイト数
こ	U+3053	E3 81 93	3
ん	U+3093	E3 82 93	3
に	U+306B	E3 81 AB	3
ち	U+3061	E3 81 A1	3
は	U+306F	E3 81 AF	3
␣	U+0020	20	1
W	U+0057	57	1
o	U+006F	6F	1
r	U+0072	72	1
l	U+006C	6C	1
d	U+0064	64	1
!	U+0021	21	1
␣	U+0020	20	1
日	U+65E5	E6 97 A5	3
本	U+672C	E6 9C AC	3
語	U+8A9E	E8 AA 9E	3
テ	U+30C6	E3 83 86	3
ス	U+30B9	E3 82 B9	3
ト	U+30C8	E3 83 88	3
␣	U+0020	20	1
🎉	U+1F389	F0 9F 8E 89	4

💾 16進ダンプ (UTF-8)

00000000  e3 81 93 e3 82 93 e3 81 ab e3 81 a1 e3 81 af 20  |............... |
00000010  57 6f 72 6c 64 21 20 e6 97 a5 e6 9c ac e8 aa 9e  |World! .........|
00000020  e3 83 86 e3 82 b9 e3 83 88 20 f0 9f 8e 89        |......... ....|

❓ よくある質問

文字コードとは何ですか？

文字コードは、文字をコンピュータで扱うための数値の割り当て規則です。代表的なものにUTF-8（Unicode）、Shift_JIS、EUC-JPがあります。UTF-8が現在の標準で、世界中の文字を扱えます。

UTF-8とShift_JISの違いは？

UTF-8はUnicodeの符号化方式で世界中の文字を表現可能。Shift_JISはWindows日本語環境で広く使われた文字コードで、日本語文字を2バイトで表現します。現在はUTF-8の使用が推奨されています。

文字化けの原因は？

文字化けは、テキストの文字コードと、それを読み取る側が想定する文字コードが異なる場合に発生します。例えばUTF-8のファイルをShift_JISとして開くと文字化けします。

BOMとは何ですか？

BOM（Byte Order Mark）はテキストファイルの先頭に付与される特殊なバイト列で、文字コードを識別するための目印です。UTF-8のBOMは EF BB BF の3バイトです。

🔧 関連ツール

文字数カウンター

テキストの文字数・単語数・行数をリアルタイムでカウント。全角・半角も区別して表示。

テキスト差分比較

2つのテキストの差分をハイライト表示。変更箇所が一目でわかる。

Markdownプレビュー

Markdownをリアルタイムでプレビュー。コピー&ペーストですぐ確認。

テキスト一括置換

テキスト内の文字列を一括置換。正規表現にも対応。

Ａa

半角全角変換

テキストの半角・全角を一括変換。英数字・記号・スペースに対応。

📱

SNS文字数チェッカー

Twitter、Instagram、YouTube等の文字数制限をリアルタイムでチェック。