Unicode変換ツール
テキストをUnicodeエスケープシーケンス、HTMLエンティティ、UTF-8ヘックスバイト、CSSエスケープ、コードポイントなどの形式にエンコードしたり、エンコード済み文字列を読みやすいテキストにデコードしたりできます。すべての処理はブラウザ内で完結します。
Unicodeエンコーディングとは
Unicodeは、世界中のあらゆる文字体系の各文字に固有のコードポイントを割り当てる、国際的な文字エンコーディング標準です。ラテン文字や漢字はもちろん、絵文字や数学記号まで網羅しています。Unicodeエンコーディングは、人間が読めるテキストを\uエスケープシーケンス、HTMLエンティティ、UTF-8バイトシーケンス、CSSエスケープコードなど、コンピュータが処理できる表現に変換します。
この無料のUnicode変換ツールを使えば、あらゆるテキストを6種類の主要なUnicode形式にエンコードし、エンコード済み文字列を読みやすいテキストにデコードできます。多言語対応のWebアプリケーションのデバッグ、JSONやJavaScript用の文字列準備、HTMLエンティティの処理など、さまざまな場面でブラウザ内で即座に変換を実行します。データが外部サーバーに送信されることはありません。
Unicode変換ツールの主な機能
- 6種類のエンコーディング形式に対応: \uエスケープ、HTML 10進数エンティティ、HTML 16進数エンティティ、UTF-8ヘックスバイト、Unicodeコードポイント、CSSエスケープ
- 双方向変換 — テキストを任意の形式にエンコード、またはエンコード済み文字列をデコード
- リアルタイム処理 — 入力と同時に結果が更新されます
- 絵文字、CJK文字、補助面文字を含むUnicode全体をサポート
- \uエスケープ形式でU+FFFFを超える文字のサロゲートペア処理に対応
- 入力テキストの文字数とバイト数を表示
- ファイルのアップロードとダウンロードに対応
- ワンクリックでクリップボードにコピー
- 大量のテキストを扱うためのフルスクリーンモード
- 100%クライアントサイド処理 — データがブラウザの外に出ることはありません
Unicode変換ツールの使い方
- エンコードまたはデコードモードを選択します。
- ドロップダウンから対象の形式を選択します: \uエスケープ、HTML 10進数、HTML 16進数、UTF-8ヘックス、コードポイント、CSSエスケープ。
- 左側のパネルにテキストを入力または貼り付けると、右側のパネルに変換結果が即座に表示されます。
- 切り替えボタンを使用すると、モードを反転して出力結果を入力として再利用できます。
- 「コピー」ボタンで結果をクリップボードにコピーするか、「ダウンロード」ボタンでテキストファイルとして保存します。
Unicodeエンコーディング形式の解説
- \uエスケープ — \u4F60\u597Dのような JavaScript/JSON形式です。ASCII文字はそのまま出力され、U+FFFFを超える文字はサロゲートペアで表現されます。
- HTML 10進数 — 你好のような数値文字参照です。HTML内で直接入力できない文字を表現する際に使用します。
- HTML 16進数 — 你好のような16進数文字参照です。10進数と機能的に同じですが、大きなコードポイントではより簡潔に記述できます。
- UTF-8ヘックス — \xE4\xBD\xA0\xE5\xA5\xBDのような生のバイト表現です。各文字の実際のUTF-8バイトエンコーディングを確認できます。
- コードポイント — U+4F60 U+597Dのような標準的なUnicode表記です。Unicode表、ドキュメント、仕様書で使用されます。
- CSSエスケープ — \4F60 \597Dのような CSS互換形式です。CSSのcontentプロパティ、セレクター、フォント宣言で使用します。
Unicode変換の主な活用シーン
- Web開発 — HTML、CSS、JavaScriptのソースファイルで特殊文字をエンコードします
- APIデバッグ — JSON APIレスポンスやログファイル内の\uエスケープ文字列をデコードします
- 国際化対応 — 多言語コンテンツのUnicode表現を検査し、正確性を検証します
- メールエンコーディング — メールヘッダーやMIMEコンテンツ用に非ASCII文字を準備します
- データベーストラブルシューティング — 保存されたUnicodeテキストのエンコーディング問題を特定し修正します
- セキュリティ分析 — マルウェア解析やXSSテストで難読化されたUnicode文字列をデコードします
Unicode変換のヒント
- JavaScriptやJSON用の文字列を準備する場合は\uエスケープ形式をお使いください — プログラミングで最も広くサポートされているエスケープ構文です
- Webページには HTML 16進数エンティティがおすすめです — 大きなコードポイントでは10進数より読みやすくなります
- エンコーディングの問題をデバッグする際は、UTF-8ヘックスで文字の実際のバイトレベルのエンコーディングを確認してください
- コードポイント形式は、Unicode標準で文字を検索したり、特定の文字について共有したりする場合に最適です
- CSSエスケープはCSSスタイルシート専用に設計されています — 各エスケープシーケンスの後にスペースが必要な点にご注意ください
- コードポイント128未満のASCII文字はすべての形式でそのまま出力されるため、結果の可読性が保たれます
Unicode変換とセキュリティ
Unicodeエンコーディングは、Webセキュリティにおいて重要な役割を果たします。クロスサイトスクリプティング攻撃では、入力フィルターを回避するためにUnicodeエスケープシーケンスが使用されることがあります。たとえば、<script>をHTMLエンティティにエンコードして単純なサニタイザーを回避するケースです。Unicode変換を理解することで、セキュリティ専門家はこうした攻撃の特定と防御が可能になります。
このツールは、すべてのデータをブラウザ内のみで処理します。テキストがサーバーに送信されたり、データベースに保存されたり、第三者と共有されたりすることはありません。機密性の高いコンテンツや社外秘の情報も安心してご利用いただけます。
