特殊文字とUnicodeの違い・歴史をわかりやすく解説
筆記体やまる文字をコピーしてInstagramやXに貼り付けると、なぜか画像でもないのにそのまま装飾された文字として表示されます。これは魔法ではなく、「Unicode」という国際規格の仕組みのおかげです。
この記事では、特殊文字とUnicodeの関係を、技術的な難しさは抜きにしてわかりやすく解説します。
そもそも「特殊文字」とは
私たちが普段使う文字(あ、A、1など)以外の、装飾的・記号的な文字を総称して「特殊文字」と呼びます。例えば:
- 筆記体: 𝓐𝓑𝓒𝓓
- まる文字: ⒶⒷⒸⒹ
- ハート: ♡ ♥ ❤
- 装飾記号: ✦ ✧ ✨ ❀
- 顔文字パーツ: ꒰ ꒱ ◕ ◡
これらはすべて「文字コード」が割り当てられており、テキストとして扱える「文字」なのです。
Unicodeとは何か
Unicode(ユニコード)は、世界中の文字に共通の番号を割り振った国際規格です。1991年に最初のバージョンが公開され、現在も毎年新しい文字が追加されています。
Unicodeの最大のメリットは、「同じ文字には同じ番号が割り振られている」ことです。これにより、iPhoneで打った文字をAndroidに送っても、Windowsに送っても、原則として同じように表示されます。
Unicode誕生前の混乱
Unicode以前は、国や地域ごとに独自の文字コード体系がありました。日本ではShift_JIS、JIS、EUC-JPなど。海外ではISO-8859系。これらは互換性がなく、ファイルを別の環境で開くと「文字化け」が起きていました。
絵文字も、もともとはNTTドコモが1999年に日本の携帯電話向けに作ったものでしたが、各キャリアごとに違うコードを使っていたため、auのユーザーにドコモから送ると別の絵文字に化ける、ということが起きていました。
Unicodeに統合される
2010年、Unicodeに絵文字が正式に追加されました。これにより、iPhone、Android、Windows、Macなど、どの環境でも同じ絵文字が共有できるようになったのです。
現在のUnicodeには、なんと約15万文字以上が登録されています。漢字・仮名・アルファベットだけでなく、絵文字、数学記号、特殊な装飾文字、消滅した古代文字まで含まれています。
デコ文字に使われる文字の正体
Mathematical Alphanumeric Symbols
筆記体やダブル文字(中抜き)の正体は、Unicodeの「Mathematical Alphanumeric Symbols」というブロックにある文字です。本来は数学者が数式で変数や定数を表すために使う文字でした。
例えば 𝒜(イタリック体のA)は、数学では「ある集合」を表す記号として使われます。これがUnicodeに登録されているため、SNSのテキストフィールドにも入力できるのです。
Enclosed Alphanumerics
まる文字(Ⓐ Ⓑ Ⓒ)は「Enclosed Alphanumerics」というブロック。これも本来は技術文書で項目番号などに使うためのものです。
Halfwidth and Fullwidth Forms
全角アルファベット(A B C)は「Halfwidth and Fullwidth Forms」。日本語の組版で漢字と幅を揃えるために必要な文字です。
本来の用途と異なる使い方
つまり、私たちが「デコ文字」として楽しんでいる文字は、もともとは数学者や技術者がそれぞれの専門分野で必要だったから登録された文字なのです。
それが2010年代後半から、SNS文化の中で「装飾用」として転用されるようになりました。本来の意図とは違う使い方ですが、Unicodeの「すべての文字に番号を」という思想のおかげで、誰でも自由に使えるようになっています。
まとめ
- 特殊文字はUnicodeに登録された正式な文字
- 本来は数学・技術用途のために登録された文字が多い
- Unicodeのおかげで端末を問わず使える(ただし完全互換ではない)
- SNS文化が新しい用途を生み出している
次にデコ文字をコピーして使うとき、その背後にUnicode規格や数学者たちの仕事があると思うと、ちょっと面白いかもしれません。
✦ この記事で紹介したデコ文字を実際に作ってみよう
→ デコ文字メーカーを使う