似たような文字の違い
2023年 8月 9日 Posted 野々瀨(フロントエンドエンジニア)
似たような文字があるけれど、見た目が同じでなんとなく使っているという方も多いのではないでしょうか。例えば、ハイフン(-)とダッシュ(–)といった文字を見ると思います。ここではそんな似たような文字の違いについて、一部ご紹介しようと思います。
* 文字コードは一部不明なところや、そもそも存在しない場合もあり、空欄となっているところがあります。
スラッシュ
スラッシュ記号の「/」と「\」には次のように違いがあります。
文字 | 名称 | Unicode | JISコード | Shift_JIS | UTF-8 | 数値参照 |
---|---|---|---|---|---|---|
/ | スラッシュ(半角) | U+002F | 0x2F | 0x2F | 0x2F | / |
/ | スラッシュ(全角) | U+FF0F | 0x213F | 0x815E | 0xEFBC8F | / |
\ | バックスラッシュ(半角) | U+005C | 0x0201 | 0x005C | 0x5C | \ |
\ | バックスラッシュ(全角) | U+FF3C | 0xEFBCBC | \ |
「/」は右斜め上から左斜め下に向かった直線の記号です。何かの区切りなど一般的に使われる記号です。
「\」は左斜め上から右斜め下に向かった直線の記号です。Windows系のパスの区切りやエスケープなど特殊な場面で使われる記号です。
日本語フォントによるバックスラッシュ
日本語フォントでバックスラッシュを入力しようとしますと、円マーク(¥)になります。これは、文字コードの割り当てがバックスラッシュと同じであるために起こる現象です。バックスラッシュを表示したい場合は、日本語フォント以外で表示させる必要があります。
Windows系のパスの区切りが円マークに見えていますが、実際はバックスラッシュで、日本語フォントにより円マークで表示されています。
丸
丸い記号の「○」と「〇」には次のように違いがあります。
文字 | 名称 | Unicode | JISコード | Shift_JIS | UTF-8 | 数値参照 |
---|---|---|---|---|---|---|
○ | 白丸(記号) | U+25CB | 0x217B | 0x819B | 0xE2978B | ○ |
〇 | ゼロ(漢数字) | U+3007 | 0x213B | 0x815A | 0xE38087 | 〇 |
「○」は記号としての文字です。
「〇」は漢数字としての文字です。
Windowsの環境で入力する際は、どちらも「まる」で変換できてしまうため、よく間違って使われたり混在したりすることが多い文字です。
引用符/アポストロフィー
引用符/アポストロフィーには次のような違いがあります。
文字 | 名称 | Unicode | JISコード | Shift_JIS | UTF-8 | 数値参照 |
---|---|---|---|---|---|---|
' | プライム(半角) ダッシュ(半角) 分(半角) |
U+0027 | 0x27 | 0x27 | ' | |
' | プライム(全角) ダッシュ(全角) 分(全角) |
U+FF27 | 0xEFBC87 | ' | ||
‘ | 左一重引用符 左シングルクォーテーションマーク |
U+2018 | 0x2146 | 0x8165 | 0xE28098 | ‘ |
’ | 右一重引用符 右シングルクォーテーションマーク アポストロフィー |
U+2019 | 0x2147 | 0x8166 | 0xE28099 | ’ |
‛ | Single High-Reversed-9 Quotation Mark | U+201B | 0xE2809B | ‛ | ||
ʼ | アポストロフィー | U+02BC | 0xE2809B | ‛ | ||
" | 二重引用符(半角) ダブルミニュート |
U+0022 | 0x22 | 0x22 | " | |
〝 | 二重プライム引用符 ダブルミニュート |
U+301D | 0xE3809D | 〝 | ||
〟 | 二重プライム引用符 ダブルミニュート |
U+301F | 0xE3809F | 〟 | ||
“ | 左二重引用符 | U+201C | 0x2148 | 0x8167 | 0xE2809C | “ |
” | 右二重引用符 | U+201D | 0x2149 | 0x8168 | 0xE2809D | ” |
「'」は直線的な見た目で、時間を表す分(1'23")や数学のダッシュ(x')、プログラミング言語の文字列を表すときなどで使用される文字です。
「’」や「ʼ」は曲線的な見た目で、英語の短縮・省略などで使用される文字です。
「"」は直線的な見た目で、時間を表す分(1'23")やプログラミング言語の文字列を表すときに使用される文字です。
「〝」と「〟」は直線的な見た目で、強調したい文字に使用される文字です。主に縦書きの際に使用します。
「“」と「”」は曲線的な見た目で、強調したい文字に使用される文字です。主に横書きの際に使用します。
Webに限らずパソコンで文字を入力する際は、あまり区別せず使用しても問題はありません。ただし「'」と「"」で一重と二重とでは、用途や入れ子にするときなどで区別して使用しますので、注意が必要です。
横線
横線には次のような違いがあります。
文字 | 名称 | Unicode | JISコード | Shift_JIS | UTF-8 | 数値参照 |
---|---|---|---|---|---|---|
– | ダッシュ(半角) ENダッシュ |
U+2013 | 0xE28093 | – | ||
— | ダッシュ(全角) EMダッシュ |
U+2014 | 0xE28094 | — | ||
ー | 長音記号 | U+30FC | 0x213C | 0x815B | 0xE383BC | ー |
- | ハイフン マイナス |
U+002D | 0x2D | &45; | ||
- | ハイフン(全角) マイナス(全角) |
U+FF0D | 0xEFBC8D | - | ||
― | 水平線 | U+2015 | 0x213D | 0x815C | 0xE28095 | ― |
─ | 罫(けい)線 | U+2500 | 0x2821 | 0x849F | 0xE29480 | &9472; |
「–」(ダッシュ)は、英語における分離で使用する文字です。
「-」(ハイフン/マイナス)は、複合修飾語や数学の接頭辞などで使用される文字です。
「ー」(長音記号)は、カタカナで表現する際に一つ前の文字の音を伸ばす際に使用される文字です。
「―」(水平線)は、文章の始まりで使用される文字です。フォントによっては複数続けた場合につながって表現されないため、「–」(ダッシュ)などで代用されることもあります。
「─」(罫線)は、表組みなど文字を使った見た目の装飾を行うために使用される文字の一つです。罫線は他にも「└」や「├」などがあります。
文字を入力する際にはなかなか区別が難しく、代用して使用することも多い文字です。
波線
文字 | 名称 | Unicode | JISコード | Shift_JIS | UTF-8 | 数値参照 |
---|---|---|---|---|---|---|
~ | チルダ(半角) | U+007E | 0x7E | ~ | ||
~ | チルダ(全角) | U+FF5E | 0xEFBD9E | ~ | ||
〜 | 波ダッシュ 波線 |
U+301C | 0x2141 | 0x8160 | 0xE3809C | 〜 |
∼ | チルダ演算子 | U+223C | 0xE288BC | ∼ |
「~」(チルダ)は、発音の鼻音や数学の近似、ユーザーのホームディレクトリーを表す文字です。
「〜」(波ダッシュ)は、発音の長音符や範囲を表す文字です。
特に全角のチルダと波ダッシュでは、フォントを変えても区別が難しい文字です。
縦線
文字 | 名称 | Unicode | JISコード | Shift_JIS | UTF-8 | 数値参照 |
---|---|---|---|---|---|---|
| | 垂直線(半角) 縦線(半角) バーティカルバー パイプライン |
U+007C | 0x7C | | | ||
| | 垂直線(全角) 縦線(全角) バーティカルバー パイプライン |
U+FF5C | 0x2143 | 0x8162 | 0xEFBD9C | | |
│ | 罫線 | U+2502 | 0x2822 | 0x84A0 | 0xE29482 | &9474; |
1 | 数字のイチ(半角) | U+0031 | 0x31 | &49; | ||
l | 小文字エル(半角) | U+006C | 0x6C | l | ||
I | 大文字アイ(半角) | U+0049 | 0x49 | I |
「|」(垂直線)は、数学の絶対値やプログラミングでのビット論理和を表す文字です。
「│」(罫線)は、表組みなど文字を使った見た目の装飾を行うために使用される文字の一つです。
特にIDやパスワードなどに使用する際は数字やアルファベットは、フォントによっては区別が難しい文字です。