ダッシュとかチルダとか
エンダッシュとエムダッシュを直接入力できる?
Bluesky の TL に面白い記事が流れてたので,今回はこれを起点にしてみる。
- エンダッシュ(–)を入力したい時:Windowsキーを押しながら、ハイフン(-)を押す
- エムダッシュ(—)を入力したい時:Windowsキー + Shiftキーを押しながら、ハイフン(-)を押す
「いや,これ, US キーボードの話じゃろ?」と思って,試しに自宅の Windows 機で試したら
$ echo -–— | gnkf dump -u
0x002d, 0x2013, 0x2014, 0x000d, 0x000a
ホンマじゃ! ちゃんと日本語キーボードで – (EN DASH, U+2013) と — (EM DASH, U+2014) が出力された(US キーボードでどうなるかは知らない)。
試しに Ubuntu 機で同じようにやってみたが駄目だった。
エンダッシュやエムダッシュを使うことってあんまりないんだよな。
仕事で書く文書ではほぼ使わない。
TeX や Typst では -- や --- でエンダッシュやエムダッシュに変換されるので,困った覚えはない。
ここのブログでは実体参照の – や — を使うので,これも困ることはないな。
というわけで「へぇ」とは思ったけど,私は使う機会もなく忘れてしまいそう(笑)
ちなみに,よく使う - (U+002D) は “HYPHEN-MINUS” でダッシュ記号ではない。
さらに “HYPHEN” は ‐ (U+2010) と定義されているし “MINUS SIGN” は − (U+2212) と定義されている。
さらにさらに言うと全角のハイフンマイナスである - (U+FF0D) もある。
でも見た目で殆ど違いが分からんし,ハイフンマイナス以外はどうやって入力するのかも分からない。
どうも生成 AI は使い分けてるみたいなんだが,見た目がみんな同じなのでこれはこれで困るんだよなぁ。
全角ダッシュの Unicode マッピング
日本語の文字コード(JIS X 0208 および JIS X 0213)にはいわゆる「全角ダッシュ」があるのだが Unicode では上述の “EM DASH” (U+2014) にマッピングされているそうな。 まぁ,これは真っ当だろう。
しかし一時期,この全角ダッシュを U+2015 (HORIZONTAL BAR) にマッピングしていた時期があったらしい。 これは後に訂正されたようだが,古い処理系だとシフトJISの全角ダッシュ(8160H)を U+2015 に変換したりする場合もあるんだとか。
あと和文の倍角ダッシュに U+2015 を並べて使う場合もあるみたいで,簡単な話ではないっぽい。
波ダッシュと全角チルダ
似たような話に和文の「波ダッシュ」と「全角チルダ」がある。
| 字形 | コードポイント | 名前 |
|---|---|---|
| 〜 | U+301C |
WAVE DASH |
| ~ | U+FF5E |
FULLWIDTH TILDE |
このように見た目はそっくりなのだが Unicode 7.0 までは波ダッシュの字形が異なっていたらしい。 この辺は以下が参考になるだろうか。
字形に関しては Unicode 8.0 で修正されているのだが, Windows の IME では今だに「から」を変換すると全角チルダのほうが候補に上がるため,波ダッシュであるべきところが全角チルダになってしまうことがあるようだ。 見た目いっしょだし,分からんよね(笑)
文字コードはホンマ面倒くさい。
参考
- [改訂第9版]LaTeX美文書作成入門
- 奥村 晴彦 (著), 黒木 裕介 (著)
- 技術評論社 2023-12-09 (Release 2023-12-09)
- 単行本(ソフトカバー)
- 4297138891 (ASIN), 9784297138899 (EAN), 4297138891 (ISBN)
- 評価
2023年末に出てるのに気が付かなかった orz 今回は版元で PDF 版を買った。

