仮名文字を整理してみる

no extension

前回の記事でせっかく使える仮名文字が増えたので,この記事ではちょっと真面目に整理してみることにする。 なお Unicode で表される仮名文字については「Unicode のカタカナを調べる」を参照のこと。

五十音

まずは基本の五十音から。 ひらがなとカタカナを併記している。 ちなみに「ん」は撥音 (はつおん) で,それ以外を直音 (ちょくおん) と呼ぶ。

あ ア い イ う ウ え エ お オ
か カ き キ く ク け ケ こ コ
さ サ し シ す ス せ セ そ ソ
た タ ち チ つ ツ て テ と ト
な ナ に ニ ぬ ヌ ね ネ の ノ
は ハ ひ ヒ ふ フ へ ヘ ほ ホ
ま マ み ミ む ム め メ も モ
や ヤ (  𛄠) ゆ ユ (𛀁 𛄡) よ ヨ
ら ラ り リ る ル れ レ ろ ロ
わ ワ (ゐ ヰ) (𛄟 𛄢) (ゑ ヱ) を ヲ
ん ン
  • 括弧でくくっている文字は現代仮名遣いで定義されていない文字である
  • や行い段のひらがなを変体仮名の「𛀆 (U+1B006)」で表すこともあるらしい(ホンマ?)
  • 「𛀁」は変体仮名の「え(江)」としても定義されている
  • わ行う段のひらがなは Unicode のコードポイント U+1B11F で定義されているが表示できない環境が多いかもしれない(私の環境でも見れない)

半角カナ文字

以下は半角カナ文字で表した五十音である。

ソ

半角カナはだいぶ廃れてきた気がするが,たまにあるんだよなぁ…

丸囲み文字

Unicode ではカタカナの丸囲み文字が定義されている。 以下に示す。

濁音・半濁音

Unicode には (だく) 点および半濁点のコードが定義されているため任意の基底文字と組み合わせることが可能だが(見た目として無理ぽいものも多いが),ここでは事前合成形として定義されているもののみ示す。

(ゔ ヴ)
が ガ ぎ ギ ぐ グ げ ゲ ご ゴ
ざ ザ じ ジ ず ズ ぜ ゼ ぞ ゾ
だ ダ ぢ ヂ づ ズ で デ ど ド
ば バ び ビ ぶ ブ べ ベ ぼ ボ
(  ヷ) (  ヸ) (  ヹ) (  ヺ)
ぱ パ ぴ ピ ぷ プ ぺ ペ ぽ ポ

括弧でくくっている文字は現代仮名遣いで定義されていない文字である。 ワ行の濁音って何に使うんだ?

なお Unicode の濁点・半濁点は結合文字を含めいくつかのコードがある。

コード 文字 名称
U+3099  ゙ 濁点(結合文字)
U+309B  ゛ 濁点(全角)
U+FF9E  ゙ 濁点(半角)
U+309A  ゚ 半濁点(結合文字)
U+309C  ゜ 半濁点(全角)
U+FF9F  ゚ 半濁点(半角)

小書き文字

(よう) 音(きゃきゅきょ など)や (そく) 音(っ)などを表す際に使う小書き文字であるが Unicode では他にもやたらと定義されている印象。

ぁ ァ ぃ ィ ぅ ゥ ぇ ェ ぉ ォ
ゕ ヵ   ㇰ ゖ ヶ 𛄲 𛅕
  ㇱ   ㇲ
っ ッ   ㇳ
  ㇴ
  ㇵ   ㇶ   ㇷ   ㇸ   ㇹ
  ㇺ
ゃ ャ ゅ ュ ょ ョ
  ㇻ   ㇼ   ㇽ   ㇾ   ㇿ
ゎ ヮ 𛅐 𛅤 𛅑 𛅥 𛅒 𛅦
  𛅧

以下の文字は表示できない環境が多いかもしれない(私の環境でも見れない)。

  • U+1B132 は小書きの「こ」で U+1B155 は小書きの「コ」
  • U+1B150, U+1B151, U+1B152 はそれぞれ小書きの「ゐ」「ゑ」「を」
  • U+1B164, U+1B165, U+1B166 はそれぞれ小書きの「ヰ」「ヱ」「ヲ」
  • U+1B167 は小書きの「ン」。ちなみに小書きの「ん」はプロポーザルが通らなかったらしい

小書きの「ぁぃぅぇぉ」は長音として使う感じかな? わ行の小書き文字って何に使うんだ? カタカナの小書き文字しか定義されてないのはアイヌ語の仮名表現らしい。 ここまで定義されてるのなら全部の仮名文字に小書きを用意しろよって感じではある。

なお現代仮名遣いで拗音は以下が定義されてる。

きゃ キャ きゅ キュ きょ キョ
しゃ シャ しゅ シュ しょ ショ
ちゃ チャ ちゅ チュ ちょ チョ
にゃ ニャ にゅ ニュ にょ ニョ
ひゃ ヒャ ひゅ ヒュ ひょ ヒョ
みゃ ミャ みゅ ミュ みょ ミョ
りゃ リャ りゅ リュ りょ リョ
ぎゃ ギャ ぎゅ ギュ ぎょ ギョ
じゃ ジャ じゅ ジュ じょ ジョ
ぢゃ ヂャ ぢゅ ヂュ ぢょ ヂョ
びゃ ビャ びゅ ビュ びょ ビョ
ぴゃ ピャ ぴゅ ピュ ぴょ ピョ

記号類

長音記号

コード 文字 名称
U+30FC 長音記号
U+FF70 長音記号(半角)

現代仮名遣いでは, (ちょう) 音の表現は「おかあさん」「ちょうちょう(蝶々)」のように あいうえお の母音を重ねるとあるが,カタカナでは長音記号(ー)を使うことが多い(「コンピューター」など)。 まぁ,ここのブログみたいに形式張った文章でなければ,ひらがなでも長音記号を使うけど。

余談だが,仮名からローマ字に変換するパッケージをつくっていたときに,ヘボン式では長音を無視するのだが,仮名文字の綴りから長音かどうかを機械的に判断するのが難しく諦めた覚えがある。

繰り返し記号

コード 文字 名称
U+309D ひらがな繰り返し記号
U+309E ひらがな繰り返し記号(濁点)
U+30FD カタカナ繰り返し記号
U+30FE カタカナ繰り返し記号(濁点)

繰り返し記号は他にも色々あるが Unicode で仮名文字として分類されているものを挙げた。 最近ではあまり見ない気がするが固有名詞では使われていることがある。

合略仮名

合略仮名 (ごうりゃくがな) は仮名文字の合字を略した文字らしい。 仮名文字として登録されているのは以下の通り。

コード 文字 読み
U+309F より
U+30FF コト

以下は何故か CJK 統合漢字の拡張として登録されているらしいが,表示できない環境が多いかもしれない(私の環境でも見れない)。

コード 文字 読み
U+2CF02 𬼂 なり
U+2A708 𪜈 トモ
U+2CF00 𬼀 シテ
U+2CEFF 𬻿 ナリ

その他の合字

Unicode では「㌀」「㌖」のように単語や単位を表す合字の仮名文字が定義されている。 おそらく汎用機時代の名残だと思うが,今でもときどき見かける。 以下に示すが,多いよ!

コード 文字 読み
U+1F200 🈀 ほか
U+3300 アパート
U+3301 アルファ
U+3302 アンペア
U+3303 アール
U+3304 イニング
U+3305 インチ
U+3306 ウォン
U+3307 エスクード
U+3308 エーカー
U+3309 オンス
U+330A オーム
U+330B カイリ
U+330C カラット
U+330D カロリー
U+330E ガロン
U+330F ガンマ
U+3310 ギガ
U+3311 ギニー
U+3312 キュリー
U+3313 ギルダー
U+3314 キロ
U+3315 キログラム
U+3316 キロメートル
U+3317 キロワット
U+3318 グラム
U+3319 グラムトン
U+331A クルゼイロ
U+331B クローネ
U+331C ケース
U+331D コルナ
U+331E コーポ
U+331F サイクル
U+3320 サンチーム
U+3321 シリング
U+3322 センチ
U+3323 セント
U+3324 ダース
U+3325 デシ
U+3326 ドル
U+3327 トン
U+3328 ナノ
U+3329 ノット
U+332A ハイツ
U+332B パーセント
U+332C パーツ
U+332D バーレル
U+332E ピアストル
U+332F ピクル
U+3330 ピコ
U+3331 ビル
U+3332 ファラッド
U+3333 フィート
U+3334 ブッシェル
U+3335 フラン
U+3336 ヘクタール
U+3337 ペソ
U+3338 ペニヒ
U+3339 ヘルツ
U+333A ペンス
U+333B ページ
U+333C ベータ
U+333D ポイント
U+333E ボルト
U+333F ホン
U+3340 ポンド
U+3341 ホール
U+3342 ホーン
U+3343 マイクロ
U+3344 マイル
U+3345 マッハ
U+3346 マルク
U+3347 マンション
U+3348 ミクロン
U+3349 ミリ
U+334A ミリバール
U+334B メガ
U+334C メガトン
U+334D メートル
U+334E ヤード
U+334F ヤール
U+3350 ユアン
U+3351 リットル
U+3352 リラ
U+3353 ルピー
U+3354 ルーブル
U+3355 レム
U+3356 レントゲン
U+3357 ワット

仮名文字ではないが近年だと元号の令和の合字「㋿」が追加されたことが話題になった。

個人的にはちょっと勘弁してほしいところであるが,しょうがないのかねぇ。

その他

  • U+1AFF0 から U+1AFFE までは声調記号として定義されているが,これは日本統治時代の台湾における台湾語仮名で使われたものらしい

仮名は意外と面倒くさかった

変体仮名一覧を作って,今回仮名文字を整理してみて思ったが,仮名文字って突き詰めて見ると意外と面倒くさいよな。 変体仮名が廃止になったのは1900年(明治33年)だそうだが,それまでアホのように異体字や合字(のようなもの)があったんだろう? さらに「現代仮名遣い」として仮名による表現が整理されたのが敗戦直後の1946年(昭和21年)だ。 今 Unicode に登録されている(変体文字を含む)仮名文字に限っても,私は使いこなせる自信がない。 大昔の人のように未整理で混沌とした文字と文章を手書きして(他人が書いた文章を)読むとか無理無理。

私が戦前に生まれてたら一生水呑み百姓だわ。 つくづく今の時代は文字が整理され符号化されデジタル化されててよかったと思うよ。 スマホで日本語のニュースが読めて Web 連載小説や漫画が読めるって実は凄いことなんだな。