仮名文字を整理してみる
前回の記事でせっかく使える仮名文字が増えたので,この記事ではちょっと真面目に整理してみることにする。 なお Unicode で表される仮名文字については「Unicode のカタカナを調べる」を参照のこと。
五十音
まずは基本の五十音から。
ひらがなとカタカナを併記している。
ちなみに「ん」は
| あ ア | い イ | う ウ | え エ | お オ |
| か カ | き キ | く ク | け ケ | こ コ |
| さ サ | し シ | す ス | せ セ | そ ソ |
| た タ | ち チ | つ ツ | て テ | と ト |
| な ナ | に ニ | ぬ ヌ | ね ネ | の ノ |
| は ハ | ひ ヒ | ふ フ | へ ヘ | ほ ホ |
| ま マ | み ミ | む ム | め メ | も モ |
| や ヤ | ( 𛄠) | ゆ ユ | (𛀁 𛄡) | よ ヨ |
| ら ラ | り リ | る ル | れ レ | ろ ロ |
| わ ワ | (ゐ ヰ) | (𛄟 𛄢) | (ゑ ヱ) | を ヲ |
| ん ン |
- 括弧でくくっている文字は現代仮名遣いで定義されていない文字である
- や行い段のひらがなを変体仮名の「𛀆 (
U+1B006)」で表すこともあるらしい(ホンマ?) - 「𛀁」は変体仮名の「え(江)」としても定義されている
- わ行う段のひらがなは Unicode のコードポイント
U+1B11Fで定義されているが表示できない環境が多いかもしれない(私の環境でも見れない)
半角カナ文字
以下は半角カナ文字で表した五十音である。
| ア | イ | ウ | エ | オ |
| カ | キ | ク | ケ | コ |
| サ | シ | ス | セ | ソ |
| タ | チ | ツ | テ | ト |
| ナ | ニ | ヌ | ネ | ノ |
| ハ | ヒ | フ | ヘ | ホ |
| マ | ミ | ム | メ | モ |
| ヤ | ユ | ヨ | ||
| ラ | リ | ル | レ | ロ |
| ワ | ヲ | |||
| ン |
半角カナはだいぶ廃れてきた気がするが,たまにあるんだよなぁ…
丸囲み文字
Unicode ではカタカナの丸囲み文字が定義されている。 以下に示す。
| ㋐ | ㋑ | ㋒ | ㋓ | ㋔ |
| ㋕ | ㋖ | ㋗ | ㋘ | ㋙ |
| ㋚ | ㋛ | ㋜ | ㋝ | ㋞ |
| ㋟ | ㋠ | ㋡ | ㋢ | ㋣ |
| ㋤ | ㋥ | ㋦ | ㋧ | ㋨ |
| ㋩ | ㋪ | ㋫ | ㋬ | ㋭ |
| ㋮ | ㋯ | ㋰ | ㋱ | ㋲ |
| ㋳ | ㋴ | ㋵ | ||
| ㋶ | ㋷ | ㋸ | ㋹ | ㋺ |
| ㋻ | ㋼ | ㋽ | ㋾ |
濁音・半濁音
Unicode には
| (ゔ ヴ) | ||||
| が ガ | ぎ ギ | ぐ グ | げ ゲ | ご ゴ |
| ざ ザ | じ ジ | ず ズ | ぜ ゼ | ぞ ゾ |
| だ ダ | ぢ ヂ | づ ズ | で デ | ど ド |
| ば バ | び ビ | ぶ ブ | べ ベ | ぼ ボ |
| ( ヷ) | ( ヸ) | ( ヹ) | ( ヺ) | |
| ぱ パ | ぴ ピ | ぷ プ | ぺ ペ | ぽ ポ |
括弧でくくっている文字は現代仮名遣いで定義されていない文字である。 ワ行の濁音って何に使うんだ?
なお Unicode の濁点・半濁点は結合文字を含めいくつかのコードがある。
| コード | 文字 | 名称 |
|---|---|---|
U+3099 |
゙ | 濁点(結合文字) |
U+309B |
゛ | 濁点(全角) |
U+FF9E |
゙ | 濁点(半角) |
U+309A |
゚ | 半濁点(結合文字) |
U+309C |
゜ | 半濁点(全角) |
U+FF9F |
゚ | 半濁点(半角) |
小書き文字
| ぁ ァ | ぃ ィ | ぅ ゥ | ぇ ェ | ぉ ォ |
| ゕ ヵ | ㇰ | ゖ ヶ | 𛄲 𛅕 | |
| ㇱ | ㇲ | |||
| っ ッ | ㇳ | |||
| ㇴ | ||||
| ㇵ | ㇶ | ㇷ | ㇸ | ㇹ |
| ㇺ | ||||
| ゃ ャ | ゅ ュ | ょ ョ | ||
| ㇻ | ㇼ | ㇽ | ㇾ | ㇿ |
| ゎ ヮ | 𛅐 𛅤 | 𛅑 𛅥 | 𛅒 𛅦 | |
| 𛅧 |
以下の文字は表示できない環境が多いかもしれない(私の環境でも見れない)。
U+1B132は小書きの「こ」でU+1B155は小書きの「コ」U+1B150,U+1B151,U+1B152はそれぞれ小書きの「ゐ」「ゑ」「を」U+1B164,U+1B165,U+1B166はそれぞれ小書きの「ヰ」「ヱ」「ヲ」U+1B167は小書きの「ン」。ちなみに小書きの「ん」はプロポーザルが通らなかったらしい
小書きの「ぁぃぅぇぉ」は長音として使う感じかな? わ行の小書き文字って何に使うんだ? カタカナの小書き文字しか定義されてないのはアイヌ語の仮名表現らしい。 ここまで定義されてるのなら全部の仮名文字に小書きを用意しろよって感じではある。
なお現代仮名遣いで拗音は以下が定義されてる。
| きゃ キャ | きゅ キュ | きょ キョ |
| しゃ シャ | しゅ シュ | しょ ショ |
| ちゃ チャ | ちゅ チュ | ちょ チョ |
| にゃ ニャ | にゅ ニュ | にょ ニョ |
| ひゃ ヒャ | ひゅ ヒュ | ひょ ヒョ |
| みゃ ミャ | みゅ ミュ | みょ ミョ |
| りゃ リャ | りゅ リュ | りょ リョ |
| ぎゃ ギャ | ぎゅ ギュ | ぎょ ギョ |
| じゃ ジャ | じゅ ジュ | じょ ジョ |
| ぢゃ ヂャ | ぢゅ ヂュ | ぢょ ヂョ |
| びゃ ビャ | びゅ ビュ | びょ ビョ |
| ぴゃ ピャ | ぴゅ ピュ | ぴょ ピョ |
記号類
長音記号
| コード | 文字 | 名称 |
|---|---|---|
U+30FC |
ー | 長音記号 |
U+FF70 |
ー | 長音記号(半角) |
現代仮名遣いでは,
余談だが,仮名からローマ字に変換するパッケージをつくっていたときに,ヘボン式では長音を無視するのだが,仮名文字の綴りから長音かどうかを機械的に判断するのが難しく諦めた覚えがある。
繰り返し記号
| コード | 文字 | 名称 |
|---|---|---|
| U+309D | ゝ | ひらがな繰り返し記号 |
| U+309E | ゞ | ひらがな繰り返し記号(濁点) |
| U+30FD | ヽ | カタカナ繰り返し記号 |
| U+30FE | ヾ | カタカナ繰り返し記号(濁点) |
繰り返し記号は他にも色々あるが Unicode で仮名文字として分類されているものを挙げた。 最近ではあまり見ない気がするが固有名詞では使われていることがある。
合略仮名
| コード | 文字 | 読み |
|---|---|---|
U+309F |
ゟ | より |
U+30FF |
ヿ | コト |
以下は何故か CJK 統合漢字の拡張として登録されているらしいが,表示できない環境が多いかもしれない(私の環境でも見れない)。
| コード | 文字 | 読み |
|---|---|---|
U+2CF02 |
𬼂 | なり |
U+2A708 |
𪜈 | トモ |
U+2CF00 |
𬼀 | シテ |
U+2CEFF |
𬻿 | ナリ |
その他の合字
Unicode では「㌀」「㌖」のように単語や単位を表す合字の仮名文字が定義されている。 おそらく汎用機時代の名残だと思うが,今でもときどき見かける。 以下に示すが,多いよ!
| コード | 文字 | 読み |
|---|---|---|
U+1F200 |
🈀 | ほか |
U+3300 |
㌀ | アパート |
U+3301 |
㌁ | アルファ |
U+3302 |
㌂ | アンペア |
U+3303 |
㌃ | アール |
U+3304 |
㌄ | イニング |
U+3305 |
㌅ | インチ |
U+3306 |
㌆ | ウォン |
U+3307 |
㌇ | エスクード |
U+3308 |
㌈ | エーカー |
U+3309 |
㌉ | オンス |
U+330A |
㌊ | オーム |
U+330B |
㌋ | カイリ |
U+330C |
㌌ | カラット |
U+330D |
㌍ | カロリー |
U+330E |
㌎ | ガロン |
U+330F |
㌏ | ガンマ |
U+3310 |
㌐ | ギガ |
U+3311 |
㌑ | ギニー |
U+3312 |
㌒ | キュリー |
U+3313 |
㌓ | ギルダー |
U+3314 |
㌔ | キロ |
U+3315 |
㌕ | キログラム |
U+3316 |
㌖ | キロメートル |
U+3317 |
㌗ | キロワット |
U+3318 |
㌘ | グラム |
U+3319 |
㌙ | グラムトン |
U+331A |
㌚ | クルゼイロ |
U+331B |
㌛ | クローネ |
U+331C |
㌜ | ケース |
U+331D |
㌝ | コルナ |
U+331E |
㌞ | コーポ |
U+331F |
㌟ | サイクル |
U+3320 |
㌠ | サンチーム |
U+3321 |
㌡ | シリング |
U+3322 |
㌢ | センチ |
U+3323 |
㌣ | セント |
U+3324 |
㌤ | ダース |
U+3325 |
㌥ | デシ |
U+3326 |
㌦ | ドル |
U+3327 |
㌧ | トン |
U+3328 |
㌨ | ナノ |
U+3329 |
㌩ | ノット |
U+332A |
㌪ | ハイツ |
U+332B |
㌫ | パーセント |
U+332C |
㌬ | パーツ |
U+332D |
㌭ | バーレル |
U+332E |
㌮ | ピアストル |
U+332F |
㌯ | ピクル |
U+3330 |
㌰ | ピコ |
U+3331 |
㌱ | ビル |
U+3332 |
㌲ | ファラッド |
U+3333 |
㌳ | フィート |
U+3334 |
㌴ | ブッシェル |
U+3335 |
㌵ | フラン |
U+3336 |
㌶ | ヘクタール |
U+3337 |
㌷ | ペソ |
U+3338 |
㌸ | ペニヒ |
U+3339 |
㌹ | ヘルツ |
U+333A |
㌺ | ペンス |
U+333B |
㌻ | ページ |
U+333C |
㌼ | ベータ |
U+333D |
㌽ | ポイント |
U+333E |
㌾ | ボルト |
U+333F |
㌿ | ホン |
U+3340 |
㍀ | ポンド |
U+3341 |
㍁ | ホール |
U+3342 |
㍂ | ホーン |
U+3343 |
㍃ | マイクロ |
U+3344 |
㍄ | マイル |
U+3345 |
㍅ | マッハ |
U+3346 |
㍆ | マルク |
U+3347 |
㍇ | マンション |
U+3348 |
㍈ | ミクロン |
U+3349 |
㍉ | ミリ |
U+334A |
㍊ | ミリバール |
U+334B |
㍋ | メガ |
U+334C |
㍌ | メガトン |
U+334D |
㍍ | メートル |
U+334E |
㍎ | ヤード |
U+334F |
㍏ | ヤール |
U+3350 |
㍐ | ユアン |
U+3351 |
㍑ | リットル |
U+3352 |
㍒ | リラ |
U+3353 |
㍓ | ルピー |
U+3354 |
㍔ | ルーブル |
U+3355 |
㍕ | レム |
U+3356 |
㍖ | レントゲン |
U+3357 |
㍗ | ワット |
仮名文字ではないが近年だと元号の令和の合字「㋿」が追加されたことが話題になった。
個人的にはちょっと勘弁してほしいところであるが,しょうがないのかねぇ。
その他
U+1AFF0からU+1AFFEまでは声調記号として定義されているが,これは日本統治時代の台湾における台湾語仮名で使われたものらしい
仮名は意外と面倒くさかった
変体仮名一覧を作って,今回仮名文字を整理してみて思ったが,仮名文字って突き詰めて見ると意外と面倒くさいよな。 変体仮名が廃止になったのは1900年(明治33年)だそうだが,それまでアホのように異体字や合字(のようなもの)があったんだろう? さらに「現代仮名遣い」として仮名による表現が整理されたのが敗戦直後の1946年(昭和21年)だ。 今 Unicode に登録されている(変体文字を含む)仮名文字に限っても,私は使いこなせる自信がない。 大昔の人のように未整理で混沌とした文字と文章を手書きして(他人が書いた文章を)読むとか無理無理。
- 「江戸時代の日本人の識字率は世界イチ」という説は「嘘」だった…!882人調査から読み解く、日本の「知性格差」(佐藤 喬) | 現代ビジネス | 講談社
- 日本人の「2人に1人」は自分の名前さえ書けなかった…!?明治期時代の日本の「知的格差」驚きの実態(佐藤 喬) | 現代ビジネス | 講談社
私が戦前に生まれてたら一生水呑み百姓だわ。 つくづく今の時代は文字が整理され符号化されデジタル化されててよかったと思うよ。 スマホで日本語のニュースが読めて Web 連載小説や漫画が読めるって実は凄いことなんだな。
