倉頡入力法入門


  1. 倉頡コード表
    倉頡入力法の説明は下に書きますが、まずはコード表です。
    キー字母輔助字形・解説
    A
    日およびその変形。横倒しを含む
    B
    月、冂およびその変形。(「受」の上もこれ)
    C
    八、その上下逆(「前」の上のテンテン)、儿
    D
    木(十にハネなど何か要素のついたもの)
    E
    水、サンズイ、その変形
    F
    火、四(三)つ点、小、その変形
    G
    土、士のような形(士そのものを除く)
    H
    別名「斜」。右上から左下へ払う字形
    I
    別名「點」。点および广、ム
    J
    別名「交」。横と縦が直交する字形およびウカンムリ
    K
    別名「叉」。横と縦が斜めに交差する字形およびヤマイダレ
    L
    別名「縦」。縦画およびコロモヘン
    M
    別名「横」。横画、厂、工
    N
    別名「鈎」。カギ形のもの。
    O
    人およびイの変形。「家」の右側を含む
    P
    心、リッシンベンの変形、ヒの変形
    Q
    手、テヘン、縦画が複数の横画を貫くもの
    R
    口。くにがまえ(囗)を除く。
    S
    別名「側」。左開き、右開きの形。
    T廿
    別名「并(並)」。くさかんむりおよび横画が複数の縦画を貫くもの
    U
    別名「仰」。山、上開きの字形。
    V
    別名「紐」。「く」の変形。
    W
    別名「方」。囗のような字(クチを除く)
    Y
    点と縦、点と横、点と点、シンニョウ



  2. 倉頡とは?
     漢字をキーボードから入力する方法といえば、日本人には「かな漢字変換」のように発音を入力して変換するのが普通なので、中国語でもやはりピンインや注音字母を入力して変換するのが楽だろうと思います。実際にそういう入力法もあるのですが、意外に中国人は発音からの変換を好みません。理由は、
    1. 発音がわからない……漢字の字数は多いので中国人ですら発音がわからない字は多数あります。
    2. 北京語の発音がわからない……中国には方言が多いので、北京語が話せないとか、話せるけど苦手という人は多数います。
    3. 発音はわかるけどピンイン(注音字母)は苦手……われわれは日常的にかなを併用していますが、中国人は日常的には漢字しか使わず、ピンインや注音字母は小学校時代にやったきりでうろ覚えという人がほとんどです。仮に正しく発音していても、それを字で書けるかどうかというのは別です。われわれだって、「十日」は「とおか」か「とうか」かといわれたら、正しく「十日」と発音できているのに、ふだんは漢字でしか書かないだけに迷うでしょう? そんなもんです。
    というわけで、中国人は字形による入力を好みます。
     とはいえ漢字の数は膨大、Unicodeに収録されたものだけでも20902字もあります。20902個のキーをもつキーボードなど作れませんから、漢字1字をいくつかの要素に分解し、その要素をキーボードに割り当てて入力するというのが字形入力の方法です。その際求められるのは、
    1. 習得がラク……覚えることが多すぎるのでは特定の人しか使えません。せめて四角号碼程度にわかりやすいものが望ましいところです。
    2. キーストロークが少ない……1字を入力するのに10打も必要というのではスピードの向上は望めません。
    3. 英字キーを使う……数字だけであれば手がテンキーまたはキーボード最上段のところばかりを動くことになりスピードの向上は望めません。かといって英字と数字の両方を使うのでは手がホームポジションを離れてしまい、タッチタイピングにはつらいものがあります(まさにこれが日本語のカナ入力への不満としてあげられていることです)。英字部分のみを使うというのが理想です。
    4. 同じコードになってしまう字を最小限にする……同じコードになってしまう字が多すぎると、日本の仮名漢字変換のように「候補から選ぶ」という作業が必要になります。日本語と違って中国語は漢字ばかりなので、これを一字一字やるというのでは大変です。
    というところでしょう。
     漢字を字形によってコード化するといえば、四角号碼が広まっていますが、索引などには向いている四角号碼もキーボード入力法としては不適当です。上記の基準に照らし合わせると、「習得がラク」は合格、四角号碼は1字を数字5桁でコード化するので「キーストロークが少ない」も合格、ただし数字のみなので「英字キーを使う」は不合格、同じコードになってしまう字が多すぎるので最後も不合格です。
     数多くある字形入力法のうち一番広まっているのは、朱邦復という人が70年代に開発した「倉頡輸入法」という方法です。「輸入」というのはもちろん日本語の意味ではなく中国語の意味、つまり入力という意味なので、以下は「倉頡入力(法)」と記します。
     右はiPhoneなどiOSに入っている倉頡入力キーボードですが、ごらんのように、英字のA~Zの26個のキーに「手、田、水…」という字母が割り当てられています。実際はZの「重」は使われておらず、Xの「難」も使い方が特殊なので24種類です。現実の漢字をかなり強引にこれら24種類の要素に分解して入力し、IMEの力で組み上げて入力しようというのが倉頡入力法です。後述のような工夫をこらして、最大5打で漢字を入力することができます。
     理論的には大陸の簡化字(簡体字)や日本漢字も入力できるはずですが、現実のIMEはそれらにしっかり対応しておらず、実質的には繁体字入力専門と考えるべきです。
     この倉頡輸入法を上記基準で採点してみましょう。四角号碼よりは習得は難しいものがありますが、他の方式よりはラクといえるかもしれません。キーストロークは1字6打以内(コードとしては最大5打ですが確定のためのスペースで6打になります)、英字キーしか使用しません(Zは未使用)し、同コードになる字はほとんどありません。4つの基準すべて合格です。そんなわけで台湾や香港では標準的な入力法となっており、倉頡輸入法に基づく字母が記されたキーボードも一般的に使用されています。
     「倉頡」Cāng Jié というのは中国の伝説で漢字の創始者とされる人の名です。「頡」にはxiéという音もありますが、jiéのほうで読みます。実は日本漢字音でも「頡」にはケツ以外にキツだのカツだのいろいろ音がありますが、「そうけつ」と読むのが一般的のようです。また人名としての倉頡は「蒼頡」とも書かれます(「蒼」のほうが普通かもしれません)が、入力法の名としては「倉頡」です。




  3. 倉頡を使ってみよう
     倉頡入力IMEは実は身近に存在します。あなたのお使いのパソコンがWindows XPならばもう入っているのですよ。ただし最初だけはおまじないが必要です。IMEのツールバーを右クリックして「設定」をクリック、「テキストサービスと入力言語」というウインドウが現れます。ここで「追加」をクリック、「入力言語」として「中国語(台湾)」を選び、その下の「キーボードレイアウト/入力システム」から「ChangJie」または「New ChangJie」を選びます。これで準備OK。あとは倉頡入力をしたくなったら、IMEツールバーのJPをクリックして「中国語(台湾)」を選ぶだけです。もうすでに「中国語(台湾)」の下に他の入力システム(たとえばPhonetic=注音字母漢字変換)をインストールしているなら、CHの右側のキーボードアイコンをクリックすれば変更することができます。なお、Propatiesで漢字コードを選ぶことができ、Unicodeの CJK unified Ideographs Extension BやHKSCSを含む設定にすると、入力できる漢字が増えるようです。→Windowsの倉頡輸入法の導入@水無の瀬川
     Macでは「システム環境設定」-「言語とテキスト」で、「使用する入力ソース」の「中国語-繁体字」「倉頡」を選びます。
     iPadやiPhoneならば、「設定」の「一般」-「キーボード」-「キーボード」-「新しいキーボードを追加」で「中国語-繁体字 倉頡」を選びます。あとは入力のときに左下の地球儀マークで切り替えます(右がスクリーンショットです)。
     当サイトのWEB支那漢では四角号碼検索と同様に倉頡コードによる検索をサポートしていますが、実はこれは無意味です。なぜならそんなことをせず、いきなり「字」のところに倉頡IMEで入力すればいいのですから。ではどうして無意味な機能をつけたかというと、むしろ倉頡チュートリアルのためです。倉頡IMEはIE4のグローバルIMEにもすでに入っていましたが、ヘルプの中に入力法が書かれていなかったため、多くの日本人はどう使っていいか全く分からなかったのではないでしょうか。倉頡は字形入力法の中では比較的簡単とはいえ、字の要素分解の方法を習得するまでにはけっこう練習が必要です。そのために有効なのは、既知の字がどういう要素に分解されるかを知ることです。WEB支那漢では検索データ内に四角号碼同様に倉頡コードを記していますので、倉頡の練習には非常に役に立つことでしょう。



  4. 入力法
     倉頡入力法について説明したページには次のようなものがあります。
    1. Wikipedia(日本) - 倉頡輸入法
    2. Wikipedia(中文) - 倉頡輸入法
    3. 朱邦復工作室第五代倉頡輸入法手冊
    4. 倉頡之友(マレーシア)
    5. 倉頡之友(香港)
     倉頡入力法はおおむね筆順のとおり、つまり左→右、上→下、外→内に、漢字を上記の倉頡字母に分解して入力するのです。
     上記の倉頡字母そのものの字なら全く問題ありません。
       日=A(日)、月=B(月)、土=G(土)
     また、上記の倉頡字母を単純に組み合わせた字なら、その順序に入力するだけです。
       明=AB[日月]、士=JM[十一]、晶=AAA[日日日]、天=MK[一大]
     しかしこれでは、画数の多い字は、数多くの倉頡字母に分解しなければ入力できず大変です。
     そこでズルをします。倉頡入力法では、最大の倉頡字母を5とし、6つ以上の倉頡字母に分解しなければいけない文字は、その途中をとばすのです。
     しかし、どうとばしてもいいというわけではありません。とばし方に規則があるのです。この規則を覚えるのに最初はずいぶんまごつくでしょうが、以上のように考えれば、倉頡入力法も恐るるに足らずというものです。
     そのとばし方の規則とは、
    1.字を大きく左→右または上→下または外→内に2つに分解し、字首、字身と名付ける。
    2.字首は1つないし2つの倉頡字母に分解して取る。3つ以上になってしまうものは最初と最後だけを取る。
    3.字身は1~3つの倉頡字母に分解して取る。4つ以上になってしまうものは……
     a.字身をさらに字首、字身に分け、
     b.字首から1つ取る。
     c.字身から1つないし2つ(最初と最後)取る。
    4.字首と字身に分解できないような字は最大4つで取る。5つ以上になってしまうものは、1、2、3、最後を取る。
    5.特に分解しにくいいくつかの字は、分解しにくい部分を「X[難]」とする。ただし倉頡のシステムが難しいとあなたが思ったときになんでもかんでもXにできるわけじゃありません。Xを使うものは限られているので丸暗記したほうが早いです。
    6.倉頡Ver5では、コードが同一になってしまう文字をイッパツで出すためにXを使うことがあります。たとえば「景」と「晾」はどちらもAYRF[日卜口火]になるので「晾」のほうをXAYRFにするという具合です。これも出てきたら覚えるしかありませんが、実際にはほとんど用いられておりません。
    というものです。詳しくは上記朱邦復工作室に公開されている「第五代倉頡輸入法手冊」をご覧ください。そして、具体的にどう取っているかを、WEB支那漢で検索しながら、コツをつかんでください。
     当サイトにも倉頡チュートリアルのコーナーを作っています。



  5. 当サイトの倉頡コードについて
     当サイトのWEB支那漢で用いている倉頡コードは、朱邦復工作室に公開されている「第五代倉頡輸入法手冊」に基づいています。が、これに掲載されているコード表にいろいろ間違いがある(特にHTML版は入力ミスが多い)うえ、現実にこれに完全準拠したIMEは存在せず、特に、コードが同一になってしまうものをXで区別する流儀は用いられていません。そこで、現実にWindowsなりiOSなりの倉頡入力で検証して修正しております。
     データは大文字になっていますが小文字でも、また「日、月…」という倉頡字母でもOKです。
     検索は完全一致で行います。先頭一致ではありません。先頭一致ではA(日)のような短い倉頡コードの場合、AA(昌)、AAA(晶)、ABME(暖)…など無数の字にヒットしてしまうからです。そのかわり?(任意の1文字と合致)、*(任意の1文字以上数文字に合致)というワイルドカードが使えるので、途中が不明のものは適宜ワイルドカードを利用してください。