[ホームリンク集&各種情報]

製品レビュー:今昔文字鏡単漢字16万字版

おまけで、今昔文字鏡Unicode Editionの試用レビューもあり

Since 2009/3/8 Last Updated


 以下の記述のうち、文字鏡研究会やエーアイ・ネットに対して批判・抗議をしている部分は、その後文字鏡研究会が問題となる偏狭な許諾条件を撤回したことにより、現在では意味がなくなりました。一度発表した文章なのでとりあえずそのまま掲載し続けますが、この点をご注意の上お読みください。
 なお、「終戦宣言」をもあわせてお読みください。

2010.7.21 真理子(青蛙亭主人 内)


  1. 製品概要
     「今昔文字鏡」については、「製品レビュー:今昔文字鏡単漢字15万字版」をご覧頂きたい。本製品はこれのアップグレードバージョンである。
     今昔文字鏡の製品版は、従来ずっと、紀伊國屋書店のブランドで発売されてきたが、紀伊國屋書店はもう今昔文字鏡から手をひいたらしい。16万字版は開発会社であるエーアイ・ネットが販売も手がけるようになった。だから今では今昔文字鏡製品版サイトを見ると、紀伊國屋書店ではなくエーアイ・ネットと表示されている。エーアイ・ネットはこの今昔文字鏡が唯一の取り扱い商品らしく、検索エンジンで出てくるエーアイ・ネットの製品サイトはこのhttp://www.mojikyo.co.jp/となっている。なお、昔日本語入力IMEのWXII(実はMS-IMEの原型)を開発、今ではOCRソフト「読んde!!ココ」などを開発・販売しているエーアイソフトとは無関係である。
     唯一の取り扱い商品の割に今回のバージョンアップでは同社はバタバタしていたようだ。バージョンアップのDMが来たのが1月下旬だが、製品の発送は2月末。しかもマニュアルはユーザー登録ハガキを出した人に後日発送ということらしい。
     バージョンアップは15万字版からのみならずどの版からも優待価格でできる。従来は直近バージョンからしかできなかったので、私のように一回バージョンアップをサボってしまうと、高価な(29800円)定価で買わざるを得なかったのだ。販売がエーアイ・ネットになってこの点は親切になったといえよう(15万字版を定価で買った私をどうしてくれる!!)。



  2. 過去バージョンとの共存
     従来、今昔文字鏡は過去のバージョンとの共存が可能であったが、今回の16万字版は、15万字版との共存が不可能である。16文字版をインストールすると有無を言わさず15万字版をアンインストールする。一方、それ以前のバージョンとは共存可能である。
     起動してみると、見た目は15万字版とほとんど見分けがつかない。実際のところ、16万字版は15万字版のマイナーアップグレードという性質のようである。
     そこで今回のレビューでは、16万字版で変更された点、追加された点を中心に書く。それ以外の機能は、「製品レビュー:今昔文字鏡単漢字15万字版」をご覧頂きたい。



  3. Unicode対応
     検索プログラムがUnicodeに対応したので、Unicodeに存在する文字ならばすべて、コピー&ペーストで検索キー欄に貼り付けて検索できるようになった。
     Unicodeの漢字は4E00~9FA5の領域に加え、「拡張漢字A領域」という3400~4DFFの領域がある。この部分はWindows XPでは正しく表示されず、XP上で動く今昔文字鏡の検索プログラムに貼り付けても「・」としか表示されないが、それでも正しく貼り付けられているので、検索をするとその文字を正常に検索できる。ともあれ、この部分を含めて、Unicodeに存在する字は貼り付けて検索できるのである。
     実はこのことはマニュアルにも、16万字版のチラシにも一切書かれていない。エーアイ・ネットはあまりこのことを重視していないのだろうか。
     しかし私に言わせれば、この点こそが今回のバージョンアップの最大の目玉であり、この点だけでも今回のバージョンは「買い」、絶対にバージョンアップすべきポイントだと思う。
     従来のバージョンの検索プログラムはUnicodeに対応しておらず、JIS第一・第二水準に存在する字しか入力できなかった。よって、中国語IMEなどを用いて字を入力することができなかった。いや、正確に言おう。一応Windows 2000/XP/Vista上ではUnicode未対応のプログラムでも中国語IMEは使える。だが、JIS第一・第二水準に入っていない文字は、入力したそばから?に変換されてしまい、入力ができないのだ。
     だから例えば「吧」を検索しようとすると、いちいち、「口」を検索して部品に指定し、「巴」を検索して部品に指定し(あるいは「琶」を検索して解字して「巴」部分を部品に指定し)、それから検索……などという方法をとるしかなかった。「吧」くらいならまだいいが、奇字難字の場合はほとんど絶望的であった。たとえば韓国人の姓のひとつ「裵」などは非常に検索が困難であった。いちいち「なべぶた」「衣」「非」なんて指定して検索した日には顔がひきつってしまう。こんなのは韓国語IMEで배を入力して変換すればイッパツなのに。
     中国語IMEでの入力はもちろん、たとえば中国語で書かれたWEBページや文書からコピー&ペーストしても?になってしまう。せっかくの漢字情報検索プログラムなのに、中国で使われている漢字をコピー&ペーストでそのまま検索できないというのはなんとももどかしかった。いま現に目の前にある「你」を指定するのに、どうして「仏」を解字してにんべんをとり、「小」を部品に指定して検索……なんてやんなきゃいけないの?
     それが今回のバージョンアップで一挙解決したのだ。中国語IMEなり韓国語IMEなり自由に使って入力できるし、現にある文字のコピー&ペーストが自由自在。この点だけでも一大進歩であり、やっと「日韓中の国境を越えたWeb時代の漢字検索ツール」になったといえよう。



  4. 康熙字典テキストデータ収録
     従来、別売の「康煕字典DVD-ROM」を購入して今昔文字鏡と連動させていたものが、今昔文字鏡だけで康煕字典を、しかもテキストデータとして参照でき、もちろんこれを他のアプリにコピー&ペーストすることができる。これで、テキストデータだけで済むのであれば、康煕字典DVD-ROMの購入は不要になった。29800円も出して康煕字典DVD-ROMを買った私は、手放しで喜べないところである。
     もちろん康煕字典DVD-ROMも引き続き使うことができるが、15万字版とのリンクの情報が16万字版にうまく引き継がれないようだ。改めて康煕字典.exeを起動し、「設定」-「今昔文字鏡との連携をセットアップする」で、16万字版ともリンクする。もっとも、テキストがあれば康煕字典DVD-ROMの画像情報は不要だろう。せいぜい、テキストに誤入力の疑義が生じたときの確かめに役立つ程度だから。
     また、15万字版から入った説文解字大徐本(一篆一行本)情報は16万字版でも健在だが、設文の篆書が表示されるようになった。説文はそもそも篆書辞典なのだから、これではじめて設文の情報がまともに表示されるようになったとも言える。



  5. 基本字形
     「文字の情報を見る」という機能の中で、その字の基本字形が何かを表示する機能。たとえば「仏」字であれば「佛」を表示するものである。
    実はこの機能は、その昔の「今昔文字鏡TTF版(8万字版)」には存在した(その次の「10万字版」にあったのかどうかは、私はこのバージョンを持っていないので不明)。文字情報欄に、その字の異体字・関連字がズラっと表示され、この字が基本時、この字は古字、この字は略字……などと表示していたのである。ところが15万字版ではこの機能がなくなってしまった。確かに関連字を検索する機能はあるが、それら関連字を一つ一つ開いて情報を見ないと、どれが基本字でどれが略字で……ということがわからないのである。この点が不便なので、私は従来の8万字版を共存させているほどだ。
     今回の16万字版でも従来の8万字版のような手軽な関連字情報一覧は復活しなかったが、そのかわり、その字の基本字が何であるかだけは表示されるようになり、少しはマシになった。



  6. 要望
     16万字版の検索プログラムの機能はすばらしいものであるが、それでもいくつか不満点があるので、気づいた点を列挙しておく。
    1. 24ドットフォントが汚い……「製品レビュー:今昔文字鏡単漢字15万字版」に書いたのと同様。24ドットおよび96ドットフォントについては、過去の製品ではWEB上に置かれたビットマップフォントを直リンする機能まであった(今でもWEB上にはそのフォントは残っているが製品からは直リン機能がなくなった)ほどなので、この2種類だけでもTruetypeフォントから自動作成するのではなく、人間がデザインしたフォントを用意してほしいところである。
    2. コード表示……8万字版時代にはJISやUnicode以外に韓国のKSコード、中国のGBコード、台湾のBig5コードを表示する機能があった。Unicode時代のいまどき、韓国・中国・台湾のローカルコードは不要なのかもしれないが、たまに参照したいことがあるのでできれば表示機能があるといい。また、Unicodeの表示にUTF-8形式があるといい。現実にCGIやアプリを作るときにはUnicodeそのものではなくUTF-8形式になっているのが普通だから。
    3. 日韓中台各国ローカルコードでの字形表示……これも8万字版時代にあったのに、今では削られてしまった便利な機能。Unicodeをはじめ、JIS、KS、GB、Big5では、細かな字形の違いを無視して同一のコードをわりあてているので、日本語Windows上のUnicodeで書いた文書が韓国・中国・台湾のWindowsで異なる字に見えることがある。たとえば「半」にはの2字形がある。いま、文語体の文章を書いていてできる限り旧字体を用いようとしているとする。当然「半」はを使いたい。そこで今昔文字鏡8万字版でを呼び出して情報画面を見ると、日中台は、韓はとなると表示される。そこで、日本のWindows上でUnicodeで書く限り、を書いてもになっちゃうんだな、中文簡体Windowsでもになっちゃうのは仕方ないとして、中文繁体Windowsでもになっちゃうのか、意外だな。ハングルWindowsだとになるのだな、ということが一目瞭然わかるのだ。しかしこの機能は、その後のバージョンでは削られてしまって今では見ることができない。少なくとも、JISでどうなるのかがわかる機能がほしい。今のままでは、の両方の文字情報を見て、「両方ともJISでは同じコードだから、今昔文字鏡のをテキストやUnicodeでコピーしてもになっちゃうんだろうな」ということを推測するしかなく、不便である。
      ※この項、次の「草の根ユーザに背を向けてきた今昔文字鏡の歩み」でもふれている、WEB上のビットマップデータを参照する機能を用いている。なお、バナー設置の義務はないことに注意してもらいたい。求められていないものは当方もやらないのでバナー設置はしない。
    4. 文字情報画面でのJIS以外の字の表示……文字情報画面では康煕字典や説文解字の説明をテキストで見ることができるのだが、JIS以外の文字は文字鏡番号になってしまう。これでは文字鏡番号で書かれている字がどういう字かわからず、その部分をいちいち調べなければならない。そういう部分は画像で表示してくれると便利である(できればUnicodeに存在するならUnicodeで表示してほしい)



  7. 草の根ユーザに背を向けてきた今昔文字鏡の歩み
     今昔文字鏡は数多くの漢字を扱える卓越した漢字情報処理のプラットフォームとして、これだけすばらしい機能を持っているのだから、普通ならば、さぞや多くのユーザーに支持され愛用されてきたと考えるのが当然である。
     しかし現実はそうではなかった。むしろ今昔文字鏡は、ユーザーから敬遠されそっぽを向かれてきたのだ。特に、文字コードを扱うアプリケーションやツールを作れるようなスキルのあるユーザーであればあるほど、「今昔文字鏡はおっかない。不用意に係わり合いを持たないほうがよい」と敬遠されてきたのである。
     その理由は、草の根ユーザーに背を向けてきた今昔文字鏡の歩みにある。今昔文字鏡の供給には開発元であるエーアイ・ネット、販売の紀伊國屋書店(今は撤退)、運営の文字鏡研究会という三者が関わっており、このうちのどこが犯人なのかはよくわからないし、おそらく三者とも同罪なのだろう。以下「今昔文字鏡は~を禁じてきた」のように、これら三者をまとめたものとして「今昔文字鏡」を人格化して表現させていただく。
     今昔文字鏡はその昔はフリーソフトだった。「製品レビュー:今昔文字鏡単漢字15万字版」に書いたように、製品版とは別にフリー版が存在したのである。少々高価な製品版を買えばすばらしい検索プログラムが入手できるのだが、いかんせん独自のコードである。そんなコードを用いて文書を書いても、他人が同じ製品を持っていなければ文字化けしてしまうのでは、「オレの文書を読むためにみんな今昔文字鏡を買ってくれ」というわけにもいくまいから、安心して使えない。しかし昔の今昔文字鏡にはフリー版が存在したので、相手に無料のフォントをインストールしてもらえば文字化けの心配はなかったのである。それでも大変だというのなら、フォントデータを埋め込んだPDFファイルを作ればよかったし、WEB上に一文字単位で字形のビットマップデータが公開されていたので、WEBサイトならばそのURLを直リンすれば、文字化けの心配なく今昔文字鏡の文字を使うことができた。最低これだけの手当てがなければ、独自コードを用いた文書なんか安心して作れなかったし、昔の今昔文字鏡はそれだけの手当てのある、非常にオープンな使いやすいシステムだったので、安心して使えたのである。当・初・は。
     しかし2000年ごろから、今昔文字鏡はフリーで使える機能をどんどん切り捨てる方向に進んでしまったのである。
     まず、フリー版フォントファイルの使用に関して非常に厳しい許諾条件をつけてきた。後述のように、今ではそもそもフォントファイルのダウンロードすら中止されてしまったのだが、許諾条件だけは今でも文字鏡研究会-フォントセンターのページに掲載されている。問題となる条件部分だけをくだけた言葉に直すと(オリジナルの表現はこのリンクで確認していただきたい)、
    1. お前らはオレたちのフォントを利用することしかできないんだよ(第3条3項)。
    2. コードやデータなどは秘密情報なんだ。そこまでお前らに使わせることを許した覚えはないよ(第3条4項)
    3. だから、独自の検索プログラムとか、Unicode←→文字鏡番号変換ツールみたいな、関連ツールを勝手に作っちゃダメだよ(第3条5項)
    4. 勝手に作られたツールは違法なモノだから誰も使っちゃダメだよ(第3条6項)
    5. コードテーブルなどを作るな。文字番号を書くのも許諾が必要だよ(第3条9項)
    6. 文字鏡番号1~49964は、大修館書店の大漢和辞典の番号と同じなんだけどさ、オレたちは大修館書店様のご厚意で許諾をとって使ってるんだ。だからお前らも大漢和辞典の番号を書くときは大修館書店様のクレジットを明記しろよ(第7条1項)
    7. 1~49964を文字鏡番号として書くのなら、当然オレたちのクレジットを明記しろよ(第7条2項)
    8. PDFファイルにフォントを埋め込んじゃダメだよ。(補足。およびこちら)文字番号を書くときはクレジットを明記せよ(第7条)
    という、あきれるほど法外な使用制限である。
     もちろんフォントファイルや検索プログラムをコピーしたり改変したりするのは違法である。しかしそういうことをせず、単に関連ツールを作ることは、誰も侵すことができない表現の自由である。さらに、著作物でも何でもない辞書の一連番号をあたかも許諾の必要な著作物であるかのように主張し、あまつさえ大修館書店とはなんら関係のない第三者である今昔文字鏡が、大修館書店になりかわって「許諾をとりな」という筋合いは全くない。
     が、今昔文字鏡のこの主張はかなり強硬だったらしい。「文字コードのあれこれ」ページの「今昔文字鏡」の項によれば、実際これによって、いくつかの草の根のユーティリティがつぶされてきたらしい(その実例が1~6のリンクになっていたが、今ではリンク切れ多数)。
     いくら使用許諾契約書に禁止条項を書いたとしても、それが日本国の法律に基づかない不当な主張であれば無効であり、いざ裁判になったとしても勝ち目はあろう。だが草の根ユーザは、この程度のことで法廷闘争をする気力も時間も資金力もない。そこでやむなく不当な主張に屈するわけである。要求が正当か不当かではなく、声が大きいかどうかで勝ちが決まるのである。
     このような経緯があったために、文字コードユーティリティの作者たちはどんどん今昔文字鏡に見切りをつけてきたのだ。たとえば 「通信用語の基礎知識」にも「今昔文字鏡には、不用意に関わり合いを持たない方が良い」と書いてあるとおりである。
     これに関連した事件として、かつてはBTRON(別名「超漢字」)というOSに今昔文字鏡がかかわっていたのだが、その後袂を分かったため、BTRONの漢字処理に大きな支障が残ったようである。そのことも上の「通信用語の基礎知識」に書いてある。
     さらに、15万字版発売とほぼ同時に、商用ライセンスのついた「インデックスフォント」という製品を作り、主として印刷業者を対象にした「インデックスフォント研究会」という組織を作った。
     そして、WEB上のビットマップデータを参照する製品から削除し(一応、旧製品のユーザのため、データ自体は残っている。上の「要望」のところで使っている通りである)、この機能を業者向けの有料サービス化した。
     さらに、フリー版フォントファイルやフリー版検索プログラムのダウンロードを中止した。現在フリー版(文字鏡研究会)のページからは現在、フォントも検索プログラムもダウンロードすることができない。「WebPageサーバを移転・再構築中」「完全な完了まで、1年間ほどを見込んでいます」「これに伴い、当面の間、mojikyo.orgからの全てのダウンロードサービスを中止させて頂きます」などという、全く理由にならないフザケた理由がサイトに書かれているが、実際には有料製品化の道をつきすすむために、邪魔になったフリー版を切り捨てたということで、たぶんもう永久にフリー版が復活することはないのだろう。
     このように、フリー版を切り捨て、異様に厳しい使用許諾条件をつけてきたというのが今までの流れであった。
     今昔文字鏡はまじめに漢字処理の新たなプラットフォームを目指しているのだろうか。もし目指すのなら、文字コードなどの情報をオープンにし、ユーティリティ作成をフリーにするのは当然である。Unicodeは当然そうであり、実際Unicode Inc.のページへ行けば、UnicodeとJISなどの対応表をフリーで入手することもできる。だから今までシフトJISなどでためてきたデータをUnicodeに変換することは、技術さえあれば誰でもできるし、またそのようなツールもさまざまなところで発表され、無料で使用することができる。それでこそみんな安心してUnicodeを使えるのだ。
     が、今昔文字鏡はそうではなかった。コードは秘密情報、書くならクレジット明記。ツールを勝手に作るな。これではUnicodeやシフトJISでためてきたデータを文字鏡番号に変換することもできない。こんな規格はバカバカしくて誰も使う気がしない。



  8. 厳しい使用許諾制限の撤廃
     上に紹介した異様に厳しい条件は、WEB上のフォントの利用に関するものであるが、製品版、たとえば15万字版についている使用許諾契約書も、表現こそ違え、同様の厳しい条件がついていた。
     しかし、今回の16万字版についている使用許諾契約書には、これらの条項がすべて消えており、単に「リバースエンジニアリングをするな」というごく当たり前の条項だけとなった。
     これは重大な(喜ばしい)方針転換なのか、それとも単なるバタバタ・ドタドタのせいでペラな契約書のみが来たのであり後日送られてくるというマニュアルには法外な禁止事項が書かれているのか、そのあたりの真相は不明である。
     しかし私はあえて前者であると解釈する。ともかく今回送られてきた製品には、コードを書くなだのツールを作るなだのという条件は一切書いていなかった。そのようなゆるい条件に同意して私は製品の梱包を解き、使用を始めたのである。後になって厳しい条件をつけてきたってそんなのは無効である。
     今回の16万字版を機に、今昔文字鏡関連のツールを作る道が開け、漢字情報処理のオープンなプラットフォームに今昔文字鏡が成長していくことを望みたい。



  9. 今昔文字鏡Unicode Edition
     「いや、今昔文字鏡のことだ。そんな方針転換は信じられない。単に許諾条件を書き忘れただけじゃないのか。恐いからやっぱりUnicodeだけを使いたい。Unicodeならツールを作るななどの制限はない」「仮に自由に使えたとしても、独自フォントをいっぱい使うシステムは重すぎ。Unicodeの範囲内でいいから、今昔文字鏡のあのすばらしい検索プログラムだけは使いたい」という向きには、Unicodeに限定した「今昔文字鏡Unicode Edition」という製品がある。Vectorからのダウンロード販売のみで試用もできる(と書いてあるが後述のように実は試用不可)。今昔文字鏡の検索プログラムは漢字入力にはとても便利なので、Unicodeの範囲内だけでも便利であろう。
     が、ここでもまた、いかにも今昔文字鏡らしい、トホホな話がある。この製品が登場したのは2008年8月なのだが、なんと今は、もう試用期間が切れており、ダウンロードしてインストールしてもまるっきり試用不可なのだ。Vectorのページにもエーアイ・ネットにも「試用可」といまだに書いているのに、これではウソつきである。
     ここで、どうしても今この製品を試用してみたい人に、裏ワザを伝授しよう。なお、これは、実際にはもう試用期限が過ぎたために一切試用できなくなっているにも関わらず、いまだにVectorのページやエーアイ・ネットのページに「試用可」と書き続けているエーアイ・ネットの欺瞞行為に対抗する非常手段であり、ユーザーの権利を守るためにやむを得ず公開する裏ワザであるから、クレームは無用である。
     試用期間が過ぎたかどうかは、単純にあなたのコンピュータのカレンダーを参照している。だからコンピュータシステムの日付を、2008年11月あたりに設定してみよう。これだけで試用が可能になる(笑)。
     そうやって強引に試用してみると、この検索プログラムは、15万字版を機能制限したものであることがわかる。なんと入力がUnicodeに対応していないのだ。検索キーの欄に、JISの範囲外の文字を貼り付けたり、中国語IMEや韓国語IMEでJIS範囲外の文字を入力しても、?になってしまってダメである。早い話が、上記「Unicode対応」で書いたような、16万字版バージョンアップの最大の目玉がないのである。
     いくらUnicodeを出力できたとしても、検索の入力がUnicodeに対応していないのでは不便で仕方がない。これでははっきり言って「今昔文字鏡Unicode Edition」は使い物にならないし、人にも勧められない。一刻も早く、Unicode EditionのUnicode対応を望みたい。ネット販売しかしていないのだから、すぐにでも出来ることだろう。



  10. 今昔文字鏡にかわるプラットフォーム
     「ほうら、やっぱり今昔文字鏡は信じられん。こんなもので漢字処理した日には将来が不安だ」という向きに、今昔文字鏡以外のプラットフォームを2つ紹介する。
     一つは、島根県立大学のeKanji(e漢字)。大漢和辞典や康煕字典などに収録された漢字の24ドットビットマップフォントを無償提供している。「島根県立大学e漢字フォント」であることを記すだけで自由に使うことができ、どこかの今昔文字鏡のように、PDFファイルに埋め込むには商用ライセンスが必要だの企画書を出せだの、文字番号の許諾を大修館書店から取れだのという愚かな主張を一切していない(当然だ!)ので安心して使える。
     もう一つは、今昔文字鏡と袂をわかったBTRONの開発元、東京大学多国語処理研究会。GT書体というフォントとコードブックを無償で入手できる。こういうものを利用する手もあるだろう。