英辞郎第四版買ってみた。emacsで使いたい。 導入編

前々から英辞郎欲しいなぁ。と、思っていたところ書店で目撃。購入してみた。しかし、Linuxな環境に生きる僕の選択としては間違いだったらしい。

はじめに書いておくと、emacs英辞郎を使おうと考えてる人はまだ購入前なら、テキスト形式で購入するほうが幸せになれると思います。*1

emacsにおける英辞郎活用

emacs上で英辞郎を活用する方法を調べた範囲でまとめてみる。

ツール 辞書データの形式 特徴(主観)
sdic sdic形式(テキスト) 手軽に使える
lookup JIS X 4081,eb,epwing sdicより高機能っぽい。他の辞書も一緒にひける。
pdicviewer for emacs pdic形式 そもそもうまく動かせなかった

pdicviewer for emacsはうまく動かすことができなかったので、sdicとlookupで使うことを考えます。ということでsdic形式とepwing形式のファイルをつくりたいと思います。

英辞郎第四版についてくる辞書データについて

英辞郎第四版についてくる辞書データはPDIC/UNICODEという形式のv6.10です。
結論から書くと、各形式に変換するためにwineを使ってPDICをインストールし、PDI1行テキスト形式に変換します。

以下のサイトあたりを参考にしてみるとよいです。epwingへの変換方法もかいてあります。
http://euda.cocolog-nifty.com/scosco/2008/09/ebview-4ca6.html

sdic形式への変換は次回につづく。 id:eiel:20090111
epwingは省略。



折角なのでここに行きつくまでに調べたことも残しておきます。


PDIC/UNICODEという形式は検索を最適化するために、バイナリ形式になっている模様です。第3版のときとはファイル構造が変わっているようで、第3版時代に使われてるツールは使えませんでした。やり方がわるいだけだったら申しわけないです。

ちなみにこの形式は仕様が公開されているようで、ワードファイルですが、
http://www.google.com/url?sa=t&source=web&ct=res&cd=3&url=http%3A%2F%2Fhomepage3.nifty.com%2FTaN%2Funicode%2Fpdicu-dic.doc&ei=L5VoSd6RLZDM6gPQlZzKBw&usg=AFQjCNG29VzVVpN5gx9nQI4wBnWx3SPC8w&sig2=YoEtAvjCOi6bur_msAl-5g
に記載されてます。

ちなみに、辞書のテキスト情報はBOCU1でエンコードされていて、楽にデコードするならCPANからEncode::BOCU1をつかうとよいです。

と、資料を参考にいろいろがんばって解析したのですが、僕の日曜プログラミング能力では荷が重いのであきらめました。

*1:正直、あたりまえじゃないかといわれそうですが、単に僕が通販とかあまり好きじゃないのです。