Mozc UT Dictionary (Discontinued)

20161013

Mozc UT Dictionary (Discontinued)Default entriesOptional entriesLicenseDownloadInstall収録基準辞書の形式

Mozc UT2 Dictionary is here. Mozc NEologd UT Dictionary is here.

I lost a disk partition that includes tools for making mozc-ut dictionary. I used yahoo or google's "hit numbers" to sort words in mozc-ut1, but I can't do it again. They don't provide free fast search API now. I wrote mozc-ut2 from scratch.

Default entries

I modified these dictionaries.

and uncheck "Katakana to English conversion" in "Dictionary" tab.

My big thanks go to the authors/maintainers.

Optional entries

If you need this dictionary for human, check this page.

License

I think we can redistribute hatena's yomigana-hyouki pairs, but I can't believe we can redistribute niconico's pairs. If you want to make redistributable mozc-ut, don't uncomment #NICODIC="true" in generate-mozc-ut.sh.

Download

mozcdic-ut-20160905.tar.bz2

Install

Get official mozc source files.

Select optional dictionaries.

Open "generate-mozc-ut.sh". If you want to use an English-Japanese dictionary, uncomment the following line.

If you want to use a niconico dictionary, uncomment the following line.

Generate a mozc-ut dictionary.

You need ruby > 1.9.

Wait for a few minutes.

Build mozc-ut.

See mozc's official Build Instructions. If you are using Arch Linux (tested on Antergos Linux), you can make and install packages as follows:

収録基準

単語のヒット数を検索し、一定数以上ヒットしたものを収録しています。ヒット数以外にも各種の条件を設定して、収録単語を増やしつつもなるべくMozcの変換を壊さないよう気をつけています。人名はなるべく多く収録するため基準を甘めにしていますが、それ以外の単語は抑制的に収録しています。

辞書の形式

ヒット数は「キーボード」が75万件ヒットする場合の数値。例えば「冷蔵庫」が400万件ヒットして「キーボード」が150万件ヒットする場合、補正して200万件にする。得られるヒット数は時期によって差が激しいので、「マイナーな単語を除外する」という程度の効果しかありません。

HOME