ジャストシステムの勉強会 #JustTechTalk 01 「ことば」を扱うサービス・アプリの裏側

ジャストの勉強会へ行ってきました。
ちなみに、うどんの国からジャストの東京本社へは300キロで走る白い箱で4時間半ほどです。

この日は3本立てで、

  1. Shaping up ATOK to fit to your iPhone/iPad
  2. ぐるなびの検索の裏側
  3. ジャストシステムの形態素解析

について、それぞれ20分から40分程度お話をいただきました。


1. Shaping up ATOK to fit to your iPhone/iPad

ATOK forAndroid/ iOSの裏側の話でした。
ATOKの辞書ファイルやプログラムをAndroidに載せるために徹底的にデータ容量の削減を行った話、また、iOSに載せる上でメモリやGPUの使用制限がいかに厳しかったかのお話でした。

商用ソフトはただ動くだけではだめという現実、また、限られたリソースでの「いいプログラム」がいかに難しいかということを実感できる内容でした。

当日のスライドはこちらに上げてくださっています。

2. ぐるなびの検索の裏側

地域と食べたいものを選べばお食事処が探せるぐるなびの検索の話でした。
日本語のWebサイトを全文検索して、いかに漏れなく、ノイズなく結果を提示するかというところでの苦労をお話しいただきました。
店舗名にカタカナとひらがなが織り交ぜられていたり、記号が使われていたり、地名がかぶっていたりと、日本語の闇は非常に深いようです。

3. ジャストシステムの形態素解析技術

先述のぐるなびの内部でも使われている、ジャストシステムの形態素解析器「JMAT」の話でした。
これは、ATOKやConceptBaseといった、同社の日本語処理で培われた技術が使われているそう。
この内部の辞書は、コーパスは人力でメンテナンスし、その後統計処理、最後はやっぱり人力で作られているそうです。

当日のスライドはこちらに上げてくださっています。


 

本当は懇親会も行きたかったのですが、ホテルや飛行機が取れず、当日の夜行バスで帰ってしまいました。次回以降は懇親会も参加して、もうちょっと深い話も聞くことができればと思います。

2ヶ月に1回程度開催とのことですので、興味のある方はぜひ。

Doorkeeper

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください