メニュー

技術ブログ

Denso IT Lab.社員による技術情報の紹介

Denso IT Laboratory researcher's blog sites

数式

RSS

ページトップへ

SIGIR2013

日曜日にあったSIGIR2013勉強会で Retrieval Models and Ranking I のセクションを担当しました.
全部はさすがに読めていませんが...


その他の論文紹介は担当者の皆さんが以下にアップされています.
http://www.kde.cs.tsukuba.ac.jp/dbreading/?SIGIR2013

このエントリーをはてなブックマークに追加

RNNLM

うちの会社には新技術研究会という研究員がお互いに新しい技術を調査して発表しあう会議があるのですが,そこで最近話題のword2vecについて調べたことを報告しました.


デモは見せられないのですが,google code の word2vec のページから落とせる text8 というデータを使った”man king -> woman queen”の例と,毎日新聞コーパス2000年版をMeCabで形態素解析した上で,word2vecで学習したデータを使った,”会社 仕事 -> 学校 勉強”という関係をデモしてます。
文章だけからここまで学習できるのかと正直驚きました.

このエントリーをはてなブックマークに追加

Julia

はじめまして。

デンソーアイティーラボラトリの関川といいます。よろしくおねがいします。

9月1日から現在米国のボストンにあるMIT MEDIA LABにて9ヶ月の任期で研修をしています。来年の5月末までMITで行われている面白い研究などを紹介できたらと思います。

今回は、学生に「速いくていいよ」と教えてもらった「Julia」という数値計算ソフトの紹介をしたいと思います。
Juliaとは、Matlab、R、Octaveのような数値計算言語の一種です。

今回は、Juliaの大雑把な概要と、MacでのGUI環境のセットアップ方法について説明したいと思います。

すでにJuliaをインストールしている人は、MIT Open CoursewareのでJuliaを使った計算方法についてのチュートリアルが公開されているのでとても参考になります。

[概要]
まず、Juliaの特徴について。
Juliaの一番の特徴は「高速」な点だと思います。あと、フリーです。

公式のHPにも書いてありますが、インタプリタ言語にも関わらず、gccコンパイルしたコードに匹敵する速さが売りです。公式HPには処理によってはMatlabの数百倍とのベンチマークが乗っています。
速さの秘訣は、LLVMベースのJITコンパイラを使っている点と、言語設計そのものにあるようです。

MITの学生は在学中はMatlab本体と全てのツールボックスが無料で使える環境になっているようで授業でも使われていますが、一部の授業では、処理速度の観点からJuliaを使っているようです。

Juliaは新しい言語で、github上でオープンソースで開発されています。かなり活発にアップデートが行われています。

「高速」以外に私が気になった特徴が2点あります。

  1. Julia自体を共有ライブラリとしてビルドして、自分のプロジェクトから呼び出せる
  2. Cコードを直接呼び出せる

1点目は、自分作っているプログラムに簡単にJuliaの機能を取り込めるのでなんとなく便利な気がします。

2点目は、手持ちのライブリを使いたいときにわざわざラッパを書かなくていいので便利です。C関数の呼び出しは以下のようにします。

ccall( (:関数名, "ライブラリ名")
環境変数を取得する
path = ccall( (:getenv, "libc"), Ptr{Uint8}, (Ptr{Uint8},), "SHELL")
bytestring(path)

※Matlabにもcalllibという同様の関数があります。ただし呼び出す前にloadlibrary関数でライブラリをロードする必要があります。

[インストール]
試しにJulia本体とGUIフロントエンドIJuliaをインストールしてみました。
特にIJuliaのインストールでつまづいたので、その方法を共有したいと思います。

大まかな作業の順番は以下の2ステップです。

  1. Julia本体のインストール
  2. IJuliaのインストール

その1.Julia本体のインストール

ソースからコンパイルする方法もありますが、コンパイル済みのパッケージがここからダウンロードできるので、それを使う方が簡単です。(最新版を使いたい場合は自分でコンパイルする必要があります)

Ijuliaを使うためににはv0.2以上が必要なので”Version v0.2-pre (Pre-release)”をダウンロードしてください。ダウンロードしたら、/Applicationsにコピーするだけでインストール完了です。

ダブルクリックして起動するとこんな画面がでて、早速Juliaを使うことができます。

julia 起動画面

あとは、Matlabと似た文法で簡単に使えます。
SVDの例。

julia> A=rand(5,6)
julia> (u,s,v)=svd(A);

Juliaにはgitベースのパッケージ管理機能が組み込まれていて、簡単にパッケージの追加、アップデートなどが 行えます。パッケージの追加は以下のようにします。

Pck.add("パッケージ名")

ここに、いろいろなパッケージが公開されています。

その2.Juliaのインストール

Julia本体はCUIのプログラムで、GUIに慣れた人(私)にはちょっと敷居が高いです。そこで、JuliaをGUIから使えるようにするGUIアプリをインストールします。

JuliaのGUIフロントエンドエンドとして、ブラウザを使うiJuliaが公開されています。

インストールにつまづいて動かすのに2時間かかってしまったので私の行ったインストールステップを記載します。

    1. パッケージ管理ソフトのhomebrewをインストール
    2. Pythonを3.3.2にアップデート。ここからダウンロードして普通にインストール
    3. IPythonの最新版をインストール。ここの手順にしたがってインストール
    4. Pythonのパッケージ管理ソフトpipのインストール。
      python get-pip.py
    5.  Jinja2, Tornado, and pyzmq のインストール
      pip install jinja2 tornado pyzmq
    6. HomebrewパッケージをJuliaへ追加(注:Julia のコンソールで実行)
      julia>Pkg.add("IJulia")
    7. IjuliaパッケージをJuliaへ追加(注:Julia のコンソールで実行)
      julia>Pkg.add("IJulia")
    8. Ijuliaの起動
      ipython notebook --profile julia/

IJulia実行画面

 

こんな感じの画面が立ち上がって、GUIでスクリプトの管理や実行・停止などができます。図表の描画プラグインをいれれてプロットも簡単にできます。

ブラウザは、コマンドと実行結果をJulia本体とやりとりしているだけなので、Julia本体は別の高性能なマシンで動かして、リモートからコマンドを実行するっていうのも簡単にでできるそうです。(試してません)

試しに動かしてみた感想
速度については、大変な処理を走らせたわけではないので、正直あまり実感がありません。GUIもまだ使い方になれないせいかもしれませんが、Matlabのほうがだいぶ使いやすく感じました。

今後重い処理が必要になったときに再度試してみようとおもいます。

このエントリーをはてなブックマークに追加