« ガラス化法により低温保存してから生き返らせた線虫は過去の記憶をもっている。 | トップページ | waifu2xを手軽に使えるユーザーインターフェイスが登場 »

2015年5月26日 (火)

深層ニューラルネットで画像からテキストキャプション生成のデモをトロント大が公開

Deepnet_swing

Nitish Srivastavaさんというトロント大の博士課程の学生さんが深層ニューラルネットをつかった機械学習で画像から自動で説明書きのテキストを生成するというデモを公開しています。

画像を適当にクリックするとトレーニングセットのテキストから一番近い文章、いくつかの自動生成されたキャプションのテキストがでてきます。

説明書きと写真の大量のセットがあればこれくらい可能なのはわりと今では普通かもしれませんが、わりとまともな英語の文章でキャプションが生成されるのがすごいですね。俺の英語よりうまい(;ω;)。

画像を検索するときとか、こういうアルゴリズムで自動でタグをつけたりできるととてもいいですね。グロ系とかを効果的に除外するフィルターとか作れそうです。

おそらくdeepnetという彼が作ったPythonベースでGPUを使用した機械学習のライブラリーをつかったデモなんだと思います。実際のコードを全部公開してくれるといいんだけど、こういうのってIEEEとかで論文にしてアルゴリズムを数式で書いて、図にちょこっと結果を載せて終りなんだよなぁ。

とはいえ、CaffeとかTheanoとかTorchとか、有名なライブラリが出揃っているなか、こういう独自ライブラリはユーザー獲得は難しそう。

自分で似たようなことをしてみたいと思ったらば、PythonならTheanoというGPUもサポートしているライブラリーがオススメ。Deep Learning TutorialsというTheanoのデベロッパーの人たちが書いたチュートリアルがすごくよさそうです。

いつかTheanoで遊んでみたい。

追記。けっこう真面目に始めましたよ。

ウィンドウズでLasagne/nolearn/Theanoで深層畳み込みニューラルネットワークしてみる Theano用にCUDAができるお手ごろGPUを物色中。GTX-960が良さげ

« ガラス化法により低温保存してから生き返らせた線虫は過去の記憶をもっている。 | トップページ | waifu2xを手軽に使えるユーザーインターフェイスが登場 »

HackerNewsうぉっち」カテゴリの記事

ディープラーニング」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

トラックバック

« ガラス化法により低温保存してから生き返らせた線虫は過去の記憶をもっている。 | トップページ | waifu2xを手軽に使えるユーザーインターフェイスが登場 »

しろののツイッタータイムライン

  • ツイッターは5つ目も凍結されました。6つ目での復活も不可能。なのでnoteに注力しています。

    と思ったら、イーロン・マスクの買収が公になってアカウントが復活できました。ありがとうマスク。

    トランプ関連記事の一覧リスト

オススメたち

2024年12月
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31        

はてブ

無料ブログはココログ