« ガラス化法により低温保存してから生き返らせた線虫は過去の記憶をもっている。 | トップページ | waifu2xを手軽に使えるユーザーインターフェイスが登場 »

2015年5月26日 (火)

深層ニューラルネットで画像からテキストキャプション生成のデモをトロント大が公開

Deepnet_swing

Nitish Srivastavaさんというトロント大の博士課程の学生さんが深層ニューラルネットをつかった機械学習で画像から自動で説明書きのテキストを生成するというデモを公開しています。

画像を適当にクリックするとトレーニングセットのテキストから一番近い文章、いくつかの自動生成されたキャプションのテキストがでてきます。

説明書きと写真の大量のセットがあればこれくらい可能なのはわりと今では普通かもしれませんが、わりとまともな英語の文章でキャプションが生成されるのがすごいですね。俺の英語よりうまい(;ω;)。

画像を検索するときとか、こういうアルゴリズムで自動でタグをつけたりできるととてもいいですね。グロ系とかを効果的に除外するフィルターとか作れそうです。

おそらくdeepnetという彼が作ったPythonベースでGPUを使用した機械学習のライブラリーをつかったデモなんだと思います。実際のコードを全部公開してくれるといいんだけど、こういうのってIEEEとかで論文にしてアルゴリズムを数式で書いて、図にちょこっと結果を載せて終りなんだよなぁ。

とはいえ、CaffeとかTheanoとかTorchとか、有名なライブラリが出揃っているなか、こういう独自ライブラリはユーザー獲得は難しそう。

自分で似たようなことをしてみたいと思ったらば、PythonならTheanoというGPUもサポートしているライブラリーがオススメ。Deep Learning TutorialsというTheanoのデベロッパーの人たちが書いたチュートリアルがすごくよさそうです。

いつかTheanoで遊んでみたい。

追記。けっこう真面目に始めましたよ。

ウィンドウズでLasagne/nolearn/Theanoで深層畳み込みニューラルネットワークしてみる Theano用にCUDAができるお手ごろGPUを物色中。GTX-960が良さげ

« ガラス化法により低温保存してから生き返らせた線虫は過去の記憶をもっている。 | トップページ | waifu2xを手軽に使えるユーザーインターフェイスが登場 »

HackerNewsうぉっち」カテゴリの記事

ディープラーニング」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/1169291/60145051

この記事へのトラックバック一覧です: 深層ニューラルネットで画像からテキストキャプション生成のデモをトロント大が公開:

« ガラス化法により低温保存してから生き返らせた線虫は過去の記憶をもっている。 | トップページ | waifu2xを手軽に使えるユーザーインターフェイスが登場 »

広告欄


広告欄

Amazon

  • ブログ記事にした商品のアフィ

    デジピはヤマハが音質・キータッチとも一番良いです。

    レビュー記事かいた程おすすめのワイヤレススピーカー。

    安いタブレットとして買い替えに最適

    業務用あれな人向け。家でもキムワイプ

    速くKindle化して欲しい

    シネッセンス細胞関連の緑茶由来のサプリメント。

やっつけタイムライン

はてブ

人目の訪問です。

  • follow us in feedly

    かなり更新が不定期なため、RSSリーダーをオススメします。現在Feedlyに122人登録頂いています。多謝!RSSを表示

    ブログランキング用 にほんブログ村 IT技術ブログ Pythonへ ブログランキングならblogram

    当ブログはelementaryOSをちょっと応援しています。






    Jenny Mayhem
2018年3月
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
無料ブログはココログ

IT技術注目記事