メニュー

技術ブログ

Denso IT Lab.社員による技術情報の紹介

Denso IT Laboratory researcher's blog sites

数式

RSS

ページトップへ

【論文紹介】Looking to listen at the cocktail party a speaker-independent audio-visual model for speech separation

社内で論文「Looking to listen at the cocktail party a speaker-independent audio-visual model for speech separation」の紹介をしました。資料を掲載します。

論文ではは音声と画像を利用して複数人の音声+ノイズから目的とする音声を抜き出す手法について提案されています。

(googleの発表資料)
https://ai.googleblog.com/2018/04/looking-to-listen-audio-visual-speech.html

このエントリーをはてなブックマークに追加

codezineにpydata tokyoで実施したチュートリアルの内容について公開しました.

オーガナイザーを担当しているpydata tokyoで実施したチュートリアルの内容(タイタニックの生存者予測)をcodezineにて公開しました.

http://codezine.jp/article/detail/8636

かなり詳しく手法やアルゴリズム等をご紹介してあるので,pythonや機械学習をやったことが無い方も理解できる内容になっているかと思います.興味があればぜひ御覧ください.

このエントリーをはてなブックマークに追加

情報検索における評価指標の動向と新たな提案

社内での新技術研究会において、「情報検索における評価指標の動向と新たな提案」と題して発表しましたので資料を掲載させていただきます。

内容については最近のIR研究における検索評価指標の動向について、また、音声対話検索向けの評価指標について紹 介しました。

なお、今回紹介した評価指標の実装は以下にあります。もしよければご参考ください。 https://github.com/DensoITLab/evaluation_measures 2


このエントリーをはてなブックマークに追加