Jonathan LE ROUX (ルルー・ジョナトン)
Interspeech 2024 にて論文5件が発表されました。
升山義紀氏の率いるチームが 1st SONICOM Listener Acoustic Personalisation (LAP) Challenge タスク2("Spatial upsampling for obtaining a high-spatial-resolution HRTF from a very low number of directions")で、7チーム中1位になりました。
ICASSP 2024 、XAI-SA workshop 、およにHSCMA 2024 にて論文10件が発表されました。
2024年1月1日付けで「IEEEフェロー」に昇格しました 。
SANE 2023 を10月26日にNYUのBrooklynキャンパスにてJuan Bello 先生(NYU) と John Hershey と一緒に主催しました。
Interspeech 2023にてMulti-talker methods in Speech Processing のSpecial SessionをPeter Bell, Michael Akeroyd, Jon Barker, Marc Delcroix, Liang Lu, Jinyu Li, Cassia Valentini, DeLiang Wang と共同主催しています。16件の論文がAcceptされました。
Darius Petermannの論文 "Hyperbolic Audio Source Separation" がICASSP 2023 の Best Student Paper Award を受賞しました。アルゴリズムとデモインタフェースのコードを Github にて公開しています: Hyper-Unmix 。
CMU-MERL の共同チームが DCASE 2023 Challenge Task 6A "Automated Audio Captioning"のトップランクを取りました。
2023年3月~6月までTélécom Paris のGaël Richard先生のチームで招待研究員として研究していました。
MERL は Sony と Moses.ai と共に Sound Demixing Challenge 2023 をスポンサリング・主催しました。Cinematic Sound Demixing トラックはMERLの Divide and Remaster (DnR) データセット と cocktail fork separation ベースライン を使用しています。
SANE が三年ぶりにCambridge, MA にて開催されました。 ビデオをウェブサイトで公開しています。
TWIML AI podcastでMERLの音源分離技術について取材を受けました 。
映画などの音源を音声・音楽・効果音に分離するモデルを学習・評価するためのDivide and Remaster (DnR) データセットを公開しました。詳細はcocktail fork ページをご覧ください。
WSJ0 Hipster Ambient Mixtures (WHAM!) データセットに用いた背景雑音のハイファイバージョン WHAM!48kHz を公開しました。
共著論文の"Hierarchical Musical Source Separation"がISMIR 2020において「Best Poster Award」及び「Best Video Award」を受賞しました。 ISMIRウェブサイトで論文ページ をご覧ください。
MERLのSpeech & AudioグループとComputer Visionグループが共同で開発した Scene-Aware Interaction 技術が三菱電機のプレスリリース にて公開されました. デモビデオ で技術を紹介しています。
共著論文の"MIMO-SPEECH: End-to-End Multi-Channel Multi-Speaker Speech Recognition" がASRU 2019において「Best Paper Award」を受賞しました。
主要SP/ML学会が毎年何月に開催されたかをまとめる表を作成しました 。 (作成用のPython script )
SANE 2019 が10月24日(木)に Columbia大学, New York, NY にて開催されました。
三菱電機の研究開発を説明する「研究開発成果披露会」にて、我々が開発した多話者多言語音声認識技術「シームレスASR」を発表しました 。ライブデモを行い、日本のメインのテレビ局全局に取り上げられました 。紹介ビデオ をご覧ください。
SANE 2018 が10月18日(木)に Google, Cambridge, MA にて開催されました。
元MERL実習生 Zhong-Qiu Wang がICASSP 2018において「Best Student Paper Award」を受賞しました。論文:"Multi-Channel Deep Clustering: Discriminative Spectral and Spatial Embeddings for Speaker-Independent Speech Separation"
SANE 2017 が10月19日(木)に Google, New York, NY にて開催されまた。ビデオや発表資料は こちらから アクセスできます。Youtube のプレイリスト からすべてのビデオを再生できます。
三菱電機の研究開発を説明する「研究開発成果披露会」にて、我々が開発した音声分離技術「ディープクラスタリング」を発表しました 。ライブデモを行い、日本や海外の多くのメディアで取り上げられました 。
SANE 2016 が10月21日(金)に MIT, Cambridge, MA にて開催されました。発表資料は こちらから アクセスできます。
Interspeech 2016で Emmanuel Vincent と Hakan Erdogan と一緒に発表したチュートリアル "Learning-based Approaches to Speech Enhancement And Separation" の発表資料 を公開しました。
SANE 2015 が10月22日(木)に Google, NYC にて開催されました。参加者が130名に及び、楽しく有意義な議論ができたかと思います。ビデオや発表資料は こちらから アクセスできます。Youtube のプレイリスト からすべてのビデオを再生できます。
ICASSP 2015で発表したMICbots関連の資料をいくつか公開します:ICASSPの発表資料 。MICbotsの概念や作成過程について説明するプロジェクトページ 。ロボットが動きながらTIMITの発話を再生・録音している場面のYoutubeビデオ 。PyRobot 2 というCreate 2のためのPython wrapper。
Sparse NMFとExemplar-based NMFとを音源分離の実験で比較するTechnical Reportを公開しました:"Sparse NMF – half-baked or well done?" 。MATLABでの Sparse NMF with beta-divergence のソースコード (Apache 2.0 license)も公開しました。
SANE 2014 が10月23日(木)にMITにて開催されました。発表資料はsane-news グループからダウンロードできます。
Robust speech processing用データセットのリストを作成しました。[Technical Report] [wiki page]
IEEE SPLの論文"Consistent Wiener Filtering for Audio Source Separation "の付属コード を公開しました。
SANE 2013 が10月24日(木)にColumbia大学にて開催されました。発表資料はsane-news グループからダウンロードできます。
日本音響学会 第34回粟屋潔学術奨励賞 を受賞しました。9月26日に豊橋技術科学大学に行われる贈呈式に出席する予定です。
2012年10月24日、MERLにて開催されたワークショップ「Speech and Audio in the North East (SANE 2012)」 のスライドが公開されました。SANEのGoogle Group からアクセスできます。登録が必要です。