HOMEご利用手順商品サンプルご利用規約お支払いご注文進行確認Q&A、お問い合せカートを見る
電気学会 電子図書館
電気学会HPへ
 HOME > 同研究会の研究会(論文単位) > 文献詳細

・会員価格 ¥220
・一般価格 ¥330
カートに入れる
こちらはBookPark「電気学会 電子図書館(IEEJ Electronic Library)」による文献紹介ページです。
会員ログイン
電気学会会員の方はこちらから一旦ログインのうえ、マイページからお入りください。
会員価格で購入することができます。
非会員の方はログインの必要はありません。このまま お進みください。
■論文No. CT21036
■ページ数 6ページ
■発行日
2021/01/25
■タイトル

機械学習を用いた音声の区間欠落の復元に関する研究

■タイトル(英語)

A study on restoration of missing speech data using machine learning

■著者名 守谷 歩(長岡技術科学大学),杉田 泰則(長岡技術科学大学)
■著者名(英語) Ayumu Moriya(Nagaoka University of Technology),Yasunori Sugita(Nagaoka University of Technology)
■価格 会員 ¥220 一般 ¥330
■書籍種類 研究会(論文単位)
■グループ名 【C】電子・情報・システム部門 制御研究会
■本誌 2021年1月28日制御研究会
■本誌掲載ページ 1-6ページ
■原稿種別 日本語
■電子版へのリンク
■キーワード 機械学習|音声復元|話者認識モデル|話者合成モデル|異常検知|Machine learning|Speech restoration|Speaker recognition model|Speech synthesis model|anomaly detection
■要約(日本語) 近年,インターネットを使用した音声通話アプリケーションの需要が増加している.しかしそのようなアプリケーションでは,パケットロスやジッタの影響により,音声データの欠落や遅延を生じることがある.本稿では,欠落区間の検知と復元の2つの機械学習モデルで構成される音声データの復元法を提案する。欠落区間の検出には話者認識モデルであるX-vectorを,欠落区間の復元には音声合成モデルであるParallel Wavenetを用いる。
■要約(英語) In voice call applications, voice data is lost or delayed because of packet loss and jitter. In this paper, we propose a restoration method for missing section speech data, which consists of a missing section detection model and a restoration model. In the proposed method, X-vector, which is one of the speaker recognition models, is used to detect the missing section, and Parallel Wavenet, which is one of the speech synthesis models, is used to restore the missing section.
■版 型 A4
■PDFファイルサイズ 1,111Kバイト
運営会社についてBookPark個人情報保護方針電気学会ホームページ
本サービスは電気学会がコンテンツワークス株式会社に委託して運営しているサービスです。
©Contents Works Inc.