GitHubじゃ!Pythonじゃ!

GitHubからPython関係の優良リポジトリを探したかったのじゃー、でも英語は出来ないから日本語で読むのじゃー、英語社会世知辛いのじゃー

tyiannak

pyAudioAnalysis – Pythonオーディオ解析ライブラリ:フィーチャの抽出、分類、セグメンテーションとアプリケーション

投稿日:

Pythonオーディオ解析ライブラリ:フィーチャの抽出、分類、セグメンテーションとアプリケーション

オーディオ機能の抽出、分類、セグメンテーション、アプリケーション用のPythonライブラリ

この文書は一般的な情報を含んでいます。 完全なwikiはここをクリック

ニュース

  • 最新のPyAudioAnalysisアップデート[2018-08-12]はPython 3と互換性があります
  • pyVisualizeMp3Tagsをチェックすると、mp3タグと歌詞の視覚化用のPythonスクリプト
  • オーディオデータのリアルタイム録音と解析のためのpythonスクリプトをpauraでチェックしてください
  • PLA-1 pyAudioAnalysisに関する論文 (引用してください)

一般

pyAudioAnalysisは、幅広いオーディオ分析タスクをカバーするPythonライブラリです。 pyAudioAnalysisを使用すると、

  • オーディオの特徴や表現を抽出する(例:mfcc、スペクトログラム、クロマグラム)
  • 未知の音を分類する
  • オーディオ・セグメントの分類子のトレーニング、パラメータの調整、 評価
  • オーディオイベントを検出し 、長い録音から無音期間を除外する
  • 教師付きセグメンテーション (共同セグメンテーション – 分類)
  • 管理されていないセグメンテーション (例:スピーカーダイアリゼーション)
  • オーディオサムネイルを抽出する
  • 音声回帰モデルの学習と使用(例:感情認識)
  • 次元削減を適用してオーディオデータとコンテンツの類似性を視覚化する

インストール

  • インストールの依存関係:
pip install numpy matplotlib scipy sklearn hmmlearn simplejson eyed3 pydub
  • このライブラリのソースをクローン:
git clone https://github.com/tyiannak/pyAudioAnalysis.git

オーディオ分類の例

より多くの例と詳細なチュートリアルはwikiで見つけることができます

pyAudioAnalysisは、オーディオ解析タスクを実行するための簡単な呼び出しラッパーを提供します。 例えば、このコードは、フォルダに格納されたWAVファイルのセット(各フォルダは異なるクラスを表す)が与えられた場合、オーディオセグメント分類器を最初にトレーニングし、次にトレーニングされた分類器を使用して未知のオーディオWAVファイル

from pyAudioAnalysis import audioTrainTest as aT
aT.featureAndTrain(["classifierData/music","classifierData/speech"], 1.0, 1.0, aT.shortTermWindow, aT.shortTermStep, "svm", "svmSMtemp", False)
aT.fileClassification("data/doremi.wav", "svmSMtemp","svm")
Result:
(0.0, array([ 0.90156761,  0.09843239]), ['music', 'speech'])

さらに、すべての機能に対してコマンドラインのサポートが提供されています。 たとえば、次のコマンドは、WAVファイルに保存されているオーディオ信号のスペクトログラムを抽出しますpython audioAnalysis.py fileSpectrogram -i data/doremi.wav

参考文献

現在のREADMEファイルとwikiの他に、採用された方法のより一般的かつ理論的な記述(特定のユースケースに関するいくつかの実験と共に)がこの刊行物に示されています。 調査研究でpyAudioAnalysisを引用するときは、次の引用文を使用してください。

@article{giannakopoulos2015pyaudioanalysis,
  title={pyAudioAnalysis: An Open-Source Python Library for Audio Signal Analysis},
  author={Giannakopoulos, Theodoros},
  journal={PloS one},
  volume={10},
  number={12},
  year={2015},
  publisher={Public Library of Science}
}

最後に、Matlab関連のオーディオ解析資料については、 この本をチェックしてください。

著者

Theodoros Giannakopoulos行動信号における機械学習のディレクター







-tyiannak
-

執筆者: