概要
ISSEはある音声を対話的に二つの音源に分離する機能を持つフリーソフトウェアです。モーター音の成分分離やノイズの除去などに応用が可能です。操作性にはやや癖がありますが、アドビリサーチやスタンフォード大学が関わった研究の一環として作られたアプリケーションであり、その性能は非常に高いです。
当記事では、ISSEの導入手順や具体的なISSEの使い方の手順を紹介します。各々の機能に対する説明につきましては、ISSEリファレンスマニュアルにて紹介しています。当記事と併せてご覧ください。
導入
ISSEの公式サイトトップページの下にある各OS名の文字が、それぞれのOSに対応したアプリのアーカイブのダウンロードリンクとなっています。お使いの端末のOSがWindowsであるならば、「Windows」をクリックします。以降はWindowsであることを前提とした説明になります。
ページ遷移とアプリのアーカイブのダウンロードが行われます。Windowsの場合、インストーラータイプの実行ファイルとなっています。ダウンロードが完了したら、ダウンロードしたファイルを実行してインストールを開始します。インストール画面も英語ですが、特に難しいインストール設定はありません。
画面各部概説
実際の使い方
新規プロジェクトの作成
まず、WAV形式の音声ファイルをメニューのFile→Newを選択して開くダイアログで指定するか、もしくは直接ドラッグ&ドロップして開きます。File→Openの対象はWAVファイルでなくプロジェクトファイルであることに注意してください。
FFT設定の変更
Separation SettingsのうちFFT SizeやHop Sizeは変更すると初期化されてしまうため、もし変更を行っておきたい場合は編集を始める前に変更しておきます。
音声の試聴
音声の試聴操作は、下部のアイコンより行うことができます。タイムライン上の赤い四角領域の上でドラッグすることにより、特定の区間のみを再生することが可能です。デフォルトではAuto Solo設定が有効化されているため、トラックを切り替えると自動的に選択トラックの音声のみが再生されます。
スペクトログラム上に図形描画
青で描画した部分の周波数成分ははSource 1に、赤で描画した部分の周波数成分はSource 2へと分離されます。ISSEは独特のアルゴリズムにより、描画されていない部分の周波数成分を推測して分離を行います。このため、最初は大雑把に図形を描画します。図形は見た目の上では二重まで重ねて描画することができるようです。
描画に関する各種設定に関しては、画面上部左側のコントロールから行うことができます。
トラックを切り替えるにはスペクトログラムの上ではなくではなくトラックの左側のトラック設定部分をクリックします。スペクトログラム上のクリックでは意図しない図形の描画処理が行われてしまい、後述の音声分離処理が有効化されている間は分離処理も始まってしまいます。
分離処理の実行
画面上部のProcessアイコンをクリックするか、メニューのProcess > Processをチェックすると分離処理が開始されます。Processアイコンが有効化されている間は、描画の更新のたびに分離処理が実行されます。
図形の修正
意図した分離結果が得られるまで、さらに細かく図形の修正と分離処理と試聴を繰り返します。
音声のエクスポート
※ ファイルの操作を行う前に、あらかじめ処理を中止しておく必要があります。
意図した分離結果が得られたら、メニューのFile→Export Audioを選択することで分離した音声を保存できます。そこで開かれるダイアログで任意のフォルダを選択すると、選択したフォルダに成分を分離した二つの音声ファイルと、元音源とをあわせて三つの音声ファイルが保存されます。
プロジェクトの保存
※ ファイルの操作を行う前に、あらかじめ処理を中止しておく必要があります。
作業中のプロジェクトは、メニューのFile→Save Asより名前を付けて保存ができます。File→Saveは上書き保存です。
プロジェクトを保存すると、拡張子isseのファイル他に、指定したファイル名と同名のフォルダが作成され、その中にプロジェクトのデータが格納されます。プロジェクトファイルを移動する際には、ISSEファイルと、それと同名のフォルダを同時に移動する必要があります。
プロジェクトを開く
保存したプロジェクトは、メニューのFile→Openを選択するか、ISSEファイルを直接ドラッグ&ドロップして開きます。
アプリの終了
処理が有効化されている間はISSEを終了できません。ISSEを終了する前に、処理を中止しておく必要があります。