ISSEリファレンスマニュアル

公開

概要

ISSE

 ISSEはある音声を対話的に二つの音源に分離する機能を持つフリーソフトウェアです。モーター音の成分分離やノイズの除去などに応用が可能です。操作性にはやや癖がありますが、アドビリサーチやスタンフォード大学が関わった研究の一環として作られたアプリケーションであり、その性能は非常に高いです。

 当記事では、ISSEの各機能を網羅的に列挙します。具体的な使い方に関しましては、ISSEの使い方にて紹介しています。当記事と併せてご覧ください。

各部機能解説

メニュー

File

 ファイル操作やアプリの終了を行うには、あらかじめ処理を停止してしておく必要があります。

New

 音声ファイルを読み込み、新規プロジェクトを作成します。

Open

 保存済みのプロジェクトを開きます。

Save

 プロジェクトを上書き保存します。

Save As

 プロジェクトを名前を付けて保存します。

Export Audio

 分離した音声をファイルとして出力します。

Audio Settings

 オーディオデバイスなどの設定画面を表示します。

ISSE - Audio Settings

Quit

 アプリケーションを終了します。

Edit

Undo

 直前の操作をやり直します。

Redo

 操作のやり直しを取り消します。

Process

Process

 処理が有効化されているか否か。チェックされている時、編集操作の直後に音声分離処理が行われます。上のアイコンで処理を解除してもファイル操作が無効化されたままの場合、こちらのチェックが外れているかを確認してみてください。

Clear Paintings

 全ての描画図形を消去します。

Process Settings

 Separation Settingsタブを開きます。

View

 Visualization Settings以外は上部のアイコンから行える操作のため説明を省略します。

Visualization Settings

 スペクトログラムの表示設定ダイアログを開きます。

ISSE - Visualization Settings

 Clipはスペクトログラムに図示可能な周波数強度の上限をデシベル単位で指定します。「Color Map」の設定によっても異なりますが、一般に数値が大きくするほど暗くなります。Color Mapはスペクトログラムの色を指定します。

Transport

 音声の再生に関する設定です。下部のアイコンで同じことが行えるため、説明は省略します。

Help

About

 アプリケーションの概要を表示します。

タブ

Multi Paint View

 三つのトラックを全て一つの画面に収めて表示します。

Single Paint View

 単一のトラックを画面いっぱいに拡大して表示します。トラックの変更は、右端のスクロールバーを操作して行うことが可能です。

Separation Settings

ISSE - Separation Settings

 スペクトログラム表示や音声分離処理に関する設定を行います。

FFT Size

 Wave MasterのFFT設定の「サイズ」と同様で、大きくするほど周波数の解像度が大きくなりますが、一方で時間の解像度が小さくなります。この設定を変更すると、現在の描画状態が全て破棄され初期化されます。この設定を変更される際は、Hop Sizeも併せて変更されることをおすすめします。

 以下の画像は、FFT SizeとHop Sizeの比を固定し、FFT Sizeを変えたときのスペクトログラムを比較したものです。

ISSE - FFTサイズを変えて比較

Hop Size

 この数値が小さいほど、スペクトログラムの時間軸の解像度が高くなります。そのかわり、音声分離にかかる時間も増大することに注意してください。FFT Sizeの半分の値が設定可能な最大値です。デフォルトの値はデフォルトのFFt Sizeの1/8ですが、これよりも比率を小さくしても解像度はほとんど改善せず、処理が重くなるデメリットのみが際立ってきます。この設定を変更すると、現在の描画状態が全て破棄され初期化されます。

 以下の画像は、FFT Sizeを固定し、Hop Sizeを変えたときのスペクトログラムを比較したものです。

ISSE - Hopサイズを変えて比較

Basis Vectors

 この設定の変更による影響はよくわかっていませんが、少し設定を変えて試してみた限りでは、音声の分離の際の重みつけを表しているように考えられます。

Iterations

 この数値を小さくすると、分離精度が悪くなる可能性がありますが、一方で処理時間が軽減されます。

上部コントロール

 各項目名は、各部にマウスカーソルを置くと表示されるツールチップのテキストに準じています。

描画色設定

ISSE - Source Select

Source 1

 この色を選択して描画した部分は、中段のトラック(Source 1)に分離されます。

Source 2

 この色を選択して描画した部分は、下段のトラック(Source 2)に分離されます。

描画モード設定

ISSE - Draw Mode

Paint Mode

 描画モード。有効化されているときに描画操作を行うと、図形を描画します。

Erase Mode

 消去モード。有効化されているときに描画操作を行うと、その部分の図形を消去します。

ブラシ設定

ISSE - Drawing Control

Arrow Select

 役割は不明です。

Spray Brush

 スプレーブラシで図形を描画します。

Time Brush

 縦軸方向の幅がいっぱいのブラシで描画を行います。

Frequency Brush

 横軸方向の幅がいっぱいのブラシで描画を行います。

Box Brush

 四角形の領域を描画します。

Training Brus

 役割は不明です。

Brush Settings

 役割は不明です。

表示設定

ISSE - Display Control

 スペクトログラム表示の拡大と縮小を行うことができます。

Zoom In

 拡大します。

Zoom Out

 縮小します。

Zoom In Horizontal

 水平方向に拡大します。

Zoom Out Horizontal

 水平方向に縮小します。

Zoom In Vertical

 垂直方向に拡大します。

Zoom Out Vertical

 垂直方向に縮小します。

分離処理

ISSE - Process

 アイコンをクリックして有効化すると音声分離処理が開始されます。有効化されている間は、描画操作の度に音声分離操作が行われます。もう一度クリックすると再度無効化できます。

音量

ISSE - Master Volume

 マスター音量をデシベル単位で指定します。

タイムライン

ISSE - Timeline

 画面上部のタイムラインの上でクリックもしくはドラッグすると、再生カーソルを移動させることができます。

 再生終了位置の左にある赤い四角、もしくは終了位置の右にある白い四角をドラッグすると、ループ再生の区間を変更できます。ループ区間の指定は画面上部のタイムラインの右クリックからでも行うことができます。Set Loop Start、Set Loop Endからはそれぞれクリック位置をループ開始点、ループ終了点とします。Reset Markersは区間指定を初期化します。

スペクトログラム

ISSE - Spectrogram

 音声データを周波数解析し、横軸を時間、縦軸を周波数として音声データを図示します。スペクトログラム上での左ドラッグで、図形が描画されます。右クリックするとコンテキストメニューが表示され、「Multi Paint View」と「Single Paint View」の切り替えを行うことができますが、勝手に図形が描画されるという不具合があるため、右クリックの利用はおすすめしません。

トラック設定

ISSE - Track

 ここで行える操作や設定は、基本的に各々のトラックにのみ影響を及ぼします。

Mute

 現在のトラックをミュートします。「Auto Solo」が有効になっていれば操作の必要は原則としてありません。

Solo

 現在のトラックのみを再生します。「Auto Solo」が有効になっていれば操作の必要は原則としてありません。

Gain(dB)

 現在のトラックの音量をdB単位で指定します。

Zoom In Vertical

 スペクトログラム表示を垂直方向に拡大します。

Zoom Out Vertical

 スペクトログラム表示を垂直方向に縮小します。ツールチップには「Zoom In Vertical」と表示されますが、設定ミスと考えられます。

Show Visualization

 スペクトログラムの表示/非表示を切り替えます。

Show Overlay 1

 青色の図形の表示/非表示を切り替えます。

Show Overlay 2

 赤色の図形の表示/非表示を切り替えます。

Add to Overlays

 機能は不明です。

Clear Overlays

 現在のトラックの図形を全て消去します。

下部コントロール

ISSE - Audio Transparent Control

 ここからは、音声再生に関する操作を行うことができます。

Stop

 再生を終了します。

Play

 再生を開始します。

Pause

 再生を中断します。

Previous

 カーソルを音声冒頭に移動します。

Rewind

 カーソルを戻します。

Fast Forward

 カーソルを進めます。

Next

 カーソルを音声終端に移動します。ただし、ループ再生が有効化されているときは音声冒頭に移動します。

Loop

 有効化されていると、音声終端に達しても再生が終了せずループ再生となります。

Auto Solo

 有効化されていると、各トラックをクリックしてアクティブとなったとき、自動的に当該トラックがソロ再生状態になります。

ショートカットキー一覧

アプリ上に表記のあるショートカット

 キーボードショートカットが併記されている、メニューのコマンド一覧です。ズーム操作に関するショートカットは、日本語キーボードではうまく動作しないようです。

ショートカットキー 機能
Ctrl + N プロジェクト新規作成
Ctrl + O プロジェクトを開く
Ctrl + S プロジェクトを保存
Ctrl + Shift + S プロジェクトを名前を付けて保存
Ctrl + Q アプリの終了
Ctrl + Z 編集のやり直し
Ctrl + Shift + Z やり直しの取り消し
Ctrl + P 音声分離処理の有効/無効の切り替え
Ctrl + = スペクトログラム表示の拡大
Ctrl + - スペクトログラム表示の縮小
= スペクトログラム表示の横軸拡大
- スペクトログラム表示の横軸縮小
Shift + + スペクトログラム表示の縦軸拡大
Shift + _ スペクトログラム表示の縦軸縮小

アプリ上で説明のないショートカット

 アプリ上で説明が表示されないキー操作を一覧で紹介します。

ショートカットキー 機能
Ctrl + E 描画モードと消去モードの切り替え
Ctrl + 1 描画色を青色に
Ctrl + 2 描画色を赤色に
1 Arrow Selectを選択
2 Spray Brushを選択
3 Time Brushを選択
4 Frequency Brushを選択
5 Box Brushを選択
6 Training Brushを選択
Space 音声の再生と一時停止の切り替え