前提知識

フーリエ変換

詳細は フーリエ変換 を参照。

周期関数に限らず、任意の関数 $f(t)$ は、正弦波($A \sin{\omega t}$ や $A \cos{\omega t}$。$A$, $\omega$ は定数)の和で表現できる(数学的な証明はここでは行わない)。
$t$ を時間 [s] とすれば

  • $\omega$ は波の角周波数 [rad/s](周波数 $f$ [Hz] との関係は $\omega = 2\pi f$)
  • $A$ は波の振幅

にあたる。

フーリエ変換 = 関数 $f(t)$ を様々な周波数 $\omega$ の正弦波に分解する変換。各周波数の波がそれぞれどの程度の強さ(= 振幅 $A$)で混ざり合っているのかを求められる

【公式】フーリエ変換

フーリエ変換:

\[F(\omega) = \displaystyle \int_{-\infty}^{\infty} f(t) e^{-i\omega t} \,dt \tag{1}\]

フーリエ逆変換:

\[f(t) = \displaystyle \cfrac{1}{2\pi} \int_{-\infty}^{\infty} F(\omega) e^{i\omega t} \,d\omega \tag{2}\]

【例】

元関数:
Unknown-8

フーリエ変換:
Unknown-9

フーリエ逆変換:
Unknown-11

離散フーリエ変換(DFT)

DFT = Discrete Fourier Transform

コンピュータで扱うデータとしての波は連続値ではなく離散値であり、無限個の処理はできない。
→ 関数 $f(t)$ を、あらゆる(= 無限個の)周波数の波ではなく、有限個の異なる周波数 $\omega_i\,(i = 1, \cdots , N)$ の波に分解する。

  • データサンプルの計測時間長 $T$
  • サンプル総数 $N$
  • 各サンプルの計測時刻 $t_n$、計測値 $f_n$($n = 0, \cdots, N-1$)
    • サンプルは等間隔に取得:$t_n = n \Delta t$

に対して、DFT における周波数分解能は

\[\Delta f = \cfrac{1}{T}\]

また、時間間隔は

\[\Delta t = \cfrac{T}{N}\]

で与えられる。

$f(t)$ の DFT は

\[F(\omega) = \displaystyle \int_{-\infty}^{\infty} f(t) e^{-i\omega t} \,dt = \displaystyle \sum_{n=0}^{N-1} f_n e^{-i \omega t_n} \Delta t = \displaystyle \cfrac{T}{N} \sum_{n=0}^{N-1} f_n e^{-i \omega \frac{nT}{N}}\]

強度を求めたい周波数も等間隔に取り、

\(\omega = k \Delta \omega = 2 \pi k \Delta f = \cfrac{2 \pi k}{T}\) \(k = 0, \cdots, N-1\)と置くと、

\[F_k = F(\omega) = F(2 \pi k \Delta f) = \displaystyle \cfrac{T}{N} \sum_{n=0}^{N-1} f_n e^{-i \frac{2 \pi}{N} nk}\]

各周波数の強度(スペクトル密度)は、これを計測時間長 $T$ で割って

\[\displaystyle \cfrac{1}{N} \sum_{n=0}^{N-1} f_n e^{-i \frac{2 \pi}{N} nk}\]

これは複素数であり、

  • 実部:波の偶関数成分(cos)
  • 虚部:波の奇関数成分(sin)

という対応になっている。この複素数の絶対値を取ることでスペクトル密度が得られる。

1つの $k$ についてフーリエ係数を計算するのに $N$ 回の和を取るので、全ての $k$ について係数を得るための計算量は $O(N^2)$。

高速フーリエ変換(FFT)

FFT = Fast Fourier Transform

基本的な考え方

前提として、$N$ は2の冪乗となるように決める。

$F_k$ の和の部分

\[c_k \equiv \displaystyle \sum_{n=0}^{N-1} f_n e^{-i \frac{2 \pi}{N} nk}\]

を高速に求めたい。

和を添字の偶数・奇数で分解

和の各要素を添字の偶数・奇数で分けると、

\[\begin{eqnarray} c_k &=& \displaystyle \sum_{n=0}^{N-1} f_n e^{-i \frac{2 \pi}{N} nk} \\ &=& \displaystyle \sum_{n=0}^{N/2-1} f_{2n} e^{-i \frac{2 \pi}{N} 2nk} + \sum_{n=0}^{N/2-1} f_{2n+1} e^{-i \frac{2 \pi}{N} (2n+1)k} \\ &=& \displaystyle \sum_{n=0}^{N/2-1} f_{2n} e^{-i \frac{2 \pi}{N/2} nk} + e^{-i \frac{2 \pi}{N} k} \sum_{n=0}^{N/2-1} f_{2n+1} e^{-i \frac{2 \pi}{N/2} nk} \end{eqnarray}\]
  • 複素数空間の回転単位(回転子)$w_N \equiv e^{-i \frac{2 \pi}{N}}$
  • 偶数添字・奇数添字成分 $f_n^{\rm e} \equiv f_{2n},\,\, f_n^{\rm o} \equiv f_{2n+1}$

と置くと、

\[\begin{eqnarray} c_k &=& \displaystyle \sum_{n=0}^{N-1} f_n w_N^{kn} \\ &=& \displaystyle \sum_{n=0}^{N/2-1} f_n^{\rm e} w_{N/2}^{nk} + w_{N}^{k} \sum_{n=0}^{N/2-1} f_n^{\rm o} w_{N/2}^{nk} \end{eqnarray}\]

最後の式を見ると、

  • 第1項:要素数 $N/2$ の DFT
  • 第2項:要素数 $N/2$ の DFT に $w_N^k$ をかけたもの

となっている。
即ち、要素数 $N$ の DFT は、要素数 $N/2$ の DFT 2つに複素数 $w_N^k$ を掛けて和をとる処理に分解できる

分解された2つの DFT はそれぞれ計算量

\[O\left(\left(\frac{N}{2}\right)^2\right) = O\left(\frac{N^2}{4}\right)\]

となり、元の DFT の 1/4。

分かれた2つの DFT も再帰的に要素数半分の DFT の和に分解していくことができ、最終的には要素数1の DFT(要素の値をそのまま返却するだけ)になる。

$k \lt N/2$ かどうかで分けて考える

任意の $k$ について、

\[\begin{eqnarray} w_N^{k+N/2} &=& e^{-i\frac{2 \pi}{N}(k + N/2)} = e^{-i\frac{2 \pi}{N}k}e^{-i\pi} = - w_N^k \\ w_{N/2}^{k+N/2} &=& e^{-i\frac{2 \pi}{N/2}(k + N/2)} = e^{-i\frac{2 \pi}{N/2}k}e^{-i2\pi} = w_{N/2}^k \end{eqnarray}\]

であるから、$k = 1, \cdots , \frac{N}{2}$ に対して

\[\begin{eqnarray} c_k &=& \displaystyle \sum_{n=0}^{N/2-1} f_n^{\rm e} w_{N/2}^{nk} + w_N^k \sum_{n=0}^{N/2-1} f_n^{\rm o} w_{N/2}^{nk} \\ c_{k+N/2} &=& \displaystyle \sum_{n=0}^{N/2-1} f_n^{\rm e} w_{N/2}^{nk} - w_N^k \sum_{n=0}^{N/2-1} f_n^{\rm o} w_{N/2}^{nk} \end{eqnarray}\]

この式より、$c_k$ と $c_{k+N/2}$ の計算には同じ DFT、$w_N^k$ の値が使えることが分かる。
即ち、$k = 1, \cdots , N$ のそれぞれに対して個別に DFT 2つと $w_N^k$ の計算が必要だったところを半分にできる。

【NOTE】

2つの DFT($c_k$, $c_{k+N/2}$)を求める問題が、要素数半分の別の2つの DFT を求める問題に変換されている。

再計算を避けるための工夫

各 $k$ の DFT を個別に分解・計算すると、別の $k$ のときに一度計算したものを再計算してしまうことになり非効率。

例として、要素数8のデータサンプルの DFT を考える。
各 $k$ に対応する DFT を要素数1の DFT(= そのまま要素を返すだけ)になるまで分解した結果を以下の図に示す。

  • 矢印は実際に計算するときの流れ
    • 2本の矢印の合流点で、一方に $w_N^k$ や $-w_N^k$ をかけて足す
    • 矢印を逆にすれば、元の DFT が分解されていく過程になる
  • f_ef_oeoなどは、添字の偶奇による DFT 分解の過程で作られた、元データの部分集合
    • eは偶数添字、oは奇数添字を抽出したことを示す
    • 例えばf_oeo
      • f = [f0, f1, f2, f3, f4, f5, f6, f7]
      • 奇数添字を抽出:f_o = [f1, f3, f5, f7]
      • 偶数添字を抽出:f_oe = [f1, f5]
      • 奇数添字を抽出:f_oeo = [f5]

fft_butterfly

この図が FFT の計算フロー。図の形から、バタフライ演算 と呼ばれる。

この計算フローには

  • いずれのステップにおいても、2つの DFT の結果から、後のステップで使う新しい2つの DFT を計算
  • 一度使った DFT は他の計算で再利用されないので捨てても困らない

という特徴があるため、長さ $N$ の配列(初期値はデータサンプル $f_n$)をステップごとに書き換えていくことで、空間計算量を節約できる(別配列を作る必要がない)。

(TODO: 続き。最終的な時間計算量)

FFT の実装

関数

\(\begin{eqnarray} f(t) = A_1 \sin{2 \pi f_1 t} + A_2 \sin{2 \pi f_2 t} \\ A_1 = 1.0,\, f_1 = 1.0 \mathrm{[Hz]} \\ A_2 = 0.2,\, f_2 = 2.5 \mathrm{[Hz]} \end{eqnarray}\) に対して、実装した FFT を適用してみる。
また、numpy の fft 関数の結果と誤差がないか比較する。

fft

  • いずれの実装も、numpy の fft 関数との誤差は極微小(正しく実装できていそう)
  • $f(t)$ の定義通り、$f_1 = 1.0 \mathrm{[Hz]}$ と $f_1 = 2.5 \mathrm{[Hz]}$ のあたりにピークが観測される
  • また、フーリエ変換で得られた振幅の比は定義した $A_1$ と $A_2$ の比($1.0:0.2 = 5:1$)にだいたい一致

計算速度の比較

実装した各手法と numpy.fft.fft の速度を比較してみる:

fft-speed

DFT が圧倒的に遅いので、除外してデータ数を増やしてみる:

fft-speed2

  • 愚直に和を取る離散フーリエ変換に比べて FFT が圧倒的に速い
  • 同じ FFT の中でも、バタフライ演算に対応すればさらに大きく高速化(fft VS fft_poor
  • バタフライ演算対応版に比べても、numpy の numpy.fft.fft が速すぎる。実装どうなってるの…?
今回実装した FFT numpy.fft.fft
fft-speed4 fft-speed3