論文 "Fast bilateral-space stereo for synthetic defocus" ②
論文"Fast bilateral-space stereo for synthetic defocus. "[2]を読む。
背景
前回まで
文献[0]は低品質のセグメンテーション結果から高品質のセグメンテーション結果を生成するバイラテラルソルバー(式8)を提案している。
実際にプログラミングするにあたり必要な、行列、(を構成する、信頼度画像)、ベクトルの具体的な作り方を調べるために参考文献から文献[2]を当たる。
文献[2]で分からなければ、文献[0]補足、文献[1,5]を読むことになりそう。
論文を読む
文献[2]のAbstractまで読んだ。文献[2]はデフォーカスレンダリングを目的とするデプスマップ作成のために、バイラテラル空間で行なわれる新しい最適化フレームワークを提案し、高速に視差図を求める。
1. Introduction-6
最初の5つの段落はステレオアルゴリズムに関してなので読み飛ばす。ここでは興味のある6、7段落目を引用する。
ほとんどのステレオアルゴリズムは、画像内の各ピクセルに視差ラベル(disparity label)を割り当てることによって機能します。
私たちの技術の核心となるアイデアは、高速バイラテラルフィルタリング[1, 5]の技術を利用して、ピクセル空間からはるかに小さい「バイラテラル空間」へと、密ステレオ問題を「リサンプリング」することによって、ピクセルごとの推論を回避することです。
バイラテラル空間は、ピクセル空間(またはバイラテラルアフィニティが計算される任意のベクトル空間)のリサンプリングです。小さな、バイラテラル空間での隣接する頂点間の単純なぼかしが、大きな、ピクセル空間内のエッジを意識したぼかしと同等になるようにしています。
画像内のすべてのピクセルに関して推論を実行する代わりに、我々はピクセルごとの最適化問題をこの縮小されたバイラテラル空間に近似します。
我々のバイラテラル空間は次に用に定義される。
推論がピクセル空間の代わりにこのコンパクトな「バイラテラル空間」で行われるため、非局所平滑性事前問題を用いた大域的最適化問題を解くにもかかわらず、我々のアプローチは高速かつスケーラブルである。
なんだか冗長な文章だが、巨大ピクセル空間から小さなバイラテラル空間へリサンプリングし、バイラテラル空間上で処理することで計算量を抑えることができる、とのこと。
ここで、ピクセル空間上で行いたいエッジ認識平滑化が、バイラテラル空間上で行う単純な平滑化処理で実現できるようにしているという。
ただ、どうしても近似になると思うが、十分な精度が得られる根拠はどこにあるのだろうか。
1. Introduction-7
私たちは、ステレオ、またはオプティカルフローの類似の問題という観点で、エッジ認識フィルタリングを利用したのは初めてではありません。
- いくつかのオプティカルフロー技術は、バイラテラルフィルタリングを用いて、エッジを意識したフローフィールドを生成しています[27, 31]。
- 他の技術はこの考えをさらに一歩進めて、高速バイラテラルフィルタリング技術を用いて、加速フローアルゴリズムを提案しています[18, 24]。
- 他のものは、ガイド付きフィルタ[23]やMSTベースの非ローカルフィルタ[33]など、異なる非ローカルエッジアウェアフィルタを使用しています。
- 高速バイラテラルフィルタリングは、セマンティックセグメンテーションにも使用されています[17]。
高速バイラテラルフィルタリングに基づくこれらの手法は、一般に、ピクセルに関して推論を実行し、推論中に使用されるピクセルごとのフィルタを高速化するために高速バイラテラルフィルタリング技術を使用する。
我々はこのアイデアをさらに一歩進め、高速バイラテラルフィルタリング手法の背後にあるコアアイデアを使用して、バイラテラルフィルタリングが高速な空間に最適化問題を再サンプリングし、その最適化問題をその縮小された空間で解決します。
以前の手法とは対照的に、我々のバイラテラルフィルタの使用は、単純な局所的な滑らかさに基づくほとんどのアプローチよりも効率的に最適化問題を解くことを可能とし、より積極的なバイラテラルフィルタ(フィルタサイズが大きい)で最適化が速くなります。
最も速いステレオ研究は「局所的」技術に焦点を合わせる傾向がありますが、我々の技術は完全にグローバルであり(すべてのピクセルに関して最適化問題を解く)、これらの局所的技術よりも速いです。ほとんどの「グローバル」ステレオ技術とは異なり、最適化問題は凸面であり、最適化が容易になり収束が保証されます。
何だか同じことを何度も言っていてくどい。あと既存技術との関係もよく分からない。
まとめ
1. INTRODUCTION をざっと読む。長くてくどくて良く分からなかった。
提案手法の特徴はピクセル空間からバイラテラル空間の再サンプリングによりバイラテラルフィルタを高速化するということで、大域的な処理を高効率に行えるところが利点。