グラフカット以前のエネルギー最小化
今更ながらグラフカットについて学ぼうとしている。まずは基礎からということで、コンピュータビジョン最先端ガイドの2章を読み進めることに。
学んだことについてメモを記していくけど、まずはエネルギー最小化について。
2値画像のノイズ除去
エネルギー最小化によって2値画像のノイズを除去する場合、まず場所を表すサイトの集合 を定義する。画像 が与えられたとして、その画素の1つ1つがサイトと考えられる。
2値画像なので各画素の取りうる値(ラベル)は以下のようになる。
ノイズを除去した2値画像は各画素に0か1を割り振りなおす形で得られる。各サイトにラベルを割り振ることを配置といい、 から への写像と言える。これを の配置と呼ぶ。配置 といったとき、 はサイト にラベル を割り振るものとする。
ノイズ画像において隣接画素間の変化が少なくなるような を探して、それを除去画像とするわけだけど、やりすぎると完全に一色の画像となってしまう。これらのトレードオフをエネルギーという関数で定義することでエネルギー最小化の問題を解くことができる。
以下の式における を動かして が最小となる を見つける。
- : の元
- : 全体からなる集合 ( )
- : 正の定数
- : ノイズ入り画像を表す配置
一般の場合
↑の式を少し抽象的にすると以下の式の形になる。
- : 画素など「場所」を表すサイトの集合
- : サイト間の隣接関係を表す集合
- のときサイト と は隣接している
解くべき問題は の各サイトにラベルを割り振ること。ラベルの有限集合を として、 を配置と呼ぶ。
の配置 とは、 の各サイト にラベル を与える写像。
を画素の全体、 として全体の色を取れば、 画素の RGB ビットマップ画像は、各画素に色をひとつずつ与える配置 と考えることが出来る。
このような にエネルギー を与えるのが↑の式になる。
2値画像での例を持ち出すと、
になる。 はサイトとそのサイトに付与されたラベルのみによる値なのでデータ項、 は隣接するサイト間で に与えられるラベルがどのような関係にあるべきかを示す(普通は隣接ラベル間の変換を平滑化する)ため平滑化項と呼ばれる。
のようなエネルギー式はマルコフ確率場( MRF )の最大事後確率( MAP )推定のときによく使われる。
において、データ が与えられたとき、 は固定済みなので は定数となり、 を最大化することで が最大となり、MAP 推定としては最大化する を求めれば良いことになる。このとき、 の尤度 がデータ項に、 が平滑化項に、それぞれ対数値の -1 倍となって表現される。
所感
メモとしては一般の方だけで良かったな・・・。せっかく書いたし両方乗っける。
次はグラフカットの本流についても勉強してコードまで落としこめてまたエントリ書きたい。
コンピュータビジョン最先端ガイド1[CVIMチュートリアルシリーズ]
- 作者: 倉爪亮,石川博,加藤丈和,佐藤淳,三田雄志,八木康史,斎藤英雄
- 出版社/メーカー: アドコム・メディア
- 発売日: 2008/12/03
- メディア: 単行本
- 購入: 9人 クリック: 71回
- この商品を含むブログ (11件) を見る