
ディジタル画像処理技術は、ロボットビジョンや自動運転化技術、IoT(Internet of Things)など、様々な場面で活用されています。ディジタル画像は、画素(ピクセル)と呼ばれる光の強さ(色や明るさ)をあらわす数値の並びで構成されています。もちろん1つ1つの画素は独立していて、隣り合う画素同士につながりはありません(離散値)。そのため、ディジタル画像を単なる画素の集合として捉えた場合、そのままでは画像のどこにどんなモノが写っているのかが全く分かりません。
ディジタル画像をコンピュータで扱う場合には、各画素の色や明るさの変化、並びの特徴などを見つけ出したり比較したりすることで、写っているモノとモノとの境界(エッジ)を判別し、領域ごとに分類してあげる必要があります。これをセグメンテーションといいます。人間の目の場合セグメンテーションは簡単で、例えば、カニッツァの三角形で存在しない三角形が見えてしまう(その良し悪しは別として)ように、境界のない部分に線を引いて補間することさえ可能です。これに対して、コンピュータにおけるセグメンテーションでは、人間の目と同等の処理を行うことはほぼ不可能で、境界のない部分の補間どころか、まったく同じものが写っている画像でも明るさや色合い、写る角度などが少し変わるだけで同じセグメント結果を得ることが非常に難しいというのが現状です。ディジタル画像の中から目的とする領域だけを正確かつ高速に抽出する手法はこれまでにもたくさん提案されてきていますが、いまだ解決の難しい課題のひとつです。

一方、ディジタル画像は数値の集合なので計算や加工は簡単です。ある数値データをグラフや図としてあらわすなど、人間の目に捉えにくい情報をよく見えるようにすることを可視化(ヴィジュアリゼーション)といいますが、ディジタル画像の場合、セグメントした特定の領域を強調したり、各画素の数値を変換したり解析することで様々な可視化が可能です。例えば、ヒトの下半身を連続して撮影した複数枚のMRI画像があったとして、そのままでは撮影した部位の全体像(立体像)を想像することは容易ではありません。しかし、MRI画像から骨格部分の情報だけを取り出(セグメンテーション)して積み上げる処理を行うと、仮想3次元モデルを作成することが可能です。また、ヒトの肌の色をじっと見つめていても心拍数がわかる人はなかなかいないと思います。しかし、顔や手のひらなど人の肌の写ったディジタル映像があれば、そこから肌が写っている画素を取り出して、その肌の色を構成している緑色の成分(数値)だけを取り出して時系列に並べ直す処理をすると、脈波を取り出し、心拍数を計測することが可能です。

Scientific Visualization研究室では、このようなディジタル画像のセグメンテーションやヴィジュアリゼーションについて研究しています。研究室のWebページにも情報がありますので、よければアクセスしてみてください。