Байесовский подход к анализу изображений

В основу байесовского подхода к анализу изображений положено правило Байеса для апостериорной вероятности:

formula_58

где D – исходные данные (изображение), H – гипотеза о содержании данных (модель изображения).

Это правило позволяет выбирать модель изображения на основе ее апостериорной вероятности P(H | D) , которая выражается через априорную вероятность модели P(H) и правдоподобие данных в рамках модели P(D | H). Величина P(D) не участвует в выборе модели, поэтому может быть опущена.

Существует распространенное мнение, согласно которому некоторый критерий выбора модели является некорректным, если он не согласуется с правилом Байеса [82, с. 713; 83, с. 3].

Байесовский подход может использоваться для построения описания в рамках любого из указанных выше представлений изображений, включая низкоуровневые представления [84], контурные представления [85], структурные представления [86], представления, основанные на знаниях [87], а также признаковые представления [88, 89]. Байесовский подход применяется также в ряде задач анализа изображений, таких как совмещение [90, 91], выявление изменений [92], построение поля скоростей по серии изображений [93, 94] и др..

Рассмотрим некоторые наиболее типичные примеры применения Байесовского подхода к анализу изображений и выявим его основные ограничения.

Использование байесовского подхода в низкоуровневых моделях изображений

Рассмотрим характерное применение байесовского подхода к анализу изображений на основе стохастических моделей изображений. В таких моделях предполагается, что имеется набор скрытых переменных χ = (χ1,…,χN ) с заданной плотностью распределения априорных вероятностей p(χ), а также функция построения изображения, задающая распределение вероятностей изображений f при данных скрытых переменных: p(f | χ).

При этом моделью конкретного изображения является набор значений этих скрытых переменных, апостериорные вероятности которых можно оценить по правилу Байеса, в данном случае принимающему вид

formula_59

Приведем простейшую модель [95], в которой яркости отдельных пикселей распределены по одному и тому же нормальному закону, характеризующемуся двумя параметрами: (средним) a и (дисперсией) σ .

formula_60

Эта модель, очевидно, очень упрощенная, так как она не учитывает пространственные зависимости, которые как раз и характеризуют изображения. Однако в силу своей простоты модель (1.3) является удобной на начальном этапе построения более сложных статистических моделей [95].

Более сложные модели могут учитывать статистики и более высоких порядков, ограничения на пространственный спектр или некоторые общие предположения о свойствах изображений, такие как инвариантность к масштабу или стационарность (см., напр., [84]). Это позволяет задавать более адекватные скрытые переменные (χ1,…, χN ) и соответствующие распределения p( f | χ) . Однако остается нерешенным вопрос, каким образом следует задавать априорные вероятности p(χ).

Для сравнительно простых стохастических моделей задание априорных вероятностей может осуществляться на основе анализа статистик естественных сцен, чему посвящена отдельная ветвь исследований [96-98]. Наличие четкой связи между организацией нейронов в естественных зрительных системах и статистиками естественных сцен показывает [99-101], что эту априорную информацию действительно следует закладывать в системы анализа изображений.

Однако при усложнении стохастической модели оценивание распределения априорных вероятностей p(χ) по обучающей выборке изображений становится проблематичным. При этом если содержание изображения произвольно, то ввести такие скрытые переменные (χ1,…,χN ) с заданным в явном виде распределением p( f | χ ), которые бы описывали содержание изображения, а не его общие статистические свойства, оказывается на практике невозможным. Как показывают попытки построения единой стохастической модели изображений [84], выбор и исследование представлений изображений в рамках байесовского подхода затруднительны.

Байесовский подход к построению геометрических элементов

Построение произвольной стохастической модели изображения является весьма общей задачей, поэтому, естественно, при ее решении возникают трудности. Однако аналогичные трудности проявляются (хоть и в меньшей степени) при применении байесовского подхода к другим задачам. Рассмотрим задачу построения геометрического элемента.

Пусть на изображении выделено некоторое количество контурных точек formula_61 , на основе которых требуется построить геометрический элемент (например, прямую линию, окружность, эллипс или более сложную фигуру), описываемый набором параметров χ .

В соответствии с правилом Байеса оптимальным будет набор параметров, при котором максимально значение апостериорной вероятности:

formula_62

Зачастую точки (xi , yi ) рассматриваются как статистически независимые, поэтому правдоподобие оценивается как

formula_63

Пусть d(x, y,χ ) – расстояние от точки (x, y ) до геометрического элемента, задаваемого параметрами χ . Тогда, считая, что отклонения точек от положений, задаваемых геометрическим элементом, распределены нормально, имеем

formula_64

При p(χ) ≡ const получаем классический метод наименьших квадратов, с помощью которого можно оценить оптимальные (в рамках данного критерия) значения параметров.

Здесь, однако, необходимо сделать ряд замечаний. Во-первых, для изображений нормальность распределения отклонений нарушается (в частности, в связи с тем, что формирование изображений сопровождается проективными искажениями), что достаточно сложно в явном виде выразить в формуле для функции правдоподобия.

Во-вторых, игнорирование множителя p(χ) часто приводит к неадекватным результатам, что особенно проявляется в случае, когда количество параметров геометрического элемента не фиксировано (когда производится выбор среди элементов различных типов). В этом случае имеет место тенденция к выбору геометрического элемента с максимально возможным числом параметров. В частности, если геометрический элемент – кривая, описываемая полиномиальным уравнением произвольной степени, то на основе критерия наименьших квадратов будет всегда выбираться кривая с N параметрами, точно описывающая положение всех точек. В связи с этим обычно вводится такое априорное распределение, которое «штрафует» число параметров, а также, возможно, слишком большие значения отдельных параметров. Однако эвристически введенные штрафы, хотя и позволяют получить решения лучше, чем с помощью метода максимального правдоподобия, все же не дают решения, оптимального в смысле сложности модели [102]. Выбор как слишком простой, так и слишком сложной модели приводит к уменьшению помехоустойчивости решения.

Таким образом, байесовские методы построения геометрических элементов не содержат обоснования выбора конкретного вида плотностей распределения условных вероятностей и задания априорных вероятностей моделей.

Построение поля скоростей по серии изображений при байесовском подходе

Рассмотрим еще один пример использования байесовского подхода в анализе изображений, а именно, в задаче построения поля скоростей по серии изображений. В этой задаче введение правильных априорных вероятностей оказывается ключевым.

Пусть имеются два изображения f1 и f2, полученные последовательно. Пусть χ – параметры некоторой модели движения. Как и ранее p( f1,  f2 | χ )– правдоподобие изображений при данных параметрах движения.

Параметризация движения может осуществляться по-разному. К примеру, может описываться единое глобальное движение (например, на основе модели твердого тела). Параметризация движения может также осуществляться в локальном окне, в котором описывается перемещение каждого пикселя.

Для вычисления правдоподобия p( f1, f2 | χ ) необходимо построить стохастическую модель изменения изображения при данных параметрах движения, что в общем случае может быть достаточно проблематично. Часто ограничиваются следующей оценкой правдоподобия для одной точки изображения:

formula_65

где α – нормирующий множитель нормального распределения, оценки частных производных осуществляются по изображениям f1, f2, σ – ожидаемая дисперсия шума в производной по времени, (vx, vy) – вектор скорости движения данной точки. Для совокупности точек в локальном окне вектор χ конструируется как совокупность векторов скоростей всех точек. В предположении независимости скоростей движения отдельных точек изображения и без использования априорных распределений p(χ) для каждой точки можно получить вектор ее скорости.

Предположение о независимости скоростей, естественно, часто не соответствует действительности. В связи с этим, получаемое поле скоростей обычно сглаживают, поскольку, в противном случае, оно оказывается сильно зашумленным.

Помимо этого, разброс скоростей в локальном окне может контролироваться априорным распределением p(χ). В работе [93] отмечается, что «байесовскую модель можно заставить вести себя произвольным образом, разработав достаточно сложные априорные распределения». Однако для выбора априорного распределения отсутствует четкая обоснованная методика, и, в конце концов, этот выбор осуществляется исследователем, исходя из эвристических соображений без гарантии того, что он осуществлен удачно.

В [93] априорное распределение скоростей конструируется из того соображения, что предпочтение должно отдаваться медленным и гладким (без разрывов) перемещениям. Таким образом, предполагается штрафовать параметры χ по их абсолютной величине и по величине разницы соответствующих им скоростей соседних точек в окне. Если такое априорное распределение не задавать, то результирующие скорости будут большими (и, вообще говоря, будет присутствовать значительная неопределенность в выборе скорости для каждой конкретной точки), а в поле скоростей будет значительное число разрывов.

Идея задания подобного априорного распределения выглядит математически обоснованной, однако конкретный его вид может быть выбран достаточно произвольно. В то же время, качество априорного распределения определяет эффективность метода.

На основании вышеизложенного можно сделать следующие выводы. Байесовский подход является одним из наиболее обоснованных; он широко распространен и успешно применяется в задачах анализа изображений совместно со всеми представлениями изображений. Однако при использовании байесовского подхода возникают две основные трудности, которые приводят к снижению эффективности методов, построенных на его основе.

  1. Проблема задания вида плотности распределения условных вероятностей (правдоподобия). Вид плотности P(H|D) определяется используемой стохастической моделью. На практике зачастую вводят сильные упрощающие предположения, не выполняющиеся для реальных изображений, и ограничиваются весьма простыми моделями, параметры которых несложно оценить. Как правило, такие модели имеют теоретический интерес; на практике же приходится жертвовать точным соответствием с байесовским подходом в пользу более релевантных, но менее строгих методов.
  2. Проблема априорных вероятностей моделей. Байесовский подход требует задания априорных вероятностей, выбор которых может играть ключевую роль в построении эффективного алгоритма, однако этот выбор не может быть выполнен в рамках собственно байесовского подхода. Лишь в небольшом числе задач априорные вероятности моделей могут быть оценены на основе обучающей выборки изображений. В результате, априорные распределения выбираются разработчиком из эвристических соображений, что создает предпосылки для неоптимального их задания. Важно отметить, что проблема априорных вероятностей является фундаментальной проблемой в индуктивном выводе и приводит к ряду парадоксов в философии науки [103].