Основные понятия индуктивного вывода

Рассмотрим некоторые важнейшие понятия индуктивного вывода, которые будут являться центральными для всего дальнейшего изложения. При этом будем учитывать, что для каждого из этих понятий существует набор эквивалентных терминов, свойственных различным областям знаний.

Исходная информация, на основе которой осуществляется вывод, может обозначаться такими терминами, как «частные факты», «набор исходных данных» («данные наблюдений»), «выборка измеренных значений случайной величины», «реализация случайного процесса». Здесь будет использоваться в основном термин «данные», а термин «Выборка» будет фигурировать преимущественно в контексте рассмотрения статистических методов. Исходный набор данных в дальнейшем будет обозначаться символом D.

Для обозначения результатов индуктивного вывода могут использоваться следующие понятия: «гипотеза» (реже — «теория»), «общее правило», «модель» и «оцененные параметры». Термины «гипотеза» и «модель» мы будем употреблять наравне, привнося в них в качестве отличия лишь слабый смысловой оттенок следующего содержания. В определенных контекстах под гипотезой будет пониматься атомарный объект, принадлежащий некоторому множеству таких же неделимых объектов, а под моделью — объект, обладающий (возможно, сложной) внутренней структурой. Таким образом, в то время как гипотезы выбираются, модели могут конструироваться. Некоторая гипотеза будет обозначаться с помощью символа h, если сущность гипотезы не уточняется (например, если не говорится, что гипотезой является программа для машины Тьюринга или класс образов).

Все возможные результаты вывода объединяются в пространство (или множество) гипотез либо образуют класс моделей. Наряду с этими терминами может также использоваться и такое понятие, как «язык представления» (или просто «представление»). Это понятие особенно удобно использовать, когда модель, описывающая исходные данные, задается в виде цепочки символов. Изредка может использоваться также и такой термин, как «метамодель», который указывает, что само пространство гипотез (или язык представления) может варьироваться, являясь результатом индуктивного вывода следующего уровня, имеющего дело с целой предметной областью. Пространство гипотез будет обозначаться с помощью символа Н.

Одним из наиболее важных элементов индуктивного вывода является критерий, с помощью которого производится сравнение альтернативных гипотез. Он также называется критерием рациональности выводов и может уточняться либо как точность предсказания, даваемая моделью, либо как близость данной модели к «истинной» модели. На возможных вариантах задания этого критерия мы чуть подробнее остановимся ниже. Качество некоторой гипотезы h при условии, что есть исходные данные D, будет обозначаться как r(h|D).

Для наименования самого процесса вывода могут использоваться различные термины, конкретизирующие привлекаемый метод, например «статистический вывод» или, еще более узко, «байесовский вывод». Более общие названия этого процесса: индуктивный вывод, оценивание параметров, выбор или поиск модели. Выбор лучшей гипотезы можно описать следующим образом:

formula_50

Здесь не указывается, к каким именно предметным областям относятся те или иные термины. Такую информацию можно найти, например, в работе [2, табл. 1.1-1.3].

Помимо терминологических расхождений в различных подобластях индуктивного вывода дополнительная путаница может возникать из-за существования определенных отличий индуктивного вывода от близких проблем анализа данных, в которых ставятся другие цели, такие как предсказание или принятие решений (о вопросе разделения индуктивного вывода и теории принятия решений см., например, [1, гл. 13-14]). Для нашего изложения эти различия зачастую будут несущественными, но при необходимости мы будем на них указывать.