Искусственная жизнь

Классический подход в области ИИ имеет дело с чрезвычайно сложными системами, по сути, конструируемыми вручную. Методы машинного обучения позволяют несколько уменьшить эту сложность. Однако программы, априорно закладываемые в аниматов и когнитивных роботов, также оказываются весьма сложными. Ведь одному агенту в процессе обучения затруднительно получить нужный объем информации, обеспечивающий адаптивное поведение. В природе он был накоплен в ходе эволюции, вовлекающей большое число организмов, выживание которых служило критерием правильности программ поведения. Очень соблазнительной для разработчика ИИ является идея не заниматься созданием этих программ самому, а заставить это делать компьютер. Казалось бы, что проще: создать виртуальный мир, в котором искусственные существа будут размножаться, бороться за выживание и в результате действия «естественного» отбора будут становиться все более интеллектуальными! Осталось лишь запрограммировать такой мир и подождать, пока в нем возникнет ИИ!

Если бы все было так просто, то ИИ давно был бы создан, ведь додуматься до этой идеи несложно. Почему же она не работает? Элементарный, но далеко не полный, ответ на этот вопрос заключается в том, что эволюция шла миллиарды лет, вовлекая огромное количество живых существ (относящихся на сегодняшний день, как минимум, к нескольким миллионам разных видов, при том, что численность представителей некоторых видов может составлять многие триллионы особей). Исходя лишь из этого, идея подробного моделирования эволюции на компьютере покажется крайне наивной. А для того, чтобы искусственная эволюция смогла породить ИИ за обозримое время, она должна была бы действовать не методом грубой силы, а сама быть весьма интеллектуальной. Тем не менее попытки производить эволюцию искусственных живых существ могут оказаться полезными. В конце концов, естественный интеллект возник эволюционным путем.

В 1987 году оформилось направление исследований, получившее название «Искусственная жизнь» (ИЖ). Произошло это после проведения одноименной конференции. Как и в случае «Адаптивного поведения», многие сходные исследования проводились и ранее. В частности, классическими стали работы начала 1960-х годов по коллективному поведению автоматов Михаила Львовича Цетлина (коллеги М. М. Бонгарда).

В рамках ИЖ создаются своего рода искусственные существа, которые помещаются в некий специально сконструированный «мир». В этом мире искусственные существа «живут» и «эволюционируют». Как правило, это небольшой виртуальный (цифровой) мир с достаточно простыми законами. Изредка в качестве полигона для функционирования этих существ выбирается реальный цифровой мир, в роли которого выступает Интернет. В рамках направления «искусственная жизнь» существа обычно не помещаются в физический мир, так как в нем на настоящий момент невозможно организовать эволюцию искусственных существ, да и эта эволюция была бы слишком медленной.

Исследования ИЖ тесно примыкают к исследованиям «Адаптивного поведения», и не всегда их просто разделить. Но аниматы чаще представляют собой физически реализованных роботов, эволюцию которых обеспечить проблематично (хотя в очень упрощенном смысле возможно), тогда как в ИЖ существа являются виртуальными, имеют более простое строение (как тела, так и системы управления), но зато подвергаются эволюции. Основной целью исследований в направлении «искусственная жизнь» является раскрытие, формализация и моделирование принципов организации биологической жизни и процесса ее развития в ходе эволюции.

Еще сложнее отделить эти исследования от некоторых подразделов «Вычислительной биологии» или «Эволюционной кибернетики». В целом, однако, многие исследователи указывают (например, такое мнение высказывал В. Г. Редько в упоминавшемся уже сборнике «От моделей поведения к искусственному интеллекту») на большую «игрушечность» ИЖ. Действительно, здесь не строятся подробные биохимические модели работы нейронов или экспрессии генов. Но, возможно, рассмотрение именно упрощенных моделей позволит отделить содержание механизмов эволюции от частных деталей их физического воплощения, а также исследовать жизнь не только в той форме, в которой она есть в конкретных земных условиях, но и в той форме, в какой она могла бы быть в принципе.

Рассмотрим простейший, типичный для «искусственной жизни», виртуальный мир, представляющий собой прямоугольное поле, разбитое на клетки, как показано на рисунке. В каждой клетке может присутствовать травоядное животное (Ж), хищник (Х) или растение (*), или клетка может быть пустой.

Животное располагается в некоторой клетке и через «сенсоры» получает информацию о содержимом некоторого коли чества соседних клеток (для одного из животных на рисунке закрашенных серым). При этом животное может совершить одно из доступных действий: остаться на месте или переместиться, а если находится в одной клетке с другим объектом, то произвести взаимодействие с ним, например, съесть его. Обычно вводится возможность размножения. Это может быть как размножение делением, так и половое размножение. Любое действие требует энергии, которая пополняется за счет поглощения пищи.

Способностью к развитию в этом мире можно снабдить только один вид его обитателей или же все виды. Даже простое сравнение этих двух случаев может позволить сделать много важных выводов, в частности, о роли коэволюции. В исследованиях по ИИ эволюционирующими, как правило, делаются не «физические» параметры животных (если, конечно, не решается оптимизационная задача в целях конструирования некоторого реального механизма), а их программы управления. Иногда также эволюционным изменениям подвергаются сенсоры. Разнообразие возможных программ управления, способ их представления и модификации при размножении полностью зависят от разработчика.

Помимо дискретных миров, в которых организмы занимают целиком одну клетку, также распространено создание миров, в которых положение животных описывается вещественными координатами, а сами животные имеют ненулевой размер и некоторую форму. Здесь могут возникать сложные проблемы управления непрерывным движением.

Из-за большого произвола в том, какой именно создавать мир, как описывать программы управления животными и их эволюцию, а также из-за отсутствия какой-либо четкой методологии в данной молодой области исследований большинство работ здесь являются интересными, но не связанными друг с другом экспериментами, интерпретации результатов которых весьма нестрогие.

Как отмечалось, надеяться на возникновение разума в подобных искусственных мирах наивно, и мало кто в качестве цели рассматривает создание искусственной жизни как таковой. Так в чем же смысл их конструирования? Как правило, каждый из подобных экспериментов ставится в целях проверки какой-то идеи или гипотезы об эволюционных механизмах. Именно отталкиваясь от конкретной проверяемой идеи, исследователь выбирает параметры виртуального мира и способ описания управляющих программ. Если «искусственная жизнь» создается без четко осознаваемых целей, то это, хотя и может быть весьма увлекательным, не является исследованием в области ИИ.

Вопросы, которые можно исследовать с помощью «искусственной жизни», весьма разнообразны. Это и влияние априорной информации о мире на выживаемость, и проверка моделей инстинктов, и возникновение системных явлений при возможности передачи информации между особями, и многое другое. Так, вместо задания управляющей нейронной сети, обеспечивающей случайный поиск, можно попытаться получить ее эволюционно. Также в рамках ИЖ может быть проверена роль разных эмоций для выживания.

Путем моделирования была проверена, например, концепция эволюционно устойчивых стратегий, согласно которой в результате эволюции возникает не лучшая (для вида в целом) форма поведения особей, а эволюционно устойчивая, т. е. такая, что отклонение поведения отдельной особи от нее оказывается невыгодным для самой особи, а не для вида. К примеру, пусть особям доступны две поведенческие стратегии: кооперация и агрессия. Если обе встретившиеся особи выбрали кооперацию, то они получают небольшой выигрыш. Если одна особь выбирает кооперацию, а другая — агрессию, то первая особь получает большой убыток, а вторая — выигрыш. Если обе особи выбирают агрессию, то получают некоторый убыток. Всеобщая кооперация была бы оптимальна для вида в целом. Но агрессивная особь, случайно появившаяся в такой популяции, будет получать очень большой выигрыш, т. е. всеобщая кооперация не является эволюционно устойчивой (в рамках данной модели). Моделирование показывает, что в конечном итоге образуется популяция со смешанной стратегией: часть особей проявляют агрессию, а часть предпочитают кооперацию (конкретные доли тех и других типов поведения определяются установленными значениями выигрышей и потерь), что как будто подтверждает тезис об эволюционно устойчивых стратегиях. Стоит отметить тесную связь эволюционно устойчивых стратегий и упоминавшегося (при обсуждении эвристического программирования) понятия равновесия Нэша из теории игр. Однако модели «искусственной жизни» не просто подтверждают известный факт существования равновесных стратегий, но и показывают, как они достигаются естественным эволюционным путем.

Однако нужно еще раз подчеркнуть, что интерпретация результатов таких экспериментов должна быть осторожной. В частности, в этом эксперименте не предусматривалась возможность существования нескольких эволюционно устойчивых стратегий. Если же реализовать несколько конкурирующих социумов, то из них «выиграет» тот, у которого стратегия поведения будет не только эволюционно устойчивой, но также и лучшей для вида в целом. Одновременную полезность и ограниченность подобных моделей легче продемонстрировать на выборе стратегии поведения человеком.

Возьмем, к примеру, поведение водителей на дороге. «Агрессивный» водитель чаще идет на обгон, делает перестроения и т. д., тогда как «кооперирующийся» водитель чаще уступает дорогу и едет более предсказуемо для других водителей. Если «агрессивных» водителей мало, то они будут получать выигрыш (иногда заметный, например, при объезде пробки по встречной полосе или обочине), снижая эффективность движения «кооперирующихся» водителей. Но если число «агрессивных» водителей начнет увеличиваться, то частые встречи друг с другом начнут приводить к заметному проигрышу (авариям, росту пробок и т. д.). Конечно, в среднем всем водителям было бы лучше, если бы они придерживались стратегии кооперации (очевидно, уменьшилось бы число аварий, а следовательно, и пробок). Но чистая стратегия кооперации не является устойчивой: один «агрессивный» водитель получит большой выигрыш. Равновесие наступает, когда соотношение «кооперирующихся» и «агрессивных» водителей таково, что их выигрыш в среднем одинаковый (а вовсе не максимальный), что будто бы и наблюдается на практике.

Но так ли хорошо эта модель все объясняет? Она может быть подогнана под любое соотношение стратегий агрессии и кооперации путем подбора значений выигрышей и проигрышей. Самое главное, чего она не объясняет, откуда берутся эти самые значения. Легко можно найти две страны (или даже два города в одной стране) с одинаковым уровнем штрафов за нарушения правил и прочими формальными показателями «выигрышей» и «проигрышей», но совершенно разным соотношением двух стратегий. Еще более отчетливо это видно на соотношении преступников и законопослушных граждан. Вряд ли кто-то скажет, что это соотношение определяется только значениями выигрышей и проигрышей. Вернее, так можно сказать, если включить в эти значения «нравственные слагаемые», само возникновение которых идеей эволюционно устойчивых стратегий не объясняется. Также и в биологической эволюции вполне могут возникать мутации, приводящие к смещению самих значений выигрышей и проигрышей. Так что идея эволюционно устойчивых стратегий объясняет формирование стратегий поведения только локально, в текущих сложившихся обстоятельствах, и, несмотря на явное подтверждение в моделях искусственной жизни, ее нельзя применять слишком широко.

Еще один интересный эффект, корректность которого можно проверить с помощью моделей искусственной жизни, — это эффекта Болдуина (Балдвина). Суть этого эффекта состоит в том, что навыки, приобретаемые организмами в течение жизни в результате обучения, через некоторое число поколений оказываются записанными в геном. Этот эффект, на первый взгляд, противоречащий дарвиновской концепции эволюции, предположительно объясняется следующим образом.

Полагается, что этот эффект работает в два этапа. На первом этапе организмы приобретают некоторый полезный навык в результате обучения и передачи его из поколения в поколение без участия генов. Поскольку навык полезен, особи, обучающиеся ему, начинают превалировать в популяции. На втором этапе элементы этого навыка в результате мутаций появляются в геноме. Если какой-то элемент навыка оказался в генотипе конкретной особи, то ей нужно будет в течение жизни уже меньше обучаться для полного формирования навыка, т. е. особь этот навык получит раньше, при меньших энергетических и временных затратах. Через некоторое (вероятно, большое) количество популяций навык будет полностью переведен в геном. В результате неэффективных по отдельности мутаций формирование сложного навыка крайне проблематично, но в рамках данной схемы навык может постепенно изобретаться эволюцией под «руководством» результатов обучения. Ряд моделей искусственной жизни подтвердили принципиальную реализуемость эффекта Болдуина на основе классической дарвиновской эволюции.

Один из наиболее интересных вопросов, который может быть поставлен в рамках ИЖ, — это вопрос о том, насколько универсально понятие интеллекта. Иными словами, в любом ли мире он мог возникнуть? Здесь речь не идет о том, каковы должны быть физические законы, чтобы могла возникнуть (разумная) жизнь. В ИЖ жизнь имеется априорно, и ее система управления моделируется на информационном, а не физическом уровне. В связи с этим вопрос ставится по-другому: какими свойствами должен обладать мир, чтобы интеллект в нем обеспечивал выживаемость? В действительности, даже в нашем мире связь между интеллектом и выживаемостью не столь очевидна. Ведь в природе вполне успешно существует множество гораздо более многочисленных, но гораздо менее интеллектуальных видов. Тем не менее люди обычно не спорят с тем, что интеллект им для выживания полезен.

В виртуальных мирах повышение интеллектуальности происходит лишь до определенного (обычно очень незначительного) уровня. Достаточно четко проявляется зависимость этого уровня от свойств мира. Если мир слишком простой или, наоборот, слишком сложный, то поведение модельных организмов, как правило, мало совершенствуется в ходе эволюции. Для хорошей (в смысле усложнения поведения) эволюции мир сам должен постепенно усложняться. Чем-то это похоже на инкрементное обучение ребенка: если ему давать слишком сложные задачи, он их не сможет решить и развиваться не будет; но также если ему давать все время одинаковые простые задачи, то в обучении тоже не будет прогресса. В случае эволюции усложнение мира отчасти возникает за счет того, что одни животные являются «внешней средой» для других животных (нередко считается, что это ключевой фактор). Действительно, для успешной «жизни» в таком элементарном мире, как игра го, требуется достаточно сложное мышление благодаря существованию противника, правда, вряд ли оно включает самосознание или возможность размышления об искусственном интеллекте. Кроме того, нельзя утверждать, что усложнение окружающей среды является самим собой разумеющимся процессом.

В связи с этим также возникает вопрос об универсальности интеллекта, о том, насколько он привязан к нашему миру. Конечно, все наши конкретные знания — это знания об этом мире. Но может показаться, будто мы могли бы познать любой другой мир, имея о нем достаточно данных.

Универсальность интеллекта сродни универсальности математики. Складывается впечатление, что математика идеальна (от слова «идея»), т. е. независима от физической реальности. Но так ли это? Возьмем число пи. Универсально ли оно? Оно встречается во многих формулах, которые, казалось бы, не имеют никакого отношения к физической длине единичной окружности. Однако это число возникает из-за того, что окружающее пространство почти евклидово, и находит применение по той же причине. Можно представить себе другое пространство, в котором будет другое число пи, но мы о нем даже не знаем, поскольку оно нам не нужно. Математика позволяет создавать самые разные системы, но в ней исследуются лишь немногие из них. Может ли математическая логика быть ошибочной в какой-то другой вселенной? Нет, не может. Но она там может быть просто бесполезной. Все то же касается и интеллекта.

Если допустить, что мир может быть абсолютно произвольным и разум о нем заранее ничего не знает, то он сможет в нем действовать только полностью случайным поиском. Можно допустить возможность обучения, но наилучший (или просто работоспособный) механизм обучения тоже зависит от свойств мира. Мы видели, что механизмы обучения у человека, например при формировании понятий, да и просто условные рефлексы опираются на одновременность событий или, по крайней мере, на то, что связанные события не сильно разнесены во времени, и что причина предшествует следствию, и то, что они должны быть близки в пространстве. Если бы не было этой горы весьма спорных, с точки зрения гипотетического универсального разума, предположений, то пришлось бы рассматривать влияние падения капли дождя на удаленной планете на оценку школьника за контрольную.

При обсуждении проблемы индивидуальной случайности строки символов упоминалась игра «камень-ножницы-бумага». Пусть один из игроков является интеллектуальным агентом, а второй — внешним миром (в то же время представляющим собой сверхсложный интеллект, который учитывает всю предысторию игры). Агент будет всегда проще, «глупее», мира, и любая регулярность в его поведении обернется против него. В таком сложном мире полностью случайный выбор (если у агента есть источник хаоса) будет оптимальной стратегией. Можно лишь порадоваться, что наш мир устроен гораздо проще, но даже эта простота может быть обнаружена лишь при надлежащем способе описания. Другой мир может быть настолько отличным от нашего, что для получения нужного способа описания, т. е. нужного распределения априорных вероятностей моделей, придется заново воспроизвести всю эволюцию.

Можно также вспомнить гипотезу Пенроуза об алгоритмически невычислимых процессах. Даже если их нет в нашем мире, то можно представить себе такую гипотетическую вселенную, где они в порядке вещей. В ней разум из «алгоритмической вселенной» точно будет бесполезен. Стоит отметить, что если бы в каком-то мире протекали невычислимые процессы и интеллекту для обеспечения выживания нужно было бы решать алгоритмически неразрешимые проблемы, то он бы это умел делать, поскольку мог бы использовать эти физические процессы, являясь частью этого мира.

Таким образом, очевидно, что зависимость разума от мира чрезвычайно велика и распространяется вплоть до физических законов. Возможно, основные компоненты интеллекта — поиск в пространстве решений, представление знаний, обучение (построение моделей), предсказание и т. д. — являются сравнительно универсальными. Однако то содержание мышления, которое как раз и не удается пока в полной мере воспроизвести в компьютере, полностью определяется устройством нашего мира. Возможно, с этим содержанием и связан истинный феномен интеллекта. Тогда интеллект — не сами процессы построения моделей или предсказание, а содержание этих процессов.

Хотя направление «Искусственная жизнь» и позволяет ставить интересные вопросы, но ответы на них если и дает, то пока весьма расплывчатые. Один из важных для создателей ИИ вопросов, на который вряд ли сейчас можно получить ответ посредством моделирования, заключается в том, какая доля нашего интеллекта заложена от рождения.