Конвергенция идей

Редько В.Г.

ИПМ им. М.В. Келдыша РАН

www.keldysh.ru/pages/BioCyber/

1. Конвергенция идей

В книге "Характер физических законов" Р. Фейнман [1] говорил, что в древней математике было две традиции: вавилонская и греческая. "В вавилонских школах математики ученик решал огромное множество примеров, пока не улавливал общего правила" [1]. В греческой школе, напротив, вся геометрия строится на основе небольшого числа аксиом. Говоря о физике, Р. Фейнман пишет, что для физики нужен вавилонский метод, а не греческий, так как вавилонский метод позволяет глубже прочувствовать связи между идеями и отдельными составляющими знания, и для физики это важно. Подробнее аргументацию Р. Фейнмана см. в [1].

При исследовании адаптивного поведения нам, скорее всего, тоже нужен вавилонский подход. Тем более что в исследованиях адаптивного поведения мы находимся на значительно менее формализованном уровне знаний по сравнению с физикой, и здесь нужно пытаться делать обобщения и находить связи между отдельными идеями, концепциями и моделями. В настоящих заметках делается попытка обобщить и обсудить идеи и концепции, предложенные в статьях участников Круглого стола "Нейроинформатики-2002" и настоящего совещания.

Фактически, в целом ряде статей предлагаются близкие идеи. Такую конвергенцию идей можно увидеть в следующих статьях:

Вайнцвайг М.Н., Полякова М.П. О моделировании мышления [2]

Жданов А.А. О методе автономного адаптивного управления (ААУ) (Эта же статья в формате Word , Заархивировано WinZip) [3]

Тюменцев Ю.В. Интеллектуальные автономные системы: вызов информационным технологиям (PDF) [4]

Cамарин А.И. Модель адаптивного поведения мобильного робота, реализованная с использованием идей самоорганизации нейронных структур [5]

Бурцев М.С. Эволюционно-кибернетический подход к моделированию адаптивного поведения [6]

Анохин К.В., Бурцев М.С., Зарайская И.Ю., Лукашев А.О., Редько В.Г. Проект "Мозг Анимата": разработка модели адаптивного поведения на основе теории функциональных систем [7]

Практически всюду идет речь о подходах к моделированию Интеллектуального Адаптивного Поведения, поведения анимата (естественного или искусственного организма), которое должно обладать определенным набором свойств:

1) Автономность (анимат сам должен содержать свою систему управления).

2) Целенаправленность (анимат должен иметь свои собственные потребности и стремиться к их удовлетворению).

3) Иерархия целей; например, для биологического организма главная цель – выживание популяции, этой цели подчинены ведущие потребности: потребности размножения, безопасности, питания и накопления знаний.

4) Прогноз: предсказание будущих событий и адекватное использование этого предсказания в процессе адаптации к постоянно меняющейся внешней среде.
5) Формирование собственных внутренних моделей событий во внешней среде, формирование моделей своего взаимодействия с внешней средой.

Отметим, что, по-видимому, только 5-й пункт из этого списка характерных черт анимата не упоминается явно во всех перечисленных работах.

Необходимо подчеркнуть, что схема модели интеллектуального адаптивного поведения с близкими свойствами предлагалась еще около 30 лет назад М.М. Бонгардом с сотр. [8].

Пытаясь заглянуть в будущее исследований, добавим еще один пункт к перечисленным свойствам:

6) Формирование сигнальной обработки информации, формирование понятий, возникновение систем индуктивного вывода.

Итак, есть определенная конвергенция идей, и можно говорить о формирующейся парадигме – основе для моделирования интеллектуального адаптивного поведения. Но есть и другие точки зрения.

2. Но не все так просто

Казалось бы, совсем противоположный подход используется в работе:

Непомнящих В.А. Как животные решают плохо формализуемые задачи поиска [9]

В этой работе говорится о самоупорядоченном поведении животных. Например, анализируется поисковое поведение личинок ручейников. Поведение состоит из череды сменяющих друг друга фаз: а) фаза поиска скопления крупных частиц (необходимых для построения домика личинки) сменяется б) фазой сбора таких частиц. При этом переход от одной фазы к другой характеризуется определенной инерционностью (гистерезисом): если личинка находится в фазе поиска, то она не реагирует на отдельную крупную частицу, а если личинка находится в фазе сбора, то она не прекращает сбор, даже если некоторое время она не находит крупных частиц.

Более того, в статье В.А. Непомнящих аргументируется, что самоупорядоченное поведение характерно в целом для поискового поведения животных. Для удобства читателя цитирую здесь сформулированные в [9] принципы:

"… На основании сказанного выше можно предположить, как животные решают плохо формализуемые задачи. Прежде всего, они вообще не пытаются формализовать задачу поиска в той или иной конкретной среде. Они не исследуют среду для того, чтобы на основе собранной информации вычислить, например, пороговый размер приемлемых частиц, позволяющий завершить строительство с минимальными затратами времени и энергии. Вместо этого в их поведении можно увидеть другие принципы, которые мы намеренно приводим в полемичной формулировке, чтобы стимулировать их обсуждение:

· Поведение представляет собой спонтанный "самоупорядоченный" процесс, цель которого – воспроизведение самого себя и своей упорядоченности, а не решение каких-либо частных задач адаптации к внешней среде.

· Указанный процесс является обобщенной детерминированной моделью мира, в котором действует организм.

· Обобщенная модель приводится в соответствие с конкретной средой с помощью гипотез, которые основаны на отдельных внешних сигналах и проверяются на соответствие среде также только по отдельным сигналам. Это позволяет обойти проблему обработки всего потока информации из внешней среды."

Хочу отметить, что я "на собственной шкуре" прочувствовал необходимость использования понятия, сходного с понятием "спонтанный самоупорядоченный процесс". Дело в том, что мы с сотрудниками университета Коннектикут (П.В. Турчин с сотр.) разрабатываем компьютерную экологическую модель блуждания оленей в сложном ландшафте. В простейшем случае ландшафт представляет собой распределение пищи (травы). И мы сначала решили моделировать блуждание оленей просто: где пищи больше – туда олень и должен двигаться. Но не тут было. Биологи сказали: нет, это неправильно. Оказывается, есть такое понятие: коррелированное случайное блуждание (Correlated Random Walk, CRW) и это как раз и есть определенного рода "спонтанный самоупорядоченный процесс". И олень движется в соответствии с CRW, а распределение пищи только лишь модулирует CRW. И теперь нам приходится переделывать модель.

Необходимо отметить, что автор работы [9] – по-видимому, единственный человек в нашей стране, который внимательно следит за обширными исследованиями в мире в области адаптивного поведения. См. краткий, но содержательный обзор:

Непомнящих В.А. Поведение "аниматов" как модель поведения животных [10]

Тем не менее, рассмотрение поведения только лишь как спонтанного самоупорядоченного процесса вызывает целый ряд вопросов и, естественно, вызывает серьезную критику:

Чернавский А.В. О заметке В.А. Непомнящих "Как животные решают плохо формализуемые задачи поиска" [11]

3. "Тезис, антитезис, синтез"

Можем ли мы перейти к синтезу? Можем ли мы конструктивно учесть как спонтанный самоупорядоченный процесс, так и формирование Интеллектуального Адаптивного Поведения?

Естественно, что задача моделирования действительно интеллектуального поведения – чрезвычайно сложная. И я не решусь здесь строить его полноценную схему. Но все-таки, есть ли конструктивный подход, который мог бы наметить путь к указанному синтезу?

На мой взгляд, такой подход есть. Кратко очерчу его.

На ряде семинаров (семинар "Мозг", НИИНФ РАМН им. П.К. Анохина, семинар "Экобионика", ИСП РАН, МГТУ им. Н.Э. Баумана) К.В. Анохин обсуждал анализ поведения мышей (см. также [12]). Согласно этому анализу поведение мышей можно разбить на отдельные этапы, причем каждый из этапов состоит из двух фаз: а) формирования определенной схемы поведения и б) реализации этой схемы; или в терминах теории функциональных систем, а) формирование определенной функциональной системы (ФС) и б) реализации этой ФС. Здесь я не ручаюсь точно за терминологию, рассказываю суть. Реально мыши делают остановку (формируют ФС), а затем пробежку (реализуют ФС). И в целом процесс поведения животных происходит как цепочка остановок и пробежек:

Формирование ФС₁ --> реализация ФС₁ --> формирование ФС₂ --> реализация ФС₂-->…

И, по-видимому, сам процесс чередования этих этапов можно рассматривать как самоупорядоченный процесс. Но в процессе формирования ФС и перехода от одной ФС к следующей должны играть важную роль процессы обучения, коррекции ФС, т.е. процессы формирования "интеллектуального" поведения. Более того, в целом анализ экспериментальных данных (К.В. Анохин с сотр.), показывает, что у мышей формируется когнитивная карта, т.е. мыши запоминают топологию экспериментальной установки и явным образом учитывают эту топологию. Т.е. у мышей происходят явные "интеллектуальные" когнитивные процессы.

Отметим, что указанные этапы поведения (включающие формирование и реализацию отдельной ФС) можно характеризовать понятием "системоквант", см. например:

Судаков К.В. Системные основы интеллекта [13]

Итак, в поведении животных можно выделить как самоупорядоченные процессы, так и явные "интеллектуальные" когнитивные процессы.

4. Как же конкретно моделировать Интеллектуальное Адаптивное Поведение?

Говорить о будущих исследованиях сложно. Трудно заранее предвидеть, что получится из той или иной модели. Тем не менее, не претендуя на истину в последней инстанции, попробуем предложить и обсудить насколько направлений моделирования:

1) Развитие проекта "Мозг анимата":

В этой работе предложена схема модели иерархической системы управления с фиксированной иерархией целей поведения. Достоинство и одновременно недостаток этой схемы – ее механистичность, жестко зафиксированная иерархия. Достоинство состоит в том, что, благодаря механистичности, ясна схема модели и модель может быть до конца реализована. Недостаток – вряд ли такая механистичная схема есть у реальных животных.

Отметим, что предложенная в [7] схема близка к схеме проекта "Животное" М.М. Бонгарда с сотр. [8].

2) Разработка модели классического условного рефлекса

Когда лет 20 назад я начал разбираться, что же сделано в области моделирования "интеллектуальных изобретений" биологической эволюции, то с огромным удивлением обнаружил, что нет серьезной компьютерной/математической модели классического условного рефлекса (УР) , того самого условного рефлекса, который мы изучаем еще в школе. По крайней мере, я не обнаружил такой модели в доступной мне тогда литературе.

Точнее, какие-то модели есть, но они явно не ухватывают наиболее интересных свойств УР: а) прогнозирования будущих событий во внешней среде, б) самовосстановления, в) генерализации. Кратко поясним эти свойства. По-видимому, прогнозирование (формирование при выработке УР связи "за условным стимулом должен последовать безусловный") может рассматриваться как свойство, характеризующее биологический смысл УР: животному важно предвидеть будущие события во внешней среде, и когда появляется условный стимул, то оно готовится к появлению безусловного стимула. Как пишет Л.Г. Воронин [14], самовосстановление (восстановление реакции на условный стимул через некоторое время после угасания) – характерное свойство классического УР, позволяющее отличать его от более простых форм индивидуального приспособления. Генерализация – одна из важных стадий формирования УР, при которой реакция возникает как на условный стимул, так и на различные подобные ему (дифференцировочные) раздражители [15]. Интуитивно чувствуется, что при генерализации животное действует как бы методом проб и ошибок и именно здесь происходит поиск нужного для адаптивного поведения решения.

Недавно я все же обнаружил, что свойство прогнозирования для УР моделировалось Р. Саттоном и Э. Берто [16]. Также надо отметить, что есть еще важная работа по моделированию УР [17], выполненная исследователями из той же школы (А.Г. Клопф, Р. Саттон, Э. Берто). К сожалению, я так и не добрался познакомиться с этой работой (в Интернете я ее не нашел). Но если серьезно браться за моделирование УР, то, конечно, надо знакомиться со всем циклом исследований по УР, выполненных в данной школе.

3) Разработка моделей характерного "интеллектуального" адаптивного поведения для животных разного эволюционного уровня.

Здесь у меня есть только общие пожелания: промоделировать "интеллект"

- на уровне ручейника,

- на уровне моллюска,

- на уровне мыши, ...

Возможно, что именно такое моделирование, при явном и конкретном сопоставлении с поведением животных будет наиболее значимым и содержательным.

5. Пара слов о прикладных аспектах

Есть достаточно понятные приложения исследований аниматов – роботы и роботизированные системы. Об этих приложениях хорошо сказано в работе:

Тюменцев Ю.В. Интеллектуальные автономные системы: вызов информационным технологиям (PDF) [4]

Но, на мой взгляд, возможна и еще одна важная сфера приложений: управление адаптивным поведением социально-экономических систем. Свойства интеллектуального адаптивного поведения, перечисленные в разделе 1, могут быть отнесены ко многим достаточно автономным социально-экономическим структурам: промышленное предприятие, регион, государство, человечество. Например, Н.Н. Моисеев в последние годы жизни говорил о необходимости формирования концепции управляемого и направляемого развития человечества и биосферы, о необходимости становления Коллективного Интеллекта человечества, создания интернационального "Совета мудрецов". И возможно, исследования интеллектуального адаптивного поведения могли бы служить определенной научной основой для формирования концепции направляемого адаптивного развития человечества.

Литература:

1. P. Фейнман, Характер физических законов, М., "Наука", 1987. См. также:

http://vivovoco.rsl.ru/VV/Q_PROJECT/FEYNMAN/LECTURE2.HTM

2. Вайнцвайг М.Н., Полякова М.П. О моделировании мышления

http://www.keldysh.ru/pages/BioCyber/RT/Vaintsvaig.htm

3. Жданов А.А. О методе автономного адаптивного управления (ААУ) (Эта же статья в формате Word, Заархивировано WinZip)

http://www.keldysh.ru/pages/BioCyber/RT/Zhdanov/Zhdanov.htm

http://www.keldysh.ru/pages/BioCyber/RT/Zhdanov.zip

4. Тюменцев Ю.В. Интеллектуальные автономные системы: вызов информационным технологиям (PDF)

http://wsni2003.narod.ru/Papers/Tiumencev.pdf

5. Cамарин А.И. Модель адаптивного поведения мобильного робота, реализованная с использованием идей самоорганизации нейронных структур

http://wsni2003.narod.ru/Papers/Samarin.htm

6. Бурцев М.С. Эволюционно-кибернетический подход к моделированию адаптивного поведения

http://wsni2003.narod.ru/Papers/Burtsev.htm

7. Анохин К.В., Бурцев М.С., Зарайская И.Ю., Лукашев А.О., Редько В.Г. Проект "Мозг Анимата": разработка модели адаптивного поведения на основе теории функциональных систем

http://wsni2003.narod.ru/Papers/Anokhin.htm

8. Бонгард М.М., Лосев И.С., Смирнов М.С. Проект модели организации поведения - "Животное" // Моделирование обучения и поведения. М.: Наука, 1975. С.152-171. См. также:

http://www.keldysh.ru/pages/mrbur-web/misc/bongard.htm
http://mbur.narod.ru/misc/bongard.htm

9. Непомнящих В.А. Как животные решают плохо формализуемые задачи поиска

http://wsni2003.narod.ru/Papers/Nepomn.htm

10. Непомнящих В.А. Поведение "аниматов" как модель поведения животных

http://www.keldysh.ru/pages/BioCyber/RT/Nepomn.htm

11. Чернавский А.В. О заметке В.А. Непомнящих "Как животные решают плохо формализуемые задачи поиска"

http://wsni2003.narod.ru/Papers/Chernavsky.htm

12. T.V.Mukhina, A.B.Cherepov and K.V.Anokhin. Analysis of animal path trajectories in terms of individual behavioral acts // Behavior Research Methods, Instruments, and Computers

(submitted)

13. Судаков К.В. Системные основы интеллекта

www.keldysh.ru/pages/BioCyber/RT/PapInf/Sudakov.htm

14. Воронин Л.Г. Эволюция высшей нервной деятельности. М.: Наука. 1977.

15. Котляр Б.И., Шульговский В.В. Физиология центральной нервной системы. М.: Изд-во МГУ. 1979.

16. Sutton, R.S., & Barto, A.G. (1981). Toward a modern theory of adaptive networks: Expectation and prediction, Psychological Review 88:135-140. В электронном виде статья есть на сайте:

http://envy.cs.umass.edu/~rich/publications.html

17. A. Harry Klopf, James S. Morgan, and Scott E. Weaver. A Hierarchical Network of Control Systems that Learn: Modeling Nervous System Function During Classical and Instrumental Conditioning // Adaptive Behavior. 1993. Vol. 1, N. 3, PP. 263-319.