и т. д.
В величину вероятностного прогноза события В при условии, что непосредственно перед тем было А, входят: доля карточек В среди первых N
карточек в ящике А с коэффициентом а
, доля карточек В среди следующих N
карточек в ящике А с коэффициентом а
, доля карточек В среди следующих N
карточек в ящике А с коэффициентом а
и т. д. Вероятность того, что наступит событие В при условии, что произошло событие А, будет такой:
где а
>а
>а
….
Это и есть вероятность, с которой прогнозируется наступление события В в случае, если произошло А. Точно так же для любого другого события С:
При такой организации памяти моделируется уже не только вероятностное прогнозирование и, в частности, классический условный рефлекс; но и еще одно интересное явление, которое наблюдается в опытах по переделке условных рефлексов.
Пусть собака в определенных условиях после звонка всегда (в течение достаточно долгого времени) получала пищу. В результате в этих условиях после звонка у собаки начинается усиленное выделение слюны – результат того, что попадание пищи в рот прогнозируется с большой вероятностью. Однако в очередной раз после звонка собака не получила пищу, а последовало болевое раздражение лапы. То же повторилось в следующий раз после звонка – и еще несколько раз. Теперь уже в ответ на звонок собака отдергивает лапу, а усиления слюноотделения не наблюдается. Собака ведет себя так, как будто она «забыла», что ее кормили после звонка, но «помнит», что после звонка было больно лапе. Однако опыт показывает, что собака ничего не «забыла». Если оставить такую собаку на достаточно длительное время в покое (не кормить после звонка и не пользоваться током), а затем привести в лабораторию и включить звонок, у нее может возникнуть усиленное слюноотделение. Собака как бы «вспомнила», что ее когда-то кормили после звонка, и как бы «забыла» более недавние события – болевое раздражение после звонка.
Похожие явления можно наблюдать и у человека. В квартире во время ремонта перенесли выключатель – он был слева от двери, а стал справа. Первое время хозяин, заходя в квартиру, по привычке шел в темноте налево. Но через небольшое время он переучивается и идет уже к выключателю направо. Но если в это время хозяин уедет на месяц, то, вернувшись, он может снова начать искать выключатель на левой стороне, как говорят, «по старой памяти». Человек как бы «забыл» более недавний кратковременный опыт и как бы «вспомнил» ранее «забытый», более старый, но долговременный опыт.
Такое «забывание» старого при изменении среды и «вспоминание» после перерыва обеспечивается в модели с «весовым коэффициентом давности». Недавние события могут «перевешивать» даже длительный, но более старый опыт, благодаря высокому «весовому коэффициенту давности» (площадь S
на рисунке 1 больше площади S
). По прошествии длительного времени, когда «весовой коэффициент давности» тех же событий уменьшится, опыт этого короткого периода уже не доминирует над длительным опытом (площадь S
меньше площади S
). Но если теперь вновь восстановить такие же вероятностные характеристики среды, как в период t
t
, то обучение уже пойдет быстрее, чем в первый раз: площадь S
суммируется с площадью S"
; поэтому время повторного обучения t
t
окажется меньше времени первичного обучения t
t
. Повторное обучение требует тем меньшего времени, чем быстрее оно проводится после первичного обучения и чем длительнее было первичное обучение.
В модели, как она описана выше, вероятностное прогнозирование осуществляется по отношению к одному событию, предшествующему прогнозируемому событию. Ясно, однако, что такой прогноз не может быть достаточно надежным в среде, в которой имеются связи между событиями не только рядом стоящими, но и более отдаленными (марковские последовательности[2 - Марковской (по имени математика А. А. Маркова) называют такую случайную последовательность, составленную из элементов А, В…, К, в которой имеется зависимость между элементами. Эта зависимость выражается в том, что элемент D определяет вероятность P(E/D) того, что следующим в последовательности будет Е. Величина P(E/D) называется переходной вероятностью или условной вероятностью того, что при условии появления элемента (или возникновения события) D последует Е.] с «глубиной марковости» 2 и больше). Так, например, событие D может следовать с высокой вероятностью за событием В, если перед В было А, и с низкой вероятностью, если перед В было С. В описанной выше модели прогноз вероятности наступления события D после В осуществляется без учета того, какое событие предшествовало В – в ящике В не содержится информации о том, что предшествовало событию В.
Рис. 1. Весовой коэффициент давности событий.
На оси ординат – весовой коэффициент давности, на оси абсцисс – давность событий: I – кратковременный недавний опыт «перевешивает» более длительный, но давний; II – по прошествии некоторого времени этот «перевес» утрачивается; III – повторное обучение требует меньше времени, чем первоначальное
Наряду с описанными выше ящиками, на передней панели которых записано одно какое-либо событие (ящики первого порядка), заведем в нашей модели еще ящики второго порядка – такие ящики, на передней панели которых записаны два последовательных события: АА, АВ, АС,, BA, ВВ, ВС…, СА, СВ, СС,…. Карточка D, поставленная, например, в ящик АВ, означает, что событие D произошло после события В, перед которым было событие А. В приведенном выше примере карточка D будет частой карточкой в ящике АВ и редкой – в ящике СВ.
Ящики второго порядка, как следует из изложенного, обеспечивают лучшее вероятностное прогнозирование, чем ящики первого порядка. Еще более надежное прогнозирование обеспечивают ящики третьего порядка, на которых записаны три последовательных события: наличие большого числа карточек D в ящике DAB, например, означает, что если после D следовали события А и В, то с высокой вероятностью вновь произойдет событие D.
Ящики второго и более высоких порядков не только обеспечивают лучший прогноз, чем ящики первого порядка, но и дают возможность выработки «ситуационных» условных рефлексов. Представим себе такую ситуацию. Физиологи А и В работают на одних и тех же собаках, но в разное время. Физиолог А подкрепляет звонок С пищей D. Физиолог В – легким уколом лапы Е. В первом случае у собаки возникает пищевая реакция, во втором – оборонительная. Если звонка нет, собака не реагирует пищевой или оборонительной реакцией на вид физиологов А и В. На звонок же она после выработки условных рефлексов реагирует по-разному. Если перед звонком С она видела физиолога А, то она, не дожидаясь подкрепления D, отвечает пищевой реакцией. Если перед звонком С она видела физиолога В, то, не дожидаясь подкрепления Е, реагирует отдергиванием лапы. В модели это обеспечивается тем, что карточки D (пища) попадают в ящик АС, а карточки Е (укол) – в ящик ВС. Поэтому при возникновении комплекса событий А и С прогнозируется высокая вероятность возникновения события D; если эта вероятность P(D/AC) близка к единице, то наблюдается пищевая реакция. При возникновении же комплекса событий В и С прогнозируется высокая вероятность возникновения события Е; если Р(Е/ВС) выше некоторого «порогового» уровня, наступает оборонительная реакция.
Наличие в модели ящиков высоких (второго и выше) порядков позволяет моделировать не только классические условные рефлексы, описанные И. П. Павловым, но и условные рефлексы, названные Ю. Конорским условными рефлексами второго типа (в отличие от классических – условных рефлексов первого типа). Условные рефлексы второго типа известны в литературе и под другими названиями – инструментальных условных реакций или оперантного поведения.
В чем же различие между условными рефлексами первого и второго типа?
Общая схема условного рефлекса первого типа может быть записана символически следующим образом. Исходное состояние системы таково, что стимул SA вызывает реакцию R
(S
?R
). Другой стимул S
реакции R
не вызывает. Если же вслед за стимулом S
следует стимул S
, то реакция R
возникает (S
S
R
). В этом случае принято говорить, что условный раздражитель S
«подкрепляется» безусловным раздражителем S