Читать книгу «Культурно-историческая психология волевого действия: От прогноза – к поступку» онлайн полностью📖 — Вячеслава Андреевича Иванникова — MyBook.





Рис. 1. Весовой коэффициент давности событий.

На оси ординат – весовой коэффициент давности, на оси абсцисс – давность событий: I – кратковременный недавний опыт «перевешивает» более длительный, но давний; II – по прошествии некоторого времени этот «перевес» утрачивается; III – повторное обучение требует меньше времени, чем первоначальное


Наряду с описанными выше ящиками, на передней панели которых записано одно какое-либо событие (ящики первого порядка), заведем в нашей модели еще ящики второго порядка – такие ящики, на передней панели которых записаны два последовательных события: АА, АВ, АС,, BA, ВВ, ВС…, СА, СВ, СС,…. Карточка D, поставленная, например, в ящик АВ, означает, что событие D произошло после события В, перед которым было событие А. В приведенном выше примере карточка D будет частой карточкой в ящике АВ и редкой – в ящике СВ.

Ящики второго порядка, как следует из изложенного, обеспечивают лучшее вероятностное прогнозирование, чем ящики первого порядка. Еще более надежное прогнозирование обеспечивают ящики третьего порядка, на которых записаны три последовательных события: наличие большого числа карточек D в ящике DAB, например, означает, что если после D следовали события А и В, то с высокой вероятностью вновь произойдет событие D.

Ящики второго и более высоких порядков не только обеспечивают лучший прогноз, чем ящики первого порядка, но и дают возможность выработки «ситуационных» условных рефлексов. Представим себе такую ситуацию. Физиологи А и В работают на одних и тех же собаках, но в разное время. Физиолог А подкрепляет звонок С пищей D. Физиолог В – легким уколом лапы Е. В первом случае у собаки возникает пищевая реакция, во втором – оборонительная. Если звонка нет, собака не реагирует пищевой или оборонительной реакцией на вид физиологов А и В. На звонок же она после выработки условных рефлексов реагирует по-разному. Если перед звонком С она видела физиолога А, то она, не дожидаясь подкрепления D, отвечает пищевой реакцией. Если перед звонком С она видела физиолога В, то, не дожидаясь подкрепления Е, реагирует отдергиванием лапы. В модели это обеспечивается тем, что карточки D (пища) попадают в ящик АС, а карточки Е (укол) – в ящик ВС. Поэтому при возникновении комплекса событий А и С прогнозируется высокая вероятность возникновения события D; если эта вероятность P(D/AC) близка к единице, то наблюдается пищевая реакция. При возникновении же комплекса событий В и С прогнозируется высокая вероятность возникновения события Е; если Р(Е/ВС) выше некоторого «порогового» уровня, наступает оборонительная реакция.

Наличие в модели ящиков высоких (второго и выше) порядков позволяет моделировать не только классические условные рефлексы, описанные И. П. Павловым, но и условные рефлексы, названные Ю. Конорским условными рефлексами второго типа (в отличие от классических – условных рефлексов первого типа). Условные рефлексы второго типа известны в литературе и под другими названиями – инструментальных условных реакций или оперантного поведения.

В чем же различие между условными рефлексами первого и второго типа?

Общая схема условного рефлекса первого типа может быть записана символически следующим образом. Исходное состояние системы таково, что стимул SA вызывает реакцию RA (SA→RA). Другой стимул SB реакции RA не вызывает. Если же вслед за стимулом SB следует стимул SA, то реакция RA возникает (SBSRA). В этом случае принято говорить, что условный раздражитель SB «подкрепляется» безусловным раздражителем SA. Если теперь такое совместное действие стимулов SB и SA повторяется достаточное число (n) раз, то уже одного стимула SB оказывается достаточно, чтобы вызвать реакцию RA. Коротко это будет выглядеть так:


SA вызывает RA

SB не вызывает RA

SBSA вызывает RA

………….

…………. n раз

………….

SB вызывает RA.


Для характеристики условного рефлекса второго типа опишем один из экспериментов Конорского. Собаку оставляли в пустом помещении. Время от времени собака без видимой причины лаяла. Каждые несколько минут раздавался стук метронома, и если собака в этот момент лаяла, то из пищевого контейнера падал кусочек мяса. Вскоре собака стала лаять в экспериментальной обстановке постоянно. Но лай «подкреплялся» мясом только тогда, когда стучал метроном. В результате собака начинала лаять именно тогда, когда стучал метроном. Именно так осуществляется дрессировка животных, когда животное учат в ответ на определенный сигнал выполнять определенное действие.

Если мы теперь сравним условные рефлексы первого и второго типа, то увидим, что за сходством терминологии здесь скрывается существенное различие явлений. В первом случае «подкрепляющим» называют такой стимул, который «безусловно» вызывает у животного вырабатываемую реакцию (SA→RA). Так, в опытах с пищевыми условными рефлексами мясо (подкрепляющий стимул) «безусловно» вызывает пищевую реакцию – слюноотделение. Во втором же случае вообще нет такого стимула, который «безусловно» вызывает лай. «Подкрепление» же (мясо) играет другую роль – роль вознаграждения. В условных рефлексах второго типа нет аналога ситуации SA→RA

В нашей модели наличие ящиков первого порядка достаточно для моделирования классических условных рефлексов, но не может обеспечить реализации условных рефлексов второго типа. Иначе обстоит дело, если использовать ящики высших порядков. Наличие карточки F в ящике ЕС моделирует след в памяти того, что событие F произошло после С, которому предшествовало Е. Из вышесказанного ясно, как ящик ЕС может быть использован для того, чтобы осуществить вероятностное прогнозирование предстоящих событий, в частности предсказать вероятность наступления события F.

Но ящики второго (и более высокого) порядка могут быть использованы еще и другим образом. Под каждой буквой (в нашем примере F, Е, С) можно понимать любое событие, воспринимаемое животным. Таким событием может быть и внешнее явление, и собственное действие животного: сгибание лапы, лай и т. п.

Пусть F будет означать появление мяса, Е – стук метронома, С – лай. Послышался стук метронома Е. Собаке же хочется мяса F. Что надо сделать, чтобы с наибольшей вероятностью получить мясо? В памяти-картотеке просматриваются ящики ЕА, ЕВ, ЕС,, где А, В, С… – различные действия собаки. В каждом из этих ящиков подсчитывается вероятность наступления желаемого события (появление мяса). Таким образом, используя ящики второго порядка, можно не только осуществлять вероятностное прогнозирование внешних событий, но и строить планы собственных действий С, приводящих с наибольшей вероятностью в заданных условиях (произошло Е) к желаемому результату («хочу мяса» – Е). Еще лучше эта задача решается с ящиками более высоких порядков. Ящики n-го порядка позволяют строить планы действий, состоящие из n минус 1 шагов, приводящих с наибольшей вероятностью к желаемому результату в заданных условиях. С помощью ящиков n-го порядка можно строить и более короткие планы действий – из n минус к шагов, но зато к первых элементов будут использованы для более точного прогноза.

Чем более высокого порядка ящиками располагает модель, тем точнее она осуществляет вероятностное прогнозирование, тем более длинные планы действий можно строить. Но это дается ценой значительно большей громоздкости памяти и «перебора» при выборе из памяти. Число ящиков в модели сильно увеличивается при возрастании их высшего порядка (n).

При том же числе т возможных событий (т. е. таких событий, которые наступили хоть раз в жизни модели) модель может содержать: ящиков первого порядка – т, ящиков второго порядка – m2, ящиков третьего порядка – m3,, ящиков n порядка – mn.

Так что в простой среде пользоваться ящиками высоких порядков нецелесообразно: процедура прогнозирования становится громоздкой и длительной, а выигрыш в точности может быть малым или даже совсем отсутствовать (если, например, среда представляет собой бернуллиеву последовательность, т. е. случайную последовательность, в которой вероятность возникновения того или иного события не зависит от предшествовавшего события).

Здесь мы сталкиваемся с тем, что стремление улучшить вероятностное прогнозирование приводит к чрезвычайно громоздкой модели памяти. А нельзя ли каким-либо образом несколько разгрузить память, не ухудшая результатов вероятностного прогнозирования? Нельзя ли запоминать не все в равной степени и даже кое-что совсем не запоминать? Вслед за этим сразу же возникает другой вопрос: что именно надо запоминать более основательно, чтобы сохранить способность к вероятностному прогнозированию?

Пусть наша модель запоминает не все, что поступит на ее вход, с одинаковой глубиной. До сих пор блок памяти системы имел на входе сигналы («внешние события»), а на выходе, в качестве конечного продукта, – вероятностный прогноз, который мог быть использован следующими блоками, осуществляющими преднастройку. Теперь же и сам блок памяти должен будет использовать свой «продукт» – прогноз.

Если произошло событие А, то с помощью ящика «А» подсчитывается Р(А) – вероятность того, что снова произойдет А, Р(В) – вероятность того, что наступит событие В…, Р(К) – вероятность того, что наступит событие К. Это и есть вероятностный прогноз.

Предположим, что после этого наступило событие Y – событие, вероятность наступления которого, согласно прогнозу, равнялась P(Y). Теперь, как мы уже писали выше, следует поставить карточку Y в ящик А. Но карточка ставится с разным «весом» в зависимости от степени неожиданности события Y, она ставится с коэффициентом 1— P(Y).

Назовем эту величину коэффициентом неожиданности. Если в прошлом опыте после А всегда следовало Y, то Р(Y) = 1 (субъективная «модель среды» точно соответствует среде). Тогда 1—Р(Y) = 0, т. е. повторно наступившее событие Y не запоминается, не загружает память. В жестко детерминированной среде модель перестает запоминать, как только «научается» безошибочно прогнозировать ход событий. Но, если среда изменится и наступит не то событие, которое прогнозировалось, это событие врежется в память с максимальным коэффициентом неожиданности 1–0 = 1. Каждое событие запоминается тем сильнее (т. е. оказывается труднее забываемым), чем более неожиданным (удивительным) было возникновение его в данный момент.

Вероятности ожидания сигналов или ситуаций могут меняться от Р = 1 до очень маленьких величин. Всегда ли субъект учитывает все значения вероятностей или он может работать более экономно?

Можно предположить, что преднастройка осуществляется лишь по отношению к действиям, адекватным такой ситуации, возникновение которой прогнозируется с вероятностью, превышающей некоторую минимальную величину Р0. Величина Р0 играет роль абсолютного порога вероятностного прогноза. К ситуациям, появление которых прогнозируется с вероятностью меньшей, чем Р0 преднастройка не осуществляется. Если Р0 = 1/10 (а из экспериментальных данных вытекает, что это примерно так), то при наличии равновероятных сигналов вероятностный прогноз достигает пороговой величины Р0 лишь при числе сигналов до 10; при большем числе сигналов вероятностный прогноз появления каждого из них меньше порогового. Если же сигналы возникают с неодинаковыми вероятностями, то среди них могут оказаться сигналы с Р>0,1, но число таких сигналов будет всегда меньше 10 – независимо от общего числа сигналов. А это значит, что, как бы велико ни было число возможных сигналов, при наличии порога Р0 организм упрощает ситуацию так, как будто число возможных сигналов не больше, чем 1/Р0 (т. е. не более 10 в приводимом примере). Наличие порога Р0 позволяет при большом общем числе альтернатив принимать во внимание при прогнозировании лишь небольшую часть (не более 1/Р0) наиболее вероятных альтернатив.

Различие в подготовке к действиям на два сигнала наблюдается лишь тогда, когда различие прогнозируемой вероятности появления этих сигналов достаточно велико, больше некоторого ΔР – дифференциального вероятностного порога. В частности, для выработки условного рефлекса выработка прогноза с Р = 1 не является необходимой (такая ситуация практически недостижима даже в эксперименте); достаточно, чтобы прогнозируемая вероятность подкрепления была близкой к единице (Р≥1–ΔР).

Описанная структура памяти отражает лишь одну ее сторону, но именно ту, которая позволяет понять, как из прошлого опыта создается прогноз будущего, как осуществляется вероятностное прогнозирование.

1
...
...
7