古典的条件付けを使った「犬が望ましい行動を選択しやすい環境」作り

報酬ベースのトレーニング(正の強化トレーニング。Positive Reinforcement Training)では、犬の自発的な選択と行動を待ち、望ましい行動を選択したことに対して強化子(その犬にとってその時喜ばしいもの)を提供して、その行動を強化します(維持・増加させます)。

強化したい行動をただ待っているだけでは、その行動がいつ起こるかわかりません。何時間も待つことになるかもしれません。複雑な行動であれば、一生待っていても発現しないかもしれません。加えて、強化したい望ましい行動が出る前に、望ましくない行動を繰り返させてしまう可能性もあります。それでは、トレーニングは進みません。

そこで、必要になるのが、望ましくない行動を防ぎ、私たちが強化したいと考えている望ましい行動を犬が選択しやすい環境を作ること。そのためには、様々な環境の要素を考慮する必要があります。

トレーニングをする場所、強化子、使うツール、ディストラクション(犬が気になるもの)、刺激のレベルなど。そして、ハンドラー(教え手。強化子の提供者)の姿勢やいる場所、トリーツの提供の仕方も。これらの環境の要素は、望ましい行動を発現しやすくすることにもつながれば、逆に犬を混乱させ、望ましい行動の発現から遠ざけてしまう原因にもなります。環境の要素それぞれを適切に選択・調整する必要があります。

そして、古典的条件付け、プロンプティングやターゲティング、シェーピング、チェーニングといったトレーニングテクニックは、強化したい望ましい行動を引き出すためのもの。犬が混乱なく成功を重ねられるトレーニングテクニックを選択することも「犬が望ましい行動を選択しやすい環境」を作るためには欠かせません。

知識とスキルを持ったトレーナーやインストラクターは、強化したい行動の複雑さ、その状況でのその犬にとっての難易度、その犬の報酬に基づくトレーニングの経験や行動のレパートリー、その犬のその時コンディションなど、犬、行動、状況、さらに、トレーニングを提供する飼い主ができることやスキルに合わせて、「犬が望ましい行動を選択しやすい環境」を考え、環境の各要素を調整し、トレーニングテクニックを決定します。トレーニングを始める前に環境を整えますが、トレーニング開始後も、犬の反応を見て、逐次調整・変更します。

この動画は、古典的条件付けを使った「犬が望ましい行動を選択しやすい環境」作りの一例です。玄関チャイムが鳴ったときに、玄関の扉に向かって吠え続けるという行動の代わりに、「Enough(おしまい)」と飼い主が言ったら、飼い主のところに来るという行動を教えることを目標にしたトレーニングの様子(代替行動の分化強化。DRA:Differential Reinforcement of Alternative Behavior)。

古典的条件付けの他に、エンリッチメントの見直しや刺激の調整も合わせて行い、犬が望ましい行動を選択しやすいよう支援しています。

by Sonya Bevan

トレーニングは、まず精神的な刺激の不足を望ましいかたちで満たすエンリッチメントを提供することからはじまっています。KONGなどの種類の違うフードパズルを用意し、食べ物を獲得するために、考えたり試したりする、頭と体を使って問題を解決することに夢中になれる時間を提供しています。

そして、トレーニングセッションでは、「Enough(おしまい)」という言葉と、大好きなトリーツを関連付けさせる古典的条件付けからスタートしています。

「Enough(おしまい)」と言ったらすぐにトリーツを提供する。「Enough(おしまい)→トリーツ」これを繰り返します。最終的な目標は、「Enough(おしまい)」と言われたら、飼い主のことろに来ること。なのになぜ、行動と結果(反応と刺激)を関連づけさせるオペラント条件付けではなく、刺激と刺激を関連づけさせる古典的条件付けを使っているのでしょうか?

その理由は2つ。まず、口に食べ物が入っている間は、吠えることは難しくなるから。そして、もうひとつは、「Enough(おしまい)」と大好きなトリーツを関連づけてしまえば、犬は「Enough(おしまい)」と聞いた瞬間、おいしいものがもらえることを予期し、そのおいしいものを獲得するために、それを獲得できる場所、つまり、飼い主の元へと向かうようになるからです。

古典的条件付けを利用して、望ましくない吠えるという行動が出にくい状態を作るとともに、飼い主の元に来るという行動を犬が選択する環境を作っているのです。

飼い主の元に来るという行動が出たあとは、飼い主の元に来るという行動に続いて、トリーツが出ることになるので、「Enough(おしまい)」と言って、トリーツをあげるという同じ手順を続けていても、「飼い主の元に来る」という行動を強化するオペラント条件付けの反復に切り替わります。

Antecedent(先行事象):飼い主が「Enough(おしまい)」と言う。
Behavior(行動):犬が飼い主のところに来る。
Consequence(結果事象):飼い主がトリーツを犬に与える。

このABCを繰り返されることで、B-Cの関連付けと、「Enough(おしまい)」は、SD(弁別刺激)としてが確立されていきます。「Enough(おしまい)」行動のキュー(合図)となり、飼い主のところへ行くという行動は強化されます(維持・増加します)。

動画では、「Enough(おしまい)→トリーツ」を少し繰り返してから、すぐに玄関チャイムの音を加えていますが、犬が興奮しやすい刺激を環境に加えていくのは、「Enough(おしまい)」とトリーツの関連付けが十分に確立された後の方が、失敗をさせない環境を維持しやすいと、個人的には思います。

私がトレーニングプランを立てるとしたら、「Enough(おしまい)→トリーツ」を色々な場所で反復して、さらに、飼い主が様々な姿勢の状態で、歩きながら反復、さらにそれらを時間帯を変えて反復…と、場所、時間帯、飼い主の様子を変化させて反復します。「Enough(おしまい)」と言ったら、犬が飼い主に釘付けになるくらいになってから、玄関チャイムを鳴らすという刺激を加えます。

刺激は、少しずつ追加、強くしていきます。チャイムの音の後は、ドアをノックする音、人がソファから立ち上がる、玄関の方へ歩いて行く…といった実際の状況を想定した、刺激をひとつずつ加えて、少しずつ難易度を上げながら、「Enough(おしまい)→トリーツ」を繰り返し、成功を重ねさせていきます。

マッチング法則(Maching Law)は、それまでにより強化を受けた行動が選択されるという法則。動画の中で減らしたいと考えている「チャイムが鳴ったら吠える」という行動は、これまで何度も何度も繰り返してきたであろう、つまり、何らかの強化を受け続けてきた(何らかのよい結果を獲得し続けて来た)と考えられる行動です。

「Enough(おしまい)と言われたら飼い主のところへ来る」という新しい行動が選択されるためには、新しい行動の強化が、「チャイムが鳴ったら吠える」という行動が持っている強化の歴史を越えなければなりません。そのために、「Enough(おしまい)と言われたら飼い主のところへ来る」という行動の強化子には、犬が大好きな食べ物(Strong Reinforcer)を選び、また、前述のABCを何度も何度も繰り返し、強化の歴史を築いていく必要があるのです。

こちらの動画では、他の犬に同調して吠えてしまわないようにするために、古典的条件付けを使っています。他の犬が吠えたらトリーツを提供するを繰り返した結果、他の犬が吠えるのを聞いたらすぐに飼い主のところに来るようになっています。他の犬が吠えることが、飼い主の元へ行くことのキュー(合図)として見事に確立されています。すばらしい!

by Eileen

「犬が望ましい行動を選択しやすい環境」を整えるためのその他のテクニックについては、The Smart Dog Owner Academyのベーシックコースで、詳しく解説します。

刺激のレベルの調整については、こちらの「限界を理解する:それは、越える越えないだけではない(Suzanne Clothier記事日本語訳)」 (pdfでダウンロードできます)が、理解を助けてくれます。

, , , , ,