Como funciona a superstição? Os pombos de Skinner
Dizer que um reforço depende de uma resposta pode significar nada mais do que seguir a resposta. Pode ser devido a alguma conexão mecânica ou devido à mediação de outro organismo; mas o condicionamento ocorre presumivelmente devido apenas à relação temporal, expressa em termos de ordem e proximidade da resposta e do reforço. Sempre que apresentamos um estado de coisas que é conhecido por reforçar em uma determinada unidade, devemos supor que o condicionamento ocorre, mesmo que não prestemos atenção ao comportamento do organismo ao fazer a apresentação. Um experimento simples demonstra que este é o caso.
Como esse experimento pode ser colocado em prática?
- Variação: como entender seus processos além da média
- Quais as diferenças entre a nova e a velha liderança?
- Qual é a diferença entre Lean e Six Sigma?
- O que é Design para Manufatura/Montagem?
- Como o Lean pode revolucionar uma companhia aérea?
- O que o fundador da Intel diz sobre Administrar Equipes?
- Como treinar sua equipe de vendas corretamente?
Como a superstição chegou ao pombo?
Um pombo é levado a um estado estável de fome, reduzindo-o a 75 por cento do seu peso quando bem alimentado. É colocado em uma gaiola experimental por alguns minutos por dia. Um sistema de liberar comida é anexado à gaiola para que o pombo possa comer com ela. Um solenoide e um relé de temporização mantêm a tremonha no lugar por cinco segundos. em cada reforço.
Se um relógio agora está disposto a apresentar a aleatoriedade na hora da liberação de alimentos a intervalos regulares, sem qualquer referência ao comportamento do pássaro, o condicionamento operante geralmente ocorre. Em seis dos oito casos, as respostas resultantes foram tão claramente definidas que dois observadores poderiam concordar perfeitamente nas instâncias de contagem.
Um pássaro estava condicionado a girar no sentido anti-horário sobre a gaiola, fazendo duas ou três voltas entre os reforços. Outro repetidamente empurrou a cabeça para um dos cantos superiores da gaiola. Um terceiro desenvolveu uma resposta "jogando", como se colocasse a cabeça sob uma barra invisível e a levantasse repetidamente. Dois pássaros desenvolveram um movimento pendular da cabeça e do corpo, em que a cabeça foi estendida para a frente e balançou da direita para a esquerda com um movimento afiado seguido por um retorno um pouco mais lento.
O corpo geralmente seguiu o movimento e alguns passos poderiam ser tomados quando era extensivo. Outro pássaro foi condicionado a fazer movimentos incompletos ou movimentos de escovação direcionados, mas não tocando no chão. Nenhuma dessas respostas apareceu em qualquer força notável durante a adaptação à gaiola ou até a moega de alimentos ter sido periodicamente apresentada. Nos dois casos restantes, as respostas condicionadas não foram claramente marcadas.
Como a superstição nos pombos foi sendo condicionada?
O processo de condicionamento geralmente é óbvio. O pássaro está executando alguma resposta à medida que a comida aparece. Como resultado, ele tende a repetir essa resposta. Se o intervalo antes da apresentação seguinte não é tão grande que a extinção ocorre, uma segunda "contingência" é provável. Isso fortalece a resposta ainda mais e o reforço subsequente torna-se mais provável. É verdade que algumas respostas não são reforçadas e alguns reforços aparecem quando a resposta não foi feita, mas o resultado líquido é o desenvolvimento de um considerável estado de força.
Com a exceção da virada no sentido anti-horário, cada resposta foi quase sempre repetida na mesma parte da gaiola e geralmente envolveu uma orientação em direção a alguma característica da gaiola. O efeito do reforço foi condicionar o pássaro a responder a algum aspecto do ambiente em vez de apenas executar uma série de movimentos. Todas as respostas vieram a ser repetidas rapidamente entre os reforços - tipicamente cinco ou seis vezes em 15 segundos.
O efeito parece depender da taxa de reforço. Em geral, devemos esperar que, quanto menor for o intervalo intermediário, mais rápido e mais marcado o condicionamento. Uma das razões é que o comportamento do pombo se torna mais diversificado à medida que o tempo passa após o reforço. Uma centena de fotografias, cada uma de dois segundos. após a retirada da tremonha, mostraria um comportamento bastante uniforme. O pássaro estaria na mesma parte da gaiola, perto da tremonha, e provavelmente orientado para a parede onde a tremonha desapareceu ou se virou para um lado ou para o outro.
Cem fotografias tiradas após 10 segundos, por outro lado, encontrariam o pássaro em várias partes da gaiola respondendo a muitos aspectos diferentes do meio ambiente. Quanto mais cedo um segundo reforço aparecer, portanto, quanto mais provável é que a segunda resposta reforçada será semelhante a primeira, e também que ambos terão uma das poucas formas padrão. No caso limitante de um intervalo muito breve, o comportamento a se esperar seria segurando a cabeça em direção à abertura através da qual a revista desapareceu.
Como a recompensa em intervalos curtos reforça a repetição?
Outro motivo para a maior eficácia de intervalos curtos é que quanto maior for o intervalo, maior o número de respostas interativas emitidas sem reforço. A extinção resultante cancela o efeito de um reforço ocasional.
De acordo com esta interpretação, o intervalo efetivo dependerá da taxa de condicionamento e da taxa de extinção, e, portanto, variará com o impulso e também presumivelmente entre espécies. Quinze segs. é um intervalo muito efetivo no nível de unidade indicado acima. Um minuto. é muito menos. Quando uma resposta foi configurada uma vez, no entanto, o intervalo pode ser alongado. Em um caso, foi estendido para dois minutos, e uma alta taxa de resposta foi mantida sem sinal de enfraquecimento. Em outro caso, muitas horas de resposta foram observadas com um intervalo de um minuto, entre reforços.
No último caso, a resposta mostrou uma deriva notável na topografia. Começou como um movimento brusco da cabeça da posição do meio para a esquerda. Este movimento tornou-se mais enérgico e, eventualmente, todo o corpo do pássaro girou na mesma direção, e uma ou duas etapas seriam tomadas. Após muitas horas, a resposta gradual tornou-se a característica predominante. O pássaro fez um passo de salto bem definido do pé direito para o pé esquerdo, entretanto girando sua cabeça e corpo para a esquerda como antes.
Quando a resposta de pisar tornou-se forte, foi possível obter um registro mecânico colocando o pássaro em um tambor grande diretamente conectado com um tambor pequeno que fez um contato elétrico delicado cada vez ocorreu um passo. Observando o pássaro e ouvindo o som do gravador, foi possível confirmar o fato de que um registro bastante autêntico estava sendo feito. Era possível que o pássaro ouça o gravador em cada passo, mas isso, claro, não estava de forma alguma correlacionado com a alimentação.
A gravação obtida quando a revista foi apresentada uma vez a cada min. lembra em todos os aspectos a curva característica para o pombo sob o reforço periódico de uma resposta selecionada padrão. Uma discriminação temporal bem marcada se desenvolve. O pássaro não responde imediatamente depois de comer, mas quando 10 ou 15 ou mesmo 20 segundos. decorrido, começa a responder rapidamente e continua até o reforço ser recebido.
O que o experimento conseguiu provar?
Neste caso, foi possível gravar a "extinção" da resposta quando o relógio foi desligado e a revista já não foi apresentada a qualquer momento. O pássaro continuou a responder com o seu lado característico. Mais de 10 000 respostas foram registradas antes da "extinção" ter acertado o ponto em que poucas, se houver respostas, foram feitas durante um intervalo de 10 ou 15 min. Quando o relógio foi iniciado novamente, a apresentação periódica da revista (ainda sem qualquer conexão com o comportamento do pássaro) trouxe uma curva típica para o recondicionamento após o reforço periódico.
O registro havia sido essencialmente horizontal por 20 min. . antes do início desta curva. O primeiro reforço teve algum efeito leve e o segundo um efeito maior. Há uma aceleração positiva suave na taxa, pois o pássaro retorna à taxa de resposta que prevaleceu quando foi reforçada a cada minuto.
Pode-se dizer que o experimento demonstre uma espécie de superstição. O pássaro se comporta como se houvesse uma relação causal entre seu comportamento e a apresentação dos alimentos, embora falte essa relação. Existem muitas analogias no comportamento humano. Rituais para mudar a sorte nos cartões são bons exemplos. Algumas conexões acidentais entre um ritual e consequências favoráveis são suficientes para configurar e manter o comportamento, apesar de muitas instâncias não reforçadas.
O jogador que lançou uma bola, mas continua a comportar-se como se o controlasse torcendo e girando o braço e o ombro é outro exemplo. Esses comportamentos não têm, naturalmente, nenhum efeito real sobre a sorte ou sobre uma bola a meio caminho de um strike, assim como no caso presente, a comida apareceria com tanta frequência se o pombo não fizesse nada ou, mais estritamente falando, fizesse alguma coisa.
O que podemos falar sobre o comportamento condicionado?
Talvez não seja correto dizer que o comportamento condicionado foi configurado sem qualquer contingência previamente determinada. Apelamos para uma sequência uniforme de respostas no comportamento do pombo para obter uma contingência líquida global. Quando organizamos um relógio para apresentar comida a cada 15 segundos, estamos efetivamente baseando nosso reforço em um conjunto limitado de respostas que frequentemente ocorrem 15 seg. após o reforço.
Quando uma resposta foi reforçada, a configuração do relógio implica uma contingência ainda mais restrita. Algo do mesmo tipo é verdade para o jogador. Não é correto dizer que não há conexão entre sua torção e giro e o curso tomado pela bola na extremidade do beco. A conexão foi estabelecida antes que a bola saia da mão do jogador, mas, como o caminho da bola e o comportamento do jogador estão determinados, alguma relação sobrevive. O comportamento subsequente do jogador pode não ter efeito sobre a bola, mas o comportamento da bola tem efeito sobre o jogador.
A contingência, embora não perfeita, é suficiente para manter o comportamento em força. A forma particular do comportamento adotado pelo jogador é devido à indução de respostas em que há contato real com a bola. É claramente um movimento apropriado para mudar a direção da bola. Mas isso não invalida a comparação, uma vez que não estamos preocupados com a resposta selecionada, mas com o motivo de sua persistência na força. Nos rituais de mudança de sorte, o fortalecimento indutivo de uma determinada forma de comportamento geralmente está ausente.
O comportamento do pombo nesta experiência é do último tipo, como a variedade de respostas obtidas de diferentes pombos indicando. Se existe algum incondicional comportamento no pombo apropriado para um determinado efeito sobre o meio ambiente está sob investigação.
Os resultados lançam alguma luz sobre o comportamento incidental observado em experimentos em que um estímulo discriminativo é frequentemente apresentado. Esse estímulo tem um valor de reforço e pode configurar comportamentos supersticiosos. Um pombo, muitas vezes, desenvolve algumas respostas, como girar, torcer, picotear perto do local do estímulo discriminativo, bater as asas, etc. Em grande parte do trabalho até à data neste campo, o intervalo entre apresentações do estímulo discriminativo foi de um minuto e muitas dessas respostas supersticiosas são de curta duração. Sua aparência como resultado de correlações acidentais com a apresentação do estímulo é inconfundível.