e m kraak schreef op dinsdag 4 mei 2010, 4:19:
> P+ vertraagt ieder AANleer proces per definitie.
> P+ bespoedigt ieder AFleer proces per definitie, maar... er zitten haken
> en ogen aan op grond waarvan het slimmer is indien mogelijk afleren via
> een andere weg te bewerkstelligen, bijv. door het AANleren van vervangend
> gedrag.
Volgens mij doe ik hier beide, afleren door P+ en aanleren door R- (druk laten vallen) en R+ (stembeloning en zodra dat lukt, voerbeloning). Juist daarom gaat het m.i. sneller dan een methode waarbij maar één van de quadranten (plus negeren) wordt gebruikt. Ja/Nee schept meer duidelijkheid dan alleen Ja (en geen reactie).
Ik zeg niet dat sneller altijd beter is! Wat mij betreft is het discussiepunt juist, wanneer en hoeveel P+ eventueel aanvaardbaar is. Natuurlijk is daarop geen antwoord dat voor iedereen geldt; iedereen maakt dat uiteindelijk zelf uit, wat hij/zij aanvaardbaar vindt .
>> Daar is p+ de kortere/snellere route. Oók als je kijkt naar de resultaten
>> op lange termijn. Omdat P+ heel snel duidelijk kan maken wat je NIET wilt
>> (wat ongewenst gedrag is). Daardoor ook duidelijker in wat je wél wilt.
> Voor jouw en ook mijn "gevoel" wel, volgens de uittentreure geteste
> resultaten niet.
Is dat zo? Ik heb dat ook heel lang gedacht (en wel eens geschreven), maar ik baseer me tot nu toe geloof ik op maar enkele onderzoeksresultaten en vooral veel op méningen / idealen. Al dan niet van wetenschappers.
Ook jouw rekenkundige bewijsvoering klopt volgens mij bij nader inzien niet. Vergelijk het met het spelletje “warm/koud”. Als je niets zegt wanneer de proefpersoon “kouder” wordt, dán presteert die proefpersoon inderdaad langzamer in het uitvinden van wat er door de "trainer" bedoeld wordt. Maar als je bij de ene proefpersoon “koud” “kouder” en bijv. “ijskoud” als feedback geeft, en bij de andere proefpersoon “warm”, “warmer” en “heet” – dan zullen de (rekenkundige) resultaten gelijk zijn.
>> En - ik weet dat jij het daarmee niet eens bent Piet - ik vind "negeren"
>> óók een vorm van P+. Het is m.i. de allermildste vorm van P+, dat wel.
>> Maar het is niet voor niets dat oorspronkelijk maar vier quadranten werden
>> benoemd mbt operationeel conditioneren. Negeren hoorde daar niet bij.
>> Omdat eigenlijk álles kan worden benoemd als één van die vier quadranten:
>> R+, R-, P+ of P-. Een dier of persoon wiens gedrag genegeerd wordt,
>> ervaart dat als onprettig. En dáárom neemt gedrag dat genegeerd wordt, in
>> frequentie af.
> Nee, hier zit een belangrijk onderscheid tussen: negeren is niet altijd
> P+, het wordt pas P+ binnen een historische context (ontvanger bepaalt)
> als die er is.
Tuurlijk bepaalt de ontvanger. Maar dat geldt óók voor de andere vier quadranten. In plaats van “negeren” zou je misschien beter “neutraal” als 5e kunnen toevoegen. Want dan denk je (meer) vanuit de ontvanger. De trainer kan bijvoorbeeld bedoelen om mbv een stembeloning te R+-en, maar het effect op de ontvanger kan best neutraal zijn.
Hetzelfde geldt voor iets dat de trainer bedoelt als negeren/neutraal. Dat kán een P+-effect hebben op de ontvanger. Ook een R -effect is mogelijk (bijv. als de ontvanger n.a.v. genegeerd worden denkt: “hehe… eindelijk rust” ;-o).
> Genegeerd gedrag neemt af omdat het (blijkbaar tegen verwachting in, want
> anders was het gedrag niet gestart, toch?) onsuccesvol is, niet omdat
> het onplezierige respons oproept.
Maar als je gedrag tegen de verwachting in onsuccesvol is, dan ervaar je dat toch per definitie als onprettig? Een mÃldere vorm van “onprettig” dan dat je een klap voor je kop krijgt, hoogstwaarschijnlijk – dat dan weer wel.
Hoewel, als je aan een quiz meedoet en je denkt door een laatste vraag goed te beantwoorden, een miljoen te winnenÂ… en dan blijkt dat jouw antwoord je nÃets oplevertÂ… misschien had je dan liever een klap voor je kop gehad

!
> Dat dit principieel anders in elkaar steekt kun je afleiden uit dat
> genegeerd gedrag zich aanvankelijk (hevig) kan versterken. Bij P+ zie je
> dat niet.
Toch wel, volgens mij. Maar alleen als de straf niet consequent volgt op het gedrag, óf wanneer de straf heel mild is. En/of wanneer de straf eerst heel mild is en dan langzaam wordt opgevoerd. Daar zijn vele wetenschappelijke experimenten aan gewijd. Het gezegde “zachte heelmeesters maken stinkende wonden” heeft een kern van waarheid. Ik vind dat niet leuk, dat dat zo werkt. Maar jah, wat ik leuk of ideaal vind, dáár trekken de wetten van conditionering zich natuurlijk niets van aan. Jammer

.
>> In een situatie waarin je nog geen R+ kunt "toedienen", bijv. omdat je
>> niet binnen het bereik van het dier kunt komen, dan is R- het alternatief
>> waarmee je iets tóch kunt belonen. Helaas gaat R- per definitie samen met
>> een voorafgaande P+; die twee kunnen niet los van elkaar.
> Is dat echt zo? Geef me daar dan eens bewijsvoering van?
> Dat door trainers vaak, in het hippische bijna altijd, een R- leermoment
> gecreëerd wordt d.m.v. P+ weet ik natuurlijk ook wel. Ik noem dat altijd
 de cigaar uit eigen doos.
Je geeft het antwoord eigenlijk zelf al ;=o. In een trainingssituatie wordt vrijwel altijd een R- leermoment voorafgegaan door een door de trainer toegediende P+. En ja, dat is een sigaar uit eigen doos – mee eens.
Een uitzondering die ik kan bedenken, maar die nogal theoretisch is: Paard wordt gestoken door een daas. Paard liep in stap maar gaat stilstaan. Als beloning voor het gedrag "stilstaan", slaat de trainer de daas dood!
Karen