Karen Koomans schreef op woensdag 5 mei 2010, 0:20:
> e m kraak schreef op dinsdag 4 mei 2010, 4:19:
>
>> P+ vertraagt ieder AANleer proces per definitie.

> laten vallen) en R+ (stembeloning en zodra dat lukt, voerbeloning). Juist
> daarom gaat het m.i. sneller dan een methode waarbij maar één van de
> quadranten (plus negeren) wordt gebruikt. Ja/Nee schept meer duidelijkheid
> dan alleen Ja (en geen reactie).
Dat hangt er dus maar net vanaf of iets wilt aan- of afleren. Als je iets wilt aanleren maakt een (extra) gebruik van "nee" nauwelijks of niet uit.
Daarentegen zie ik niet hoe je d.m.v. R+ iets wilt afleren.
Lees ook eens iets over "poisoned cues" bij gemengd gebruik van P en R.
> Ik zeg niet dat sneller altijd beter is! Wat mij betreft is het
> discussiepunt juist, wanneer en hoeveel P+ eventueel aanvaardbaar is.
Ik lees hieruit dat je P beschouwt als lijfstraf. Dat dekt de wetenschappelijke lading echter totaal niet. P is alles wat de reactor als straf ervaart. Bijvoorbeeld, in mensentermen, kan het best zo zijn dat iemand een groot psychisch probleem heeft door gepest te zijn en de voortdurende angst om weer gepest te worden veel zwaarder weegt dan in elkaar geslagen te worden. Beetje extreem maar denk ik wel duidelijk.
>>> Daar is p+ de kortere/snellere route. Oók als je kijkt naar de resultaten
>>> op lange termijn. Omdat P+ heel snel duidelijk kan maken wat je NIET wilt
>>> (wat ongewenst gedrag is). Daardoor ook duidelijker in wat je wél wilt.
Neuh, waarom? Vertellen wat je niet wil zegt helemaal niets over wat je wel wil. Dat is nu juist de essentie van dat rekenmodel wat je aanhaalt. Als je uit 100000 mogelijkheden eerst 99999x moet p-en ben je wel even bezig als alles tegen zit....
>> Voor jouw en ook mijn "gevoel" wel, volgens de uittentreure geteste
>> resultaten niet.
>
> Is dat zo? Ik heb dat ook heel lang gedacht (en wel eens geschreven), maar
> ik baseer me tot nu toe geloof ik op maar enkele onderzoeksresultaten en
> vooral veel op méningen / idealen. Al dan niet van wetenschappers.
Beste nmm, meest omvangrijke werk is het aloude Schedules of Reinforcement
ISBN 0-13-792309-0
> Ook jouw rekenkundige bewijsvoering klopt volgens mij bij nader inzien
...wel!

> niet. Vergelijk het met het spelletje “warm/koud”. Als je niets zegt
> wanneer de proefpersoon “kouder” wordt, dán presteert die proefpersoon
> inderdaad langzamer in het uitvinden van wat er door de "trainer"
> bedoeld wordt. Maar als je bij de ene proefpersoon “koud” “kouder” en
> bijv. “ijskoud” als feedback geeft, en bij de andere proefpersoon
> “warm”, “warmer” en “heet” – dan zullen de (rekenkundige)
> resultaten gelijk zijn.
Het model dat ik beschreef was kwalitatief, niet kwantitatief. Als je refereert aan mijn post van enige tijd terug, maak jij er nu totaal iets anders van door warm en koud linguistisch te kwantificeren. Je bent de eerste niet die met linguistische interpretaties komt en aan de hand daarvan "Skinner" afserveert.
Maar, hoe zie je dat in nonlinguistische communicatie? "Warm" kwantificeren met 1 klik, warmer met 2, heet met 3? "Koud" met 1 zweepslag, kouder met 2, ijskoud met 3?
Ik zie het niet voor me...
>> als die er is.
>
> Tuurlijk bepaalt de ontvanger. Maar dat geldt óók voor de andere vier
> quadranten.
Met als verschil dat er geen historie bij noodzakelijk is. Erg belangrijk onderscheid.
>> Genegeerd gedrag neemt af omdat het (blijkbaar tegen verwachting in, want
>> anders was het gedrag niet gestart, toch?) onsuccesvol is, niet omdat
>> het onplezierige respons oproept.
>
> Maar als je gedrag tegen de verwachting in onsuccesvol is, dan ervaar je
> dat toch per definitie als onprettig?
Uiteindelijk wel en daarom stopt het gedrag ook. Maar initieel is onsuccesvol niet hetzelfde als onplezierig. Er is immers geen actor die het onplezierigs toedient.
Het onsuccesvol zijn past eigenlijk veel beter in het ethologische beeld van exploratiepatronen. Het ene individu is in een bepaalde situatie ondernemender, vasthoudender, onderzoekender, exploratiever dan een ander - onsuccesvol zijn stopt een exploratie.
>> Dat dit principieel anders in elkaar steekt kun je afleiden uit dat
>> genegeerd gedrag zich aanvankelijk (hevig) kan versterken. Bij P+ zie je
>> dat niet.
>
> Toch wel, volgens mij. Maar alleen als de straf niet consequent volgt op
> het gedrag, óf wanneer de straf heel mild is.
Moet ik een onduidelijkheid als inconsequente mildheid serieus nemen?
Is een onduidelijkheid wel te begrijpen? En valt daar dan straf of iets anders uit te herleiden? Zoja, moet ik me daar wat van aantrekken?
We maken toch geen handboek voor "Zo Slecht Mogelijk Communiceren"?
> En/of wanneer de straf
> eerst heel mild is en dan langzaam wordt opgevoerd. Daar zijn vele
> wetenschappelijke experimenten aan gewijd. Het gezegde “zachte
> heelmeesters maken stinkende wonden” heeft een kern van waarheid. Ik vind
Sja, als je de watertemperatuur maar langzaam genoeg laat stijgen kun je een kikker levend koken zonder dat 'ie dat merkt. Kwestie van magnitude over latentie van de stimulus afstellen. Maar daar hebben we het toch helemaal niet over?
> dat niet leuk, dat dat zo werkt. Maar jah, wat ik leuk of ideaal vind,
> dáár trekken de wetten van conditionering zich natuurlijk niets van aan.
> Jammer

.
Als ik je helemaal verkeerd interpreteer moet je het maar zeggen, maar ik vind dat je je nogal in buitenissige bochten wringt en er van alles bij sleept om die conditionerings"wetten" (zijn geen wetten, is alleen maar een model) te versoepen.
"minder = meer".
> Een uitzondering die ik kan bedenken, maar die nogal theoretisch is: Paard
> wordt gestoken door een daas. Paard liep in stap maar gaat stilstaan. Als
> beloning voor het gedrag "stilstaan", slaat de trainer de daas dood!
>
Lach er maar om. Dit komt echt voor! Zelf waargenomen. Ruiter vraagt zich af waarom paard voor iedere daas gaat stil staan, gaat het "stomme" paard vooruit meppen, terwijl ruiter paard tegelijkertijd associatief leert stil te staan omdat dat onbedoeld aangegeven wordt terwijl de daas wordt gemept. Als ik paard was... vloog ruiter de lucht in. Wat er in werkelijkheid gebeurde werd een werkbare symbiose: door het inhouden wist ruiter dat er wéér een steekbeest zat terwijl paard na een soort zelfbedachte halve ophouding wel door liep. Voor een bosklos-combi werkt dat, een dressuurpietlut zou zich dood ergeren.
Meteen prima voorbeeld van simultane sequenties.