e m kraak schreef op woensdag 5 mei 2010, 13:16:
> Karen Koomans schreef op woensdag 5 mei 2010, 0:20:
>> Volgens mij doe ik hier beide, afleren door P+ en aanleren door R- (druk
>> laten vallen) en R+ (stembeloning en zodra dat lukt, voerbeloning).
> [knip] Daarentegen zie ik niet hoe je d.m.v. R+ iets wilt afleren.
Ik ook niet.
Ik schreef: "afleren door P+ en aanleren door R- en R+" (zie citaat hierboven).
> Lees ook eens iets over "poisoned cues" bij gemengd gebruik van P en R.
Dat hoeft niet, daarover heb ik al veel gelezen.
>> Ik zeg niet dat sneller altijd beter is! Wat mij betreft is het
>> discussiepunt juist, wanneer en hoeveel P+ eventueel aanvaardbaar is.
> Ik lees hieruit dat je P beschouwt als lijfstraf.
Hoe kom je dáár nou bij?! Het is mij echt een raadsel hoe je dat kunt denken, na alles wat ik sinds 2004, en daarvoor al op de Paard Natuurlijk Yahoo E-Mail groep, heb geschreven over
clickertraining en operante conditionering. Wat ik wel en niet weet (ongeveer) over operante conditionering is toch niet helemaal nieuw voor jou?
En alleen al het feit dat ik in deze draad zélf wat ik bij deze pony doe, benoem als P+ (op de momenten dat ik de pony wegstuur)… ik gebruik toch geen lijfstraffen voor deze pony?
> Dat dekt de
> wetenschappelijke lading echter totaal niet. P is alles wat de reactor als
> straf ervaart. Bijvoorbeeld, in mensentermen, [knip]
Ik sta echt versteld dat jij kennelijk denkt dat ik deze uitleg nodig heb. 't Zou anders zijn als jij, of ik, nieuw was op dit forum, maar dat is niet het geval.
>>>> Daar is p+ de kortere/snellere route.
> Neuh, waarom? Vertellen wat je niet wil zegt helemaal niets over wat je
> wel wil. Dat is nu juist de essentie van dat rekenmodel wat je aanhaalt.
> Als je uit 100000 mogelijkheden eerst 99999x moet p-en ben je wel even
> bezig als alles tegen zit....
Het tegenovergestelde is net zo waar. Gedrag bekrachtigen dat in de richting gaat van wat je wel wilt, zegt nog niet alles over wat je allemaal niet wilt. De
hoeveelheid feedback (hoe vaak wordt gedrag gevolgd door een duidelijke respons) en de
impact van de beloning of de straf op de ontvanger, die bepalen hoe snel een leerproces verloopt.
> Beste nmm, meest omvangrijke werk is het aloude Schedules of Reinforcement
> ISBN 0-13-792309-0
Dank je Egon, maar ook dat werk is bekend bij mij.
Ik voel me beledigd door je suggesties alsof ik basisdingen over Operante Conditionering niet zou weten, en ook doordat je hier schrijft "Beste nmm".
>> Ook jouw rekenkundige bewijsvoering klopt volgens mij bij nader inzien
> ...wel!

> Het model dat ik beschreef was kwalitatief, niet kwantitatief. [knip]
Hoe kan een
rekenkundig model kwalitatief zijn in plaats van kwantitatief?
(over negeren:)
>> Tuurlijk bepaalt de ontvanger. Maar dat geldt ook voor de andere vier
>> quadranten.
>
> Met als verschil dat er geen historie bij noodzakelijk is. Erg belangrijk
> onderscheid.
Niet noodzakelijk inderdaad. Maar het kan wel. Ik ontken niet het bestaan van neutraal, ik zeg dat “negeren” niet per definitie door de ontvanger als neutraal ervaren wordt. De ontvanger kan genegeerd worden ook ervaren als een straf, of als een beloning.
>> Maar als je gedrag tegen de verwachting in onsuccesvol is, dan ervaar je
>> dat toch per definitie als onprettig?
> Uiteindelijk wel en daarom stopt het gedrag ook. Maar initieel is
> onsuccesvol niet hetzelfde als onplezierig. Er is immers geen actor die
> het onplezierigs toedient.
Dat is precies wat ik bedoelde toen ik schreef dat je als trainer zélf “druk” of “stress” kunt veroorzaken, óf je kunt de omstandigheden zo maken dat jij als trainer dat niet direct veroorzaakt, maar indirect doe je dat wel degelijk. Bijv. door de pony uit deze filmpjes in een kleine paddock te zetten (en daarna pas de trainingstijd te gaan klokken? Da’s niet eerlijk hè...).
Je kunt natuurlijk wel stress tot een minimum beperken of zelfs helemaal uitsluiten bij zo’n pony als deze in dit leerproces ‘laten halsteren in de weide’ (dat had ik al geschreven), maar m.i. alleen als je meer tijd wilt uittrekken om hetzelfde resultaat te bereiken. En natuurlijk kun je ook nog de trainingsfoutjes die ik maak voorkomen, wat ook leidt tot meer efficientie. Maar dát verandert dan niets aan de methode, waarin zowel P als R worden toegepast, het verandert alleen iets aan de kwaliteit van de toepassing ervan.
Alle druk/stress voorkomen bij deze pony en toch even snel hetzelfde trainingsresultaat bereiken maar dan op basis van alléén R+, dat kan m.i. niet. Want hoe krijg jij die pony in die kleine paddock? Of neem je toch veel tijd daarvoor? Dan kan het natuurlijk wél met niet of nauwelijks stress. Maar de discussie gaat er nou juist over, dat het gebruik van P+ in sommige gevallen tijdswinst geeft. En wat je dan moreel nog wel en wat niet meer verantwoord vindt, als trainer.
Karen