.dsy:it.
Show 150 posts per page

.dsy:it. (http://www.dsy.it/forum/)
- Sistemi intelligenti (http://www.dsy.it/forum/forumdisplay.php?forumid=267)
-- Dubbio Slide/Libro - Iterative Policy Evaluation (http://www.dsy.it/forum/showthread.php?threadid=39537)


Posted by zacguyot on 19-11-2009 00:47:

Dubbio Slide/Libro - Iterative Policy Evaluation

Raga forse il prof lo avrà detto a lezione ma nn c'ero... Vi spiego il mio dubbio:

non riesco a capire perchè nell'esempio della 4x4 gridworld fatto sia sulle slides(L07) e presente anche sul libro(chap 4.1) c'è differenza se i dati di inizializzazione sono gli stessi: gamma=1, R=-1 per tutti gli stati tranne il TS(R=0) e policy equiprobabile=1/4

In particolare mi riferisco a quando k = 1, sul libro i V(s) sono tutti a -1 (tranne ovviamente i TS), mentre sulle slide i V(s) delle celle 1,4,10,14 sono 0,75 mentre gli altri sono -1(tranne i TS)

Applicando l'equazione di bellman mi trovo come fa il prof ma non capisco perchè con il libro no...

cosa mi sfugge???

qualcuno mi sa rispondere?


All times are GMT. The time now is 09:09.
Show all 1 posts from this thread on one page

Powered by: vBulletin Version 2.3.1
Copyright © Jelsoft Enterprises Limited 2000 - 2002.