ZMIO

Suma ilości liter w nazwiskach prowadzących ten przedmiot wynosi 13
P
F
Agent refleksowy może być racjonalny
P
F
Agent, aby być racjonalny musi posiadać całą wiedzę na temat środowiska
P
F
Uczenie się ze wzmocnieniem, to specjalny przypadek uczenia nienadzorowanego
P
F
Algorytm iteracji polityki gwarantuje znalezienie optymalnej polityki, jeśli będzie działać aż do jej zbiegnięcia
P
F
Metody Monte Carlo wymagają pełnej znajomości modelu przejść świata
P
F
Metody Monte Carlo wymagają skończenia całego epizodu do wykonania jednej aktualizacji
P
F
Metoda SARSA jest algorytmem on-policy
P
F
Kiedy używamy sieci neuronowej jako aproksymatora Q-learningu wyjście sieci musi być funkcją softmax
P
F
Metoda Actor-Critic jest metodą on-policy
P
F
Alfa-Beta pruning jest algorytmem dokładnym, czyli gwarantuje znalezienie optymalnego rozwiązania problemu min-max
P
F
celem polityki Roll-out jest znalezienie polityki lepszej od tej używanej podczas działania algorytmu
P
F
Liczba parametrów sieci bayesowskiej jest wykładnicza w stosunku do ilości krawędzi w sieci
P
F
0
{"name":"ZMIO", "url":"https://www.quiz-maker.com/QSH0G4EBI","txt":"Suma ilości liter w nazwiskach prowadzących ten przedmiot wynosi 13, Agent refleksowy może być racjonalny, Agent, aby być racjonalny musi posiadać całą wiedzę na temat środowiska","img":"https://www.quiz-maker.com/3012/images/ogquiz.png"}
Powered by: Quiz Maker