ZMIO

Suma ilości liter w nazwiskach prowadzących ten przedmiot wynosi 13

P

F

Agent refleksowy może być racjonalny

P

F

Agent, aby być racjonalny musi posiadać całą wiedzę na temat środowiska

P

F

Uczenie się ze wzmocnieniem, to specjalny przypadek uczenia nienadzorowanego

P

F

Algorytm iteracji polityki gwarantuje znalezienie optymalnej polityki, jeśli będzie działać aż do jej zbiegnięcia

P

F

Metody Monte Carlo wymagają pełnej znajomości modelu przejść świata

P

F

Metody Monte Carlo wymagają skończenia całego epizodu do wykonania jednej aktualizacji

P

F

Metoda SARSA jest algorytmem on-policy

P

F

Kiedy używamy sieci neuronowej jako aproksymatora Q-learningu wyjście sieci musi być funkcją softmax

P

F

Metoda Actor-Critic jest metodą on-policy

P

F

Alfa-Beta pruning jest algorytmem dokładnym, czyli gwarantuje znalezienie optymalnego rozwiązania problemu min-max

P

F

celem polityki Roll-out jest znalezienie polityki lepszej od tej używanej podczas działania algorytmu

P

F

Liczba parametrów sieci bayesowskiej jest wykładnicza w stosunku do ilości krawędzi w sieci

P

F

0

{"name":"ZMIO", "url":"https://www.quiz-maker.com/QSH0G4EBI","txt":"Suma ilości liter w nazwiskach prowadzących ten przedmiot wynosi 13, Agent refleksowy może być racjonalny, Agent, aby być racjonalny musi posiadać całą wiedzę na temat środowiska","img":"https://www.quiz-maker.com/3012/images/ogquiz.png"}

Powered by

Quiz Maker