Reliability and Learnability of Human Bandit Feedback for Sequence-to-Sequence Reinforcement Learning.

Paper Info

Title
Reliability and Learnability of Human Bandit Feedback for Sequence-to-Sequence Reinforcement Learning.

Authors (3 rows)

Cited by (0 rows)

References (0 rows)

Name	Order	Citations	PageRank
Stefan Riezler	1	1066	138.72
julia kreutzer	2	22	5.92
Joshua Uyheng	3	0	1.69