看过Deep learning(convolutional neural network),看过RL(Q-learning).但是在两者结合这一块一直弄不明白. 我的疑问在于一直不明白DL是怎样识别出那个特定的物体,比如,木板或者小鸟.以及Q-learning怎样做决策. 后来才发现,DQN的核心思想并没有识别出特定物体. DQN里面的Deep learning部分,输入是原始图像,输出是action对应的Q值(类似于有这么多action类,每一类的概率值).原始图像就是当前state (cur…