问题定义 游戏规则: N个玩家,每人写一个或两个0~100之间的有理数 (不包括0或100),提交给服务器,服务器在当前回合结束时算出所有数字的平均值,然后乘以0.618,得到G值. 提交的数字最靠近G(取绝对值)的玩家得到N分,离G最远的玩家得到-2分,其他玩家得0分. 只有一个玩家参与时不得分. 我们的比赛中,每个玩家在每个回合提交两个数,最后的得分也即两个数字分别的得分之和. 难点分析: 这个游戏的难点在于他是一个多人决策游戏,如果采用强化学习作为策略,它的state和action都不是那…