您当前的位置: 首页 > 

段智华

暂无认证

  • 0浏览

    0关注

    1232博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

CS 188 Project4(RL) Q1:Observation Probability

段智华 发布时间:2019-03-30 12:52:54 ,浏览量:0

      在这个问题中,您将在inference.py中的InferenceModule基类中实现getObservationProb方法。该方法通过观测(即对幽灵的距离的噪声读数)、Pacman的位置、幽灵的位置和幽灵jail的位置,返回给定Pacman的位置和幽灵位置的噪声距离读数的概率。换句话说,我们要返回P(noisyDistance | pacmanPosition, ghostPosition) 。

      距离传感器在距离读数上具有概率分布,给出了从Pacman到幽灵Ghost的实际距离。此分布由busters.getObservationProbability(noisyDistance, trueDistance)函数建模,它返回P(noisyDistance | trueDistance)。您应该使用这个函数来帮助您解决问题,并使用提供的manhattanDistance函数来查找Pacman的位置和幽灵Ghost的位置之间的距离。

    然而,我们也必须处理幽灵jail的特殊情况。具体地说,当我们捕获一个幽灵并把它送到jail的位置时,我们的距离传感器将返回None。所以,如果幽灵的位置是jail的位置,如观察结果是None,那概率为1,其他的都是概率0。相反,如果距离读数不是None,则幽灵将被监禁的概率为0。如果距离读数为None,则幽灵在jail中的概率为1。确保在实现中处理这个特殊情况。

   要测试代码并运行此问题的autograder程序,请执行以下操作:

python3 autograder.py -q q1

一般来说,有些签名测试可能要花很长时间来运行这个项目,你必须要有耐心。只要autograder签名者没有超时,你应该没事(前提是你确实通过了测试

关注
打赏
1659361485
查看更多评论
立即登录/注册

微信扫码登录

0.0782s