This paper describes a method for learning user's interests in the Web-based personalized information filtering system called WAIR. The proposed method analyzes user's reactions to the presented documents and learns from them the profiles for the individual users. Reinforcement learning is used to adapt the term weights in the user profile so that user's preferences are best represented. In contrast to conventional relevance feedback methods which require explicit user feedbacks, our approach learns user preferences implicitly from direct observations of user behaviors during interaction. Field tests have been made which involved 7 users reading a total of 7,700 HTML documents during 4 weeks. The proposed method showed superior performance in personalized information filtering compared to the existing relevance feedback methods.
本文介绍了一种在称为WAIR的基于Web的个性化信息过滤系统中学习用户兴趣的方法。所提出的方法分析了用户对所提供文档的反应,并从中学习了各个用户的个人资料。强化学习用于调整用户个人资料中的术语权重,以便最好地表示用户的偏好。与需要显式用户反馈的常规相关性反馈方法相反,我们的方法从对交互过程中用户行为的直接观察中隐式学习了用户偏好。已经进行了现场测试,涉及7个用户在4周内阅读了总计7,700个HTML文档。与现有的相关性反馈方法相比,该方法在个性化信息过滤方面具有更好的性能。 P>
机译:使用强化学习的个性化Web文档过滤
机译:使用座席状态发生频率并分析多座席环境中座席学习过程中的知识共享的强化学习技术
机译:使用代理状态发生频率并分析多代理环境中代理学习过程中的知识共享的强化学习技术
机译:基于增强学习的交互式Agent,用于个性化数学技能增强
机译:基于自适应共振理论和针对计算机生成的主体的强化学习的混合学习方法。
机译:加固学习代理捕食者 - 猎物生态系统的共同演变
机译:使用强化学习的个性化Web文档过滤