推荐系统（四）—— 基于上下文推荐

上下文包括用户访问推荐系统的时间、地点、心情等，对于提高推荐系统的推荐系统是非常重要的。比如：

基于时间的推荐

时间信息对用户兴趣的影响表现在以下几个方面：

系统的时间特性分析：

推荐系统中的时间效应：

推荐系统的实时性：实时推荐系统需要在每个用户访问推荐系统时，都根据这个时间点前的行为实时计算推荐列表；推荐系统需要平衡考虑用户的近期行为和长期行为
推荐系统的时间多样性：推荐系统每天推荐结果的变化程度。有以下几种方式来实现推荐系统的时间多样性：
1. 在生成推荐结果时加入一定的随机性；
2. 记录用户每天看到的推荐结果，然后再每天的推荐中对重复出现的推荐结果适当降权；
3. 每天使用不同的推荐算法进行推荐

按时间衰减的UserCF和ItemCF原理类似，下面以ItemCF为例来介绍，权重衰减很容易就可以同样移植到UserCF中去。

通过时间间隔修正物品间的相似度：

$w_{ij}=\frac{\sum_{u \in N(i)\bigcap N(j)}f(\left | t_{ui}-t_{uj} \right |)}{\sqrt{\left | N(i) \right |\left | N(j) \right |}}$

一种可选的衰减函数：

$f(\left | t_{ui}-t_{uj} \right |)=\frac{1}{1+\alpha \left | t_{ui}-t_{uj} \right |}$

还可以通衰减项来修正用户u对物品i的兴趣度：

$p(u,i) = \sum_{x \in N(u)\bigcap ,j \in S(x,K)}w_{ij}\frac{1}{1+\beta \left | t_0-t_{uj} \right |}$

位置信息对用户兴趣的影响表现在以下几个方面：

明尼苏达大学的研究人员提出过一个称为LARS（Location Aware Recommender System，位置感知推荐系统）的和用户地点相关的推荐系统，他使用的数据集有三种不同形式：

位置信息是一个树状结构，比如国家、省、市、县结构，对于第一种数据集，可以将用户按照位置树状结构划分成很多子集。给定一个用户的位置，可以将其分配到某一个叶子节点中，该叶子节点包含了所有和他同一位置的用户行为数据集。然后利用这个叶子节点上用户行为数据，通过ItemCF给用户进行推荐。

数据稀疏问题：每个叶子节点上用户数可能很少，从而无法训练出一个好的推荐算法；

金字塔模型：利用每个中间节点上的数据为用户生成一个推荐列表，最终的推荐列表是这一系列推荐列表的加权。金字塔深度是影响系统性能的一个重要指标

首先忽略物品的位置信息，利用ItemCF算法计算用户u对物品i的兴趣度p(u,i)，然后通过距离来惩罚兴趣度：

$p'(u,i)=p(u,i)-TravelPenalty(u,i)$

$TravelPenalty(u,i)$:物品i的距离对兴趣度的惩罚，基本思想是计算物品i和用户u之前感兴趣的所有物品的距离的平均值(或最小值)。距离可以用欧式距离或者曼哈顿距离。

给用户推荐那些离他较近，且与他之前感兴趣的物品相似的物品。