本案例的目标是对用户进行推荐,即以一定的方式将用户与物品(本书指网页)之间建立联系。为了更好地帮助用户从海量的数据中快速发现感兴趣的网页,在目前相对单一的推荐系统上进行补充,采用协同过滤算法进行推荐。[br][br] 由于用户访问网站的数据记录很多,如果对数据不进行分类处理,对所有记录直接采用推荐系统进行推荐,这样会存在以下问题:① 数据量太大意味着物品数与用户数很多,在模型构建用户与物品的稀疏矩阵时,出现设备内存空间不够的情况,并且模型计算需要消耗大量的时间。② 用户区别很大,不同的用户关注的信息不一样,因此,即使能够得到推荐结果,其推荐效果也不会太好。为了避免出现上述问题,需要进行分类处理与分析。正常情况下,需要对用户的兴趣爱好以及需求进行分类。因为在用户访问记录中,没有记录用户访问网页时间的长短,因此不容易判断用户的兴趣爱好。因此,本任务根据用户浏览的网页信息进行分类处理,主要采用以下方法处理:以用户浏览网页的类型进行分类,然后对每个类型中的内容进行推荐。[br][br] 采用上述分析方法与思路,结合本例的原始数据以及分析目标,可获得整个分析的流程图,其分析过程主要包含以下内容。[br][br] (1)从系统中获取用户访问网站的原始记录。[br][br] (2)对数据进行多维度分析,包括用户访问内容、流失用户分析以及用户分类等分析。[br][br] (3)对数据进行预处理,包含数据去重、数据变换和数据分类等处理过程。[br][br] (4)以用户访问 html 后缀的网页为关键条件,对数据进行处理。[br][br] (5)对比多种推荐算法进行推荐,通过模型评价,得到比较好的智能推荐模型。通过模型对样本数据进行预测,获得推荐结果。