计算题:
某超市希望通过对“购物小票”的挖掘发掘产品之间的关联,从而确定促销搭配。假设当前用于分析的购物小票共6张,包含5种产品。其中,小票1:牛奶,面包,牙膏;小票2:洗发水,卫生纸;小票3:牙膏,洗发水;小票4:卫生纸,牛奶;小票5:牛奶,洗发水,牙膏;小票6:牙膏,牛奶。请使用数据挖掘中频繁关联分析的方法,寻找最有可能同时购买的一对商品。
首先建立的tree,然后查看频繁节点
1
2、按照1-项集频繁程度进行排序
3、建立tree图并标示频繁节点
由图看出 牛奶牙膏规则支持度为50% 而置信度75%
所以我认为 “牛奶==》牙膏” 规则 比较符合预期
用SAS程序跑了一下:
右上角是牛奶对牙膏
lift提升度1.13效果还是比较好的,当然还有三个1.5的,但是支持度不明显
手写的字好难看,不要笑话我啊