实验描述:对指定数据集进行关联规则挖掘,选择适当的挖掘算法,编写程序实现,提交程序和结果报告。
数据集:retail.txt,根据数据集中的数据利用合适的挖掘算法得到频繁项集,并计算置信度,求出满足置信度的所有的关联规则retail.txt中每个数字表示一种商品的ID,一个{}内的表示一次交易实验环境和编程语言:本实验使用的编程语言为:Java编程环境为:Intellijidea实现频繁项集的挖掘算法为Apriori算法用于挖掘的样本个数为:1000个(retail.txt的前1000条数据)样本示例:{38,39,47,48}表示一个顾客购买了ID为38、39、47、48的四种商品。
1