Python实现数据挖掘十大算法之Apriori
最近刚学Python,就用Python写了一个算法,由于不熟练的原因,实现得并不好,但结果是对的,代码如下:
# -*- coding: UTF8 -*-
import sys
import copy
def init_pass(T):
C = {}
for t in T:
for i in t:
if i in C.keys():
C[i] += 1
else:
C[i] = 1
return C
def candidate_gen(F):
C = []
k = len(F[0]) + 1
for f1 in F:
for f2 in F:
if f1[k-2] < f2[k-2]:
c = copy.copy(f1)
c.append(f2[k-2])
flag = True
for i in range(0,k-1):
s = copy.copy(c)
s.pop(i)
if s not in F:
flag = False
break
if flag and c not in C:
C.append(c)
return C
def compare_list(A,B):
if len(A) <= len(B):
for a in A:
if a not in B:
return False
else:
for b in B:
if b not in A:
return False
return True
def apriori(T, minsup):
C = []
init = init_pass(T)
keys = init.keys()
keys.sort()
C.append(keys)
n = len(T)
F = [[]]
for f in C[0]:
if init[f]*1.0/n >= minsup:
F[0].append([f])
k = 1
while F[k-1] != []:
C.append(candidate_gen(F[k-1]))
F.append([])
for c in C[k]:
count = 0;
for t in T:
if compare_list(c,t):
count += 1
if count*1.0/n >= minsup:
F[k].append(c)
k += 1
U = []
for f in F:
for x in f:
U.append(x)
return U
T = [['A','B','C','D'],['B','C','E'],['A','B','C','E'],['B','D','E'],['A','B','C','D']]
F = apriori(T, 0.9)
print F

本文基于署名 2.5 中国大陆许可协议发布,欢迎转载,演绎或用于商业目的,但是必须保留本文的署名小橋流水(包含链接)。如您有任何疑问或者授权方面的协商,请给我发邮件。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· [AI/GPT/综述] AI Agent的设计模式综述