论文还提出一种线性复杂度的项集模式计数算法

 信息社会     |      2019-12-19

日前,北京大学信息科学技术学院信息科学中心、机器感知与智能教育部重点实验室邓志鸿教授作为第一作者的论文A new algorithm for fast mining frequent itemsets using N-Lists入选SCIENCE CHINA Information Science2017年五年持续影响力论文奖。

这篇论文刊于2012年,文中提出了一种名为“N-Lists”的新颖数据结构。该结构能够在尽量压缩数据的前提下完整保留数据的统计信息。基于“N-Lists”,论文还提出一种线性复杂度的项集模式计数算法,极大地提高了计算效率。论文发表后,“N-Lists”和相应的计数算法在国内外引起大量关注,被广泛应用于频繁项集挖掘、并行频繁项集挖掘、频繁带权项集挖掘、频繁模糊集挖掘、高效用项集挖掘和可删除集挖掘等数据挖掘任务。