Archive | frequent pattern RSS feed for this section

Data Ming 笔记频繁项之FP-growth

一、概述

Apriori 算法一个Breadth-first (i.e., level-wise) search,需要产生大量的candidates的项集。而FPGrowth Approach (J. Han, J. Pei, and Y. Yin, SIGMOD’ 00)是一个Depth-first search,可以避免产生大量的项集。
主要思路是:从局部的频繁项中从短的频繁项得到长的频繁项。
比如,在数据集DB中发现,“abc”是一个频繁项,即DB|abc,考察含有该频繁项的子项时发现d是该频繁项中的一个局部频繁项,则abcd也是一个频繁项。

二、算法步骤

基本思想 (分治):用FP-tree递归增长频繁集
方法
  1. 对每个项,生成它的 条件模式库, 然后是它的 条件 FP-tree
  2. 每个新生成的条件FP-tree,重复这个步骤
  3. 直到结果FP-tree[......]

阅读全文

Tags: , ,

Comments { 0 }

Data Mining 笔记FP高级

关于频繁项的高级探索。

@todo 完整笔记

 

[caption id="attachment_931" align="alignnone" width="763"]Pattern Mining: A Road Map Pattern Mining: A Road Map[/caption]

[slideonline id=9179]

Tags: , ,

Comments { 0 }