FP-Tree算法的实现

在关联规则挖掘领域最经典的算法法是Apriori，其致命的缺点是需要多次扫描事务数据库。于是人们提出了各种裁剪（prune）数据集的方法以减少I/O开支，韩嘉炜老师的FP-Tree算法就是其中非常高效的一种。

支持度和置信度

严格地说Apriori和FP-Tree都是寻找频繁项集的算法，频繁项集就是所谓的“支持度”比较高的项集，下面解释一下支持度和置信度的概念。

设事务数据库为：

A　　E　　F　　G

A　　F　　G

A　　B　　E　　F　　G

E　　F　　G

则{A,F,G}的支持度数为3，支持度为3/4。

{F,G}的支持度数为4，支持度为4/4。

{A}的支持度数为3，支持度为3/4。

{F,G}=>{A}的置信度为：{A,F,G}的支持度数除以 {F,G}的支持度数，即3/4

{A}=>{F,G}的置信度为：{A,F,G}的支持度数除以 {A}的支持度数，即3/3

强关联规则挖掘是在满足一定支持度的情况下寻找置信度达到阈值的所有模式。

FP-Tree算法

我们举个例子来详细讲解FP-Tree算法的完整实现。

事务数据库如下，一行表示一条购物记录：

牛奶，鸡蛋，面包，薯片

鸡蛋，爆米花，薯片，啤酒

鸡蛋，面包，薯片

牛奶，鸡蛋，面包，爆米花，薯片，啤酒

牛奶，面包，啤酒

鸡蛋，面包，啤酒

牛奶，面包，薯片

牛奶，鸡蛋，面包，黄油，薯片

牛奶，鸡蛋，黄油，薯片

我们的目的是要找出哪些商品总是相伴出现的，比如人们买薯片的时候通常也会买鸡蛋，则[薯片，鸡蛋]就是一条频繁模式（frequent pattern）。

FP-Tree算法第一步：扫描事务数据库，每项商品按频数递减排序，并删除频数小于最小支持度MinSup的商品。（第一次扫描数据库）

薯片:7鸡蛋:7面包:7牛奶:6啤酒:4 （这里我们令MinSup=3）

以上结果就是频繁1项集，记为F1。

第二步：对于每一条购买记录，按照F1中的顺序重新排序。（第二次也是最后一次扫描数据库）

薯片,鸡蛋,面包,牛奶

薯片,鸡蛋,啤酒

薯片,鸡蛋,面包

薯片,鸡蛋,面包,牛奶,啤酒

面包,牛奶,啤酒

鸡蛋,面包,啤酒

薯片,面包,牛奶

薯片,鸡蛋,面包,牛奶

薯片,鸡蛋,牛奶

第三步：把第二步得到的各条记录插入到FP-Tree中。刚开始时后缀模式为空。

插入每一条（薯片,鸡蛋,面包,牛奶）之后

插入第二条记录（薯片,鸡蛋,啤酒）

插入第三条记录（面包,牛奶,啤酒）

估计你也知道怎么插了，最终生成的FP-Tree是：

上图中左边的那一叫做表头项，树中相同名称的节点要链接起来，链表的第一个元素就是表头项里的元素。

如果FP-Tree为空（只含一个虚的root节点），则FP-Growth函数返回。

此时输出表头项的每一项+postModel，支持度为表头项中对应项的计数。

第四步：从FP-Tree中找出频繁项。

遍历表头项中的每一项（我们拿“牛奶：6”为例），对于各项都执行以下（1）到（5）的操作：

（1）从FP-Tree中找到所有的“牛奶”节点，向上遍历它的祖先节点，得到4条路径：

薯片：7，鸡蛋：6，牛奶：1

薯片：7，鸡蛋：6，面包：4，牛奶：3

薯片：7，面包：1，牛奶：1

面包：1，牛奶：1

对于每一条路径上的节点，其count都设置为牛奶的count

薯片：1，鸡蛋：1，牛奶：1

薯片：3，鸡蛋：3，面包：3，牛奶：3

薯片：1，面包：1，牛奶：1

面包：1，牛奶：1

因为每一项末尾都是牛奶，可以把牛奶去掉，得到条件模式基（Conditional Pattern Base,CPB），此时的后缀模式是：（牛奶）。

薯片：1，鸡蛋：1

薯片：3，鸡蛋：3，面包：3

薯片：1，面包：1

面包：1

（2）我们把上面的结果当作原始的事务数据库，返回到第3步，递归迭代运行。

没讲清楚，你可以参考这篇博客，直接看核心代码吧：

public void FPGrowth(List<List<String>> transRecords,
        List<String> postPattern,Context context) throws IOException, InterruptedException {
    // 构建项头表，同时也是频繁1项集
    ArrayList<TreeNode> HeaderTable = buildHeaderTable(transRecords);
    // 构建FP-Tree
    TreeNode treeRoot = buildFPTree(transRecords, HeaderTable);
    // 如果FP-Tree为空则返回
    if (treeRoot.getChildren()==null || treeRoot.getChildren().size() == 0)
        return;
    //输出项头表的每一项+postPattern
    if(postPattern!=null){
        for (TreeNode header : HeaderTable) {
            String outStr=header.getName();
            int count=header.getCount();
            for (String ele : postPattern)
                outStr+="\t" + ele;
            context.write(new IntWritable(count), new Text(outStr));
        }
    }
    // 找到项头表的每一项的条件模式基，进入递归迭代
    for (TreeNode header : HeaderTable) {
        // 后缀模式增加一项
        List<String> newPostPattern = new LinkedList<String>();
        newPostPattern.add(header.getName());
        if (postPattern != null)
            newPostPattern.addAll(postPattern);
        // 寻找header的条件模式基CPB，放入newTransRecords中
        List<List<String>> newTransRecords = new LinkedList<List<String>>();
        TreeNode backnode = header.getNextHomonym();
        while (backnode != null) {
            int counter = backnode.getCount();
            List<String> prenodes = new ArrayList<String>();
            TreeNode parent = backnode;
            // 遍历backnode的祖先节点，放到prenodes中
            while ((parent = parent.getParent()).getName() != null) {
                prenodes.add(parent.getName());
            }
            while (counter-- > 0) {
                newTransRecords.add(prenodes);
            }
            backnode = backnode.getNextHomonym();
        }
        // 递归迭代
        FPGrowth(newTransRecords, newPostPattern,context);
    }
}

对于FP-Tree已经是单枝的情况，就没有必要再递归调用FPGrowth了，直接输出整条路径上所有节点的各种组合+postModel就可了。例如当FP-Tree为：

我们直接输出：

3　　A+postModel

3　　B+postModel

3　　A+B+postModel

就可以了。

如何按照上面代码里的做法，是先输出：

3　　A+postModel

3　　B+postModel

然后把B插入到postModel的头部，重新建立一个FP-Tree，这时Tree中只含A，于是输出

3　　A+(B+postModel)

两种方法结果是一样的，但毕竟重新建立FP-Tree计算量大些。

Java实现

FP树节点定义

 
        package  
        fptree; 
       
        import  
        java.util.ArrayList; 
       
        import  
        java.util.List; 
       
        public  
        class  
        TreeNode  
        implements  
        Comparable<TreeNode> { 
       
        private  
        String name;  
        // 节点名称 
       
        private  
        int  
        count;  
        // 计数 
       
        private  
        TreeNode parent;  
        // 父节点 
       
        private  
        List<TreeNode> children;  
        // 子节点 
       
        private  
        TreeNode nextHomonym;  
        // 下一个同名节点 
       
        public  
        TreeNode() { 
       
        } 
       
        public  
        TreeNode(String name) { 
       
        this 
        .name = name; 
       
        } 
       
        public  
        String getName() { 
       
        return  
        name; 
       
        } 
       
        public  
        void  
        setName(String name) { 
       
        this 
        .name = name; 
       
        } 
       
        public  
        int  
        getCount() { 
       
        return  
        count; 
       
        } 
       
        public  
        void  
        setCount( 
        int  
        count) { 
       
        this 
        .count = count; 
       
        } 
       
        public  
        TreeNode getParent() { 
       
        return  
        parent; 
       
        } 
       
        public  
        void  
        setParent(TreeNode parent) { 
       
        this 
        .parent = parent; 
       
        } 
       
        public  
        List<TreeNode> getChildren() { 
       
        return  
        children; 
       
        } 
       
        public  
        void  
        addChild(TreeNode child) { 
       
        if  
        ( 
        this 
        .getChildren() ==  
        null 
        ) { 
       
        List<TreeNode> list =  
        new  
        ArrayList<TreeNode>(); 
       
        list.add(child); 
       
        this 
        .setChildren(list); 
       
        }  
        else  
        { 
       
        this 
        .getChildren().add(child); 
       
        } 
       
        } 
       
        public  
        TreeNode findChild(String name) { 
       
        List<TreeNode> children =  
        this 
        .getChildren(); 
       
        if  
        (children !=  
        null 
        ) { 
       
        for  
        (TreeNode child : children) { 
       
        if  
        (child.getName().equals(name)) { 
       
        return  
        child; 
       
        } 
       
        } 
       
        } 
       
        return  
        null 
        ; 
       
        } 
       
        public  
        void  
        setChildren(List<TreeNode> children) { 
       
        this 
        .children = children; 
       
        } 
       
        public  
        void  
        printChildrenName() { 
       
        List<TreeNode> children =  
        this 
        .getChildren(); 
       
        if  
        (children !=  
        null 
        ) { 
       
        for  
        (TreeNode child : children) { 
       
        System.out.print(child.getName() +  
        " " 
        ); 
       
        } 
       
        }  
        else  
        { 
       
        System.out.print( 
        "null" 
        ); 
       
        } 
       
        } 
       
        public  
        TreeNode getNextHomonym() { 
       
        return  
        nextHomonym; 
       
        } 
       
        public  
        void  
        setNextHomonym(TreeNode nextHomonym) { 
       
        this 
        .nextHomonym = nextHomonym; 
       
        } 
       
        public  
        void  
        countIncrement( 
        int  
        n) { 
       
        this 
        .count += n; 
       
        } 
       
        @Override 
       
        public  
        int  
        compareTo(TreeNode arg0) { 
       
        // TODO Auto-generated method stub 
       
        int  
        count0 = arg0.getCount(); 
       
        // 跟默认的比较大小相反，导致调用Arrays.sort()时是按降序排列 
       
        return  
        count0 -  
        this 
        .count; 
       
        } 
       
        }

挖掘频繁模式

 
        package  
        fptree; 
       
        import  
        java.io.BufferedReader; 
       
        import  
        java.io.FileReader; 
       
        import  
        java.io.IOException; 
       
        import  
        java.util.ArrayList; 
       
        import  
        java.util.Collections; 
       
        import  
        java.util.Comparator; 
       
        import  
        java.util.HashMap; 
       
        import  
        java.util.LinkedList; 
       
        import  
        java.util.List; 
       
        import  
        java.util.Map; 
       
        import  
        java.util.Map.Entry; 
       
        import  
        java.util.Set; 
       
        public  
        class  
        FPTree { 
       
        private  
        int  
        minSuport; 
       
        public  
        int  
        getMinSuport() { 
       
        return  
        minSuport; 
       
        } 
       
        public  
        void  
        setMinSuport( 
        int  
        minSuport) { 
       
        this 
        .minSuport = minSuport; 
       
        } 
       
        // 从若干个文件中读入Transaction Record 
       
        public  
        List<List<String>> readTransRocords(String... filenames) { 
       
        List<List<String>> transaction =  
        null 
        ; 
       
        if  
        (filenames.length >  
        0 
        ) { 
       
        transaction =  
        new  
        LinkedList<List<String>>(); 
       
        for  
        (String filename : filenames) { 
       
        try  
        { 
       
        FileReader fr =  
        new  
        FileReader(filename); 
       
        BufferedReader br =  
        new  
        BufferedReader(fr); 
       
        try  
        { 
       
        String line; 
       
        List<String> record; 
       
        while  
        ((line = br.readLine()) !=  
        null 
        ) { 
       
        if 
        (line.trim().length()> 
        0 
        ){ 
       
        String str[] = line.split( 
        "，" 
        ); 
       
        record =  
        new  
        LinkedList<String>(); 
       
        for  
        (String w : str) 
       
        record.add(w); 
       
        transaction.add(record); 
       
        } 
       
        } 
       
        }  
        finally  
        { 
       
        br.close(); 
       
        } 
       
        }  
        catch  
        (IOException ex) { 
       
        System.out.println( 
        "Read transaction records failed." 
       
        + ex.getMessage()); 
       
        System.exit( 
        1 
        ); 
       
        } 
       
        } 
       
        } 
       
        return  
        transaction; 
       
        } 
       
        // FP-Growth算法 
       
        public  
        void  
        FPGrowth(List<List<String>> transRecords, 
       
        List<String> postPattern) { 
       
        // 构建项头表，同时也是频繁1项集 
       
        ArrayList<TreeNode> HeaderTable = buildHeaderTable(transRecords); 
       
        // 构建FP-Tree 
       
        TreeNode treeRoot = buildFPTree(transRecords, HeaderTable); 
       
        // 如果FP-Tree为空则返回 
       
        if  
        (treeRoot.getChildren()== 
        null  
        || treeRoot.getChildren().size() ==  
        0 
        ) 
       
        return 
        ; 
       
        //输出项头表的每一项+postPattern 
       
        if 
        (postPattern!= 
        null 
        ){ 
       
        for  
        (TreeNode header : HeaderTable) { 
       
        System.out.print(header.getCount() +  
        "\t"  
        + header.getName()); 
       
        for  
        (String ele : postPattern) 
       
        System.out.print( 
        "\t"  
        + ele); 
       
        System.out.println(); 
       
        } 
       
        } 
       
        // 找到项头表的每一项的条件模式基，进入递归迭代 
       
        for  
        (TreeNode header : HeaderTable) { 
       
        // 后缀模式增加一项 
       
        List<String> newPostPattern =  
        new  
        LinkedList<String>(); 
       
        newPostPattern.add(header.getName()); 
       
        if  
        (postPattern !=  
        null 
        ) 
       
        newPostPattern.addAll(postPattern); 
       
        // 寻找header的条件模式基CPB，放入newTransRecords中 
       
        List<List<String>> newTransRecords =  
        new  
        LinkedList<List<String>>(); 
       
        TreeNode backnode = header.getNextHomonym(); 
       
        while  
        (backnode !=  
        null 
        ) { 
       
        int  
        counter = backnode.getCount(); 
       
        List<String> prenodes =  
        new  
        ArrayList<String>(); 
       
        TreeNode parent = backnode; 
       
        // 遍历backnode的祖先节点，放到prenodes中 
       
        while  
        ((parent = parent.getParent()).getName() !=  
        null 
        ) { 
       
        prenodes.add(parent.getName()); 
       
        } 
       
        while  
        (counter-- >  
        0 
        ) { 
       
        newTransRecords.add(prenodes); 
       
        } 
       
        backnode = backnode.getNextHomonym(); 
       
        } 
       
        // 递归迭代 
       
        FPGrowth(newTransRecords, newPostPattern); 
       
        } 
       
        } 
       
        // 构建项头表，同时也是频繁1项集 
       
        public  
        ArrayList<TreeNode> buildHeaderTable(List<List<String>> transRecords) { 
       
        ArrayList<TreeNode> F1 =  
        null 
        ; 
       
        if  
        (transRecords.size() >  
        0 
        ) { 
       
        F1 =  
        new  
        ArrayList<TreeNode>(); 
       
        Map<String, TreeNode> map =  
        new  
        HashMap<String, TreeNode>(); 
       
        // 计算事务数据库中各项的支持度 
       
        for  
        (List<String> record : transRecords) { 
       
        for  
        (String item : record) { 
       
        if  
        (!map.keySet().contains(item)) { 
       
        TreeNode node =  
        new  
        TreeNode(item); 
       
        node.setCount( 
        1 
        ); 
       
        map.put(item, node); 
       
        }  
        else  
        { 
       
        map.get(item).countIncrement( 
        1 
        ); 
       
        } 
       
        } 
       
        } 
       
        // 把支持度大于（或等于）minSup的项加入到F1中 
       
        Set<String> names = map.keySet(); 
       
        for  
        (String name : names) { 
       
        TreeNode tnode = map.get(name); 
       
        if  
        (tnode.getCount() >= minSuport) { 
       
        F1.add(tnode); 
       
        } 
       
        } 
       
        Collections.sort(F1); 
       
        return  
        F1; 
       
        }  
        else  
        { 
       
        return  
        null 
        ; 
       
        } 
       
        } 
       
        // 构建FP-Tree 
       
        public  
        TreeNode buildFPTree(List<List<String>> transRecords, 
       
        ArrayList<TreeNode> F1) { 
       
        TreeNode root =  
        new  
        TreeNode();  
        // 创建树的根节点 
       
        for  
        (List<String> transRecord : transRecords) { 
       
        LinkedList<String> record = sortByF1(transRecord, F1); 
       
        TreeNode subTreeRoot = root; 
       
        TreeNode tmpRoot =  
        null 
        ; 
       
        if  
        (root.getChildren() !=  
        null 
        ) { 
       
        while  
        (!record.isEmpty() 
       
        && (tmpRoot = subTreeRoot.findChild(record.peek())) !=  
        null 
        ) { 
       
        tmpRoot.countIncrement( 
        1 
        ); 
       
        subTreeRoot = tmpRoot; 
       
        record.poll(); 
       
        } 
       
        } 
       
        addNodes(subTreeRoot, record, F1); 
       
        } 
       
        return  
        root; 
       
        } 
       
        // 把交易记录按项的频繁程序降序排列 
       
        public  
        LinkedList<String> sortByF1(List<String> transRecord, 
       
        ArrayList<TreeNode> F1) { 
       
        Map<String, Integer> map =  
        new  
        HashMap<String, Integer>(); 
       
        for  
        (String item : transRecord) { 
       
        // 由于F1已经是按降序排列的， 
       
        for  
        ( 
        int  
        i =  
        0 
        ; i < F1.size(); i++) { 
       
        TreeNode tnode = F1.get(i); 
       
        if  
        (tnode.getName().equals(item)) { 
       
        map.put(item, i); 
       
        } 
       
        } 
       
        } 
       
        ArrayList<Entry<String, Integer>> al =  
        new  
        ArrayList<Entry<String, Integer>>( 
       
        map.entrySet()); 
       
        Collections.sort(al,  
        new  
        Comparator<Map.Entry<String, Integer>>() { 
       
        @Override 
       
        public  
        int  
        compare(Entry<String, Integer> arg0, 
       
        Entry<String, Integer> arg1) { 
       
        // 降序排列 
       
        return  
        arg0.getValue() - arg1.getValue(); 
       
        } 
       
        }); 
       
        LinkedList<String> rest =  
        new  
        LinkedList<String>(); 
       
        for  
        (Entry<String, Integer> entry : al) { 
       
        rest.add(entry.getKey()); 
       
        } 
       
        return  
        rest; 
       
        } 
       
        // 把record作为ancestor的后代插入树中 
       
        public  
        void  
        addNodes(TreeNode ancestor, LinkedList<String> record, 
       
        ArrayList<TreeNode> F1) { 
       
        if  
        (record.size() >  
        0 
        ) { 
       
        while  
        (record.size() >  
        0 
        ) { 
       
        String item = record.poll(); 
       
        TreeNode leafnode =  
        new  
        TreeNode(item); 
       
        leafnode.setCount( 
        1 
        ); 
       
        leafnode.setParent(ancestor); 
       
        ancestor.addChild(leafnode); 
       
        for  
        (TreeNode f1 : F1) { 
       
        if  
        (f1.getName().equals(item)) { 
       
        while  
        (f1.getNextHomonym() !=  
        null 
        ) { 
       
        f1 = f1.getNextHomonym(); 
       
        } 
       
        f1.setNextHomonym(leafnode); 
       
        break 
        ; 
       
        } 
       
        } 
       
        addNodes(leafnode, record, F1); 
       
        } 
       
        } 
       
        } 
       
        public  
        static  
        void  
        main(String[] args) { 
       
        FPTree fptree =  
        new  
        FPTree(); 
       
        fptree.setMinSuport( 
        3 
        ); 
       
        List<List<String>> transRecords = fptree 
       
        .readTransRocords( 
        "/home/orisun/test/market" 
        ); 
       
        fptree.FPGrowth(transRecords,  
        null 
        ); 
       
        } 
       
        }

输入文件

牛奶，鸡蛋，面包，薯片
鸡蛋，爆米花，薯片，啤酒
鸡蛋，面包，薯片
牛奶，鸡蛋，面包，爆米花，薯片，啤酒
牛奶，面包，啤酒
鸡蛋，面包，啤酒
牛奶，面包，薯片
牛奶，鸡蛋，面包，黄油，薯片
牛奶，鸡蛋，黄油，薯片

输出

6    薯片    鸡蛋
5    薯片    面包
5    鸡蛋    面包
4    薯片    鸡蛋    面包
5    薯片    牛奶
5    面包    牛奶
4    鸡蛋    牛奶
4    薯片    面包    牛奶
4    薯片    鸡蛋    牛奶
3    面包    鸡蛋    牛奶
3    薯片    面包    鸡蛋    牛奶
3    鸡蛋    啤酒
3    面包    啤酒

用Hadoop来实现

在上面的代码我们把整个事务数据库放在一个List<List<String>>里面传给FPGrowth，在实际中这是不可取的，因为内存不可能容下整个事务数据库，我们可能需要从关系关系数据库中一条一条地读入来建立FP-Tree。但无论如何 FP-Tree是肯定需要放在内存中的，但内存如果容不下怎么办？另外FPGrowth仍然是非常耗时的，你想提高速度怎么办？解决办法：分而治之，并行计算。

我们把原始事务数据库分成N部分，在N个节点上并行地进行FPGrowth挖掘，最后把关联规则汇总到一起就可以了。关键问题是怎么“划分”才会不遗露任何一条关联规则呢？参见这篇博客。这里为了达到并行计算的目的，采用了一种“冗余”的划分方法，即各部分的并集大于原来的集合。这种方法最终求出来的关联规则也是有冗余的，比如在节点1上得到一条规则（6:啤酒，尿布），在节点2上得到一条规则（3:尿布，啤酒），显然节点2上的这条规则是冗余的，需要采用后续步骤把冗余的规则去掉。

代码：

Record.java

 
        package  
        fptree; 
       
        import  
        java.io.DataInput; 
       
        import  
        java.io.DataOutput; 
       
        import  
        java.io.IOException; 
       
        import  
        java.util.Collections; 
       
        import  
        java.util.LinkedList; 
       
        import  
        org.apache.hadoop.io.WritableComparable; 
       
        public  
        class  
        Record  
        implements  
        WritableComparable<Record>{ 
       
        LinkedList<String> list; 
       
        public  
        Record(){ 
       
        list= 
        new  
        LinkedList<String>(); 
       
        } 
       
        public  
        Record(String[] arr){ 
       
        list= 
        new  
        LinkedList<String>(); 
       
        for 
        ( 
        int  
        i= 
        0 
        ;i<arr.length;i++) 
       
        list.add(arr[i]); 
       
        } 
       
        @Override 
       
        public  
        String toString(){ 
       
        String str=list.get( 
        0 
        ); 
       
        for 
        ( 
        int  
        i= 
        1 
        ;i<list.size();i++) 
       
        str+= 
        "\t" 
        +list.get(i); 
       
        return  
        str; 
       
        } 
       
        @Override 
       
        public  
        void  
        readFields(DataInput in)  
        throws  
        IOException { 
       
        list.clear(); 
       
        String line=in.readUTF(); 
       
        String []arr=line.split( 
        "\\s+" 
        ); 
       
        for 
        ( 
        int  
        i= 
        0 
        ;i<arr.length;i++) 
       
        list.add(arr[i]); 
       
        } 
       
        @Override 
       
        public  
        void  
        write(DataOutput out)  
        throws  
        IOException { 
       
        out.writeUTF( 
        this 
        .toString()); 
       
        } 
       
        @Override 
       
        public  
        int  
        compareTo(Record obj) { 
       
        Collections.sort(list); 
       
        Collections.sort(obj.list); 
       
        return  
        this 
        .toString().compareTo(obj.toString()); 
       
        } 
       
        }

DC_FPTree.java

 
        package  
        fptree; 
       
        import  
        java.io.BufferedReader; 
       
        import  
        java.io.IOException; 
       
        import  
        java.io.InputStreamReader; 
       
        import  
        java.util.ArrayList; 
       
        import  
        java.util.BitSet; 
       
        import  
        java.util.Collections; 
       
        import  
        java.util.Comparator; 
       
        import  
        java.util.HashMap; 
       
        import  
        java.util.LinkedList; 
       
        import  
        java.util.List; 
       
        import  
        java.util.Map; 
       
        import  
        java.util.Map.Entry; 
       
        import  
        java.util.Set; 
       
        import  
        org.apache.hadoop.conf.Configuration; 
       
        import  
        org.apache.hadoop.conf.Configured; 
       
        import  
        org.apache.hadoop.fs.FSDataInputStream; 
       
        import  
        org.apache.hadoop.fs.FileSystem; 
       
        import  
        org.apache.hadoop.fs.Path; 
       
        import  
        org.apache.hadoop.io.IntWritable; 
       
        import  
        org.apache.hadoop.io.LongWritable; 
       
        import  
        org.apache.hadoop.io.Text; 
       
        import  
        org.apache.hadoop.mapreduce.Job; 
       
        import  
        org.apache.hadoop.mapreduce.Mapper; 
       
        import  
        org.apache.hadoop.mapreduce.Reducer; 
       
        import  
        org.apache.hadoop.mapreduce.lib.input.FileInputFormat; 
       
        import  
        org.apache.hadoop.mapreduce.lib.input.TextInputFormat; 
       
        import  
        org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; 
       
        import  
        org.apache.hadoop.mapreduce.lib.output.TextOutputFormat; 
       
        import  
        org.apache.hadoop.util.Tool; 
       
        import  
        org.apache.hadoop.util.ToolRunner; 
       
        public  
        class  
        DC_FPTree  
        extends  
        Configured  
        implements  
        Tool { 
       
        private  
        static  
        final  
        int  
        GroupNum =  
        10 
        ; 
       
        private  
        static  
        final  
        int  
        minSuport= 
        6 
        ; 
       
        public  
        static  
        class  
        GroupMapper  
        extends 
       
        Mapper<LongWritable, Text, IntWritable, Record> { 
       
        List<String> freq =  
        new  
        LinkedList<String>();  
        // 频繁1项集 
       
        List<List<String>> freq_group =  
        new  
        LinkedList<List<String>>();  
        // 分组后的频繁1项集 
       
        @Override 
       
        public  
        void  
        setup(Context context)  
        throws  
        IOException { 
       
        // 从文件读入频繁1项集 
       
        FileSystem fs = FileSystem.get(context.getConfiguration()); 
       
        Path freqFile =  
        new  
        Path( 
        "/user/orisun/input/F1" 
        ); 
       
        FSDataInputStream in = fs.open(freqFile); 
       
        InputStreamReader isr =  
        new  
        InputStreamReader(in); 
       
        BufferedReader br =  
        new  
        BufferedReader(isr); 
       
        try  
        { 
       
        String line; 
       
        while  
        ((line = br.readLine()) !=  
        null 
        ) { 
       
        String[] str = line.split( 
        "\\s+" 
        ); 
       
        String word = str[ 
        0 
        ]; 
       
        freq.add(word); 
       
        } 
       
        }  
        finally  
        { 
       
        br.close(); 
       
        } 
       
        // 对频繁1项集进行分组 
       
        Collections.shuffle(freq);  
        // 打乱顺序 
       
        int  
        cap = freq.size() / GroupNum;  
        // 每段分为一组 
       
        for  
        ( 
        int  
        i =  
        0 
        ; i < GroupNum; i++) { 
       
        List<String> list =  
        new  
        LinkedList<String>(); 
       
        for  
        ( 
        int  
        j =  
        0 
        ; j < cap; j++) { 
       
        list.add(freq.get(i * cap + j)); 
       
        } 
       
        freq_group.add(list); 
       
        } 
       
        int  
        remainder = freq.size() % GroupNum; 
       
        int  
        base = GroupNum * cap; 
       
        for  
        ( 
        int  
        i =  
        0 
        ; i < remainder; i++) { 
       
        freq_group.get(i).add(freq.get(base + i)); 
       
        } 
       
        } 
       
        @Override 
       
        public  
        void  
        map(LongWritable key, Text value, Context context) 
       
        throws  
        IOException, InterruptedException { 
       
        String[] arr = value.toString().split( 
        "\\s+" 
        ); 
       
        Record record =  
        new  
        Record(arr); 
       
        LinkedList<String> list = record.list; 
       
        BitSet bs= 
        new  
        BitSet(freq_group.size()); 
       
        bs.clear(); 
       
        while  
        (record.list.size() >  
        0 
        ) { 
       
        String item = list.peekLast();  
        // 取出record的最后一项 
       
        int  
        i= 
        0 
        ; 
       
        for  
        (; i < freq_group.size(); i++) { 
       
        if 
        (bs.get(i)) 
       
        continue 
        ; 
       
        if  
        (freq_group.get(i).contains(item)) { 
       
        bs.set(i); 
       
        break 
        ; 
       
        } 
       
        } 
       
        if 
        (i<freq_group.size()){      
        //找到了 
       
        context.write( 
        new  
        IntWritable(i), record);   
       
        } 
       
        record.list.pollLast(); 
       
        } 
       
        } 
       
        } 
       
        public  
        static  
        class  
        FPReducer  
        extends  
        Reducer<IntWritable,Record,IntWritable,Text>{ 
       
        public  
        void  
        reduce(IntWritable key,Iterable<Record> values,Context context) 
        throws  
        IOException,InterruptedException{ 
       
        List<List<String>> trans= 
        new  
        LinkedList<List<String>>(); 
       
        while 
        (values.iterator().hasNext()){ 
       
        Record record=values.iterator().next(); 
       
        LinkedList<String> list= 
        new  
        LinkedList<String>(); 
       
        for 
        (String ele:record.list) 
       
        list.add(ele); 
       
        trans.add(list); 
       
        } 
       
        FPGrowth(trans,  
        null 
        ,context); 
       
        } 
       
        // FP-Growth算法 
       
        public  
        void  
        FPGrowth(List<List<String>> transRecords, 
       
        List<String> postPattern,Context context)  
        throws  
        IOException, InterruptedException { 
       
        // 构建项头表，同时也是频繁1项集 
       
        ArrayList<TreeNode> HeaderTable = buildHeaderTable(transRecords); 
       
        // 构建FP-Tree 
       
        TreeNode treeRoot = buildFPTree(transRecords, HeaderTable); 
       
        // 如果FP-Tree为空则返回 
       
        if  
        (treeRoot.getChildren()== 
        null  
        || treeRoot.getChildren().size() ==  
        0 
        ) 
       
        return 
        ; 
       
        //输出项头表的每一项+postPattern 
       
        if 
        (postPattern!= 
        null 
        ){ 
       
        for  
        (TreeNode header : HeaderTable) { 
       
        String outStr=header.getName(); 
       
        int  
        count=header.getCount(); 
       
        for  
        (String ele : postPattern) 
       
        outStr+= 
        "\t"  
        + ele; 
       
        context.write( 
        new  
        IntWritable(count),  
        new  
        Text(outStr)); 
       
        } 
       
        } 
       
        // 找到项头表的每一项的条件模式基，进入递归迭代 
       
        for  
        (TreeNode header : HeaderTable) { 
       
        // 后缀模式增加一项 
       
        List<String> newPostPattern =  
        new  
        LinkedList<String>(); 
       
        newPostPattern.add(header.getName()); 
       
        if  
        (postPattern !=  
        null 
        ) 
       
        newPostPattern.addAll(postPattern); 
       
        // 寻找header的条件模式基CPB，放入newTransRecords中 
       
        List<List<String>> newTransRecords =  
        new  
        LinkedList<List<String>>(); 
       
        TreeNode backnode = header.getNextHomonym(); 
       
        while  
        (backnode !=  
        null 
        ) { 
       
        int  
        counter = backnode.getCount(); 
       
        List<String> prenodes =  
        new  
        ArrayList<String>(); 
       
        TreeNode parent = backnode; 
       
        // 遍历backnode的祖先节点，放到prenodes中 
       
        while  
        ((parent = parent.getParent()).getName() !=  
        null 
        ) { 
       
        prenodes.add(parent.getName()); 
       
        } 
       
        while  
        (counter-- >  
        0 
        ) { 
       
        newTransRecords.add(prenodes); 
       
        } 
       
        backnode = backnode.getNextHomonym(); 
       
        } 
       
        // 递归迭代 
       
        FPGrowth(newTransRecords, newPostPattern,context); 
       
        } 
       
        } 
       
        // 构建项头表，同时也是频繁1项集 
       
        public  
        ArrayList<TreeNode> buildHeaderTable(List<List<String>> transRecords) { 
       
        ArrayList<TreeNode> F1 =  
        null 
        ; 
       
        if  
        (transRecords.size() >  
        0 
        ) { 
       
        F1 =  
        new  
        ArrayList<TreeNode>(); 
       
        Map<String, TreeNode> map =  
        new  
        HashMap<String, TreeNode>(); 
       
        // 计算事务数据库中各项的支持度 
       
        for  
        (List<String> record : transRecords) { 
       
        for  
        (String item : record) { 
       
        if  
        (!map.keySet().contains(item)) { 
       
        TreeNode node =  
        new  
        TreeNode(item); 
       
        node.setCount( 
        1 
        ); 
       
        map.put(item, node); 
       
        }  
        else  
        { 
       
        map.get(item).countIncrement( 
        1 
        ); 
       
        } 
       
        } 
       
        } 
       
        // 把支持度大于（或等于）minSup的项加入到F1中 
       
        Set<String> names = map.keySet(); 
       
        for  
        (String name : names) { 
       
        TreeNode tnode = map.get(name); 
       
        if  
        (tnode.getCount() >= minSuport) { 
       
        F1.add(tnode); 
       
        } 
       
        } 
       
        Collections.sort(F1); 
       
        return  
        F1; 
       
        }  
        else  
        { 
       
        return  
        null 
        ; 
       
        } 
       
        } 
       
        // 构建FP-Tree 
       
        public  
        TreeNode buildFPTree(List<List<String>> transRecords, 
       
        ArrayList<TreeNode> F1) { 
       
        TreeNode root =  
        new  
        TreeNode();  
        // 创建树的根节点 
       
        for  
        (List<String> transRecord : transRecords) { 
       
        LinkedList<String> record = sortByF1(transRecord, F1); 
       
        TreeNode subTreeRoot = root; 
       
        TreeNode tmpRoot =  
        null 
        ; 
       
        if  
        (root.getChildren() !=  
        null 
        ) { 
       
        while  
        (!record.isEmpty() 
       
        && (tmpRoot = subTreeRoot.findChild(record.peek())) !=  
        null 
        ) { 
       
        tmpRoot.countIncrement( 
        1 
        ); 
       
        subTreeRoot = tmpRoot; 
       
        record.poll(); 
       
        } 
       
        } 
       
        addNodes(subTreeRoot, record, F1); 
       
        } 
       
        return  
        root; 
       
        } 
       
        // 把交易记录按项的频繁程序降序排列 
       
        public  
        LinkedList<String> sortByF1(List<String> transRecord, 
       
        ArrayList<TreeNode> F1) { 
       
        Map<String, Integer> map =  
        new  
        HashMap<String, Integer>(); 
       
        for  
        (String item : transRecord) { 
       
        // 由于F1已经是按降序排列的， 
       
        for  
        ( 
        int  
        i =  
        0 
        ; i < F1.size(); i++) { 
       
        TreeNode tnode = F1.get(i); 
       
        if  
        (tnode.getName().equals(item)) { 
       
        map.put(item, i); 
       
        } 
       
        } 
       
        } 
       
        ArrayList<Entry<String, Integer>> al =  
        new  
        ArrayList<Entry<String, Integer>>( 
       
        map.entrySet()); 
       
        Collections.sort(al,  
        new  
        Comparator<Map.Entry<String, Integer>>() { 
       
        @Override 
       
        public  
        int  
        compare(Entry<String, Integer> arg0, 
       
        Entry<String, Integer> arg1) { 
       
        // 降序排列 
       
        return  
        arg0.getValue() - arg1.getValue(); 
       
        } 
       
        }); 
       
        LinkedList<String> rest =  
        new  
        LinkedList<String>(); 
       
        for  
        (Entry<String, Integer> entry : al) { 
       
        rest.add(entry.getKey()); 
       
        } 
       
        return  
        rest; 
       
        } 
       
        // 把record作为ancestor的后代插入树中 
       
        public  
        void  
        addNodes(TreeNode ancestor, LinkedList<String> record, 
       
        ArrayList<TreeNode> F1) { 
       
        if  
        (record.size() >  
        0 
        ) { 
       
        while  
        (record.size() >  
        0 
        ) { 
       
        String item = record.poll(); 
       
        TreeNode leafnode =  
        new  
        TreeNode(item); 
       
        leafnode.setCount( 
        1 
        ); 
       
        leafnode.setParent(ancestor); 
       
        ancestor.addChild(leafnode); 
       
        for  
        (TreeNode f1 : F1) { 
       
        if  
        (f1.getName().equals(item)) { 
       
        while  
        (f1.getNextHomonym() !=  
        null 
        ) { 
       
        f1 = f1.getNextHomonym(); 
       
        } 
       
        f1.setNextHomonym(leafnode); 
       
        break 
        ; 
       
        } 
       
        } 
       
        addNodes(leafnode, record, F1); 
       
        } 
       
        } 
       
        } 
       
        } 
       
        public  
        static  
        class  
        InverseMapper  
        extends 
       
        Mapper<LongWritable, Text, Record, IntWritable> { 
       
        @Override 
       
        public  
        void  
        map(LongWritable key, Text value, Context context) 
       
        throws  
        IOException, InterruptedException { 
       
        String []arr=value.toString().split( 
        "\\s+" 
        ); 
       
        int  
        count=Integer.parseInt(arr[ 
        0 
        ]); 
       
        Record record= 
        new  
        Record(); 
       
        for 
        ( 
        int  
        i= 
        1 
        ;i<arr.length;i++){ 
       
        record.list.add(arr[i]); 
       
        } 
       
        context.write(record,  
        new  
        IntWritable(count)); 
       
        } 
       
        } 
       
        public  
        static  
        class  
        MaxReducer  
        extends  
        Reducer<Record,IntWritable,IntWritable,Record>{ 
       
        public  
        void  
        reduce(Record key,Iterable<IntWritable> values,Context context) 
        throws  
        IOException,InterruptedException{ 
       
        int  
        max=- 
        1 
        ; 
       
        for 
        (IntWritable value:values){ 
       
        int  
        i=value.get(); 
       
        if 
        (i>max) 
       
        max=i; 
       
        } 
       
        context.write( 
        new  
        IntWritable(max), key); 
       
        } 
       
        } 
       
        @Override 
       
        public  
        int  
        run(String[] arg0)  
        throws  
        Exception { 
       
        Configuration conf=getConf(); 
       
        conf.set( 
        "mapred.task.timeout" 
        ,  
        "6000000" 
        ); 
       
        Job job= 
        new  
        Job(conf); 
       
        job.setJarByClass(DC_FPTree. 
        class 
        ); 
       
        FileSystem fs=FileSystem.get(getConf()); 
       
        FileInputFormat.setInputPaths(job,  
        "/user/orisun/input/data" 
        ); 
       
        Path outDir= 
        new  
        Path( 
        "/user/orisun/output" 
        ); 
       
        fs.delete(outDir, 
        true 
        ); 
       
        FileOutputFormat.setOutputPath(job, outDir); 
       
        job.setMapperClass(GroupMapper. 
        class 
        ); 
       
        job.setReducerClass(FPReducer. 
        class 
        ); 
       
        job.setInputFormatClass(TextInputFormat. 
        class 
        ); 
       
        job.setOutputFormatClass(TextOutputFormat. 
        class 
        ); 
       
        job.setMapOutputKeyClass(IntWritable. 
        class 
        ); 
       
        job.setMapOutputValueClass(Record. 
        class 
        ); 
       
        job.setOutputKeyClass(IntWritable. 
        class 
        ); 
       
        job.setOutputKeyClass(Text. 
        class 
        ); 
       
        boolean  
        success=job.waitForCompletion( 
        true 
        ); 
       
        job= 
        new  
        Job(conf); 
       
        job.setJarByClass(DC_FPTree. 
        class 
        ); 
       
        FileInputFormat.setInputPaths(job,  
        "/user/orisun/output/part-r-*" 
        ); 
       
        Path outDir2= 
        new  
        Path( 
        "/user/orisun/output2" 
        ); 
       
        fs.delete(outDir2, 
        true 
        ); 
       
        FileOutputFormat.setOutputPath(job, outDir2); 
       
        job.setMapperClass(InverseMapper. 
        class 
        ); 
       
        job.setReducerClass(MaxReducer. 
        class 
        ); 
       
        //job.setNumReduceTasks(0); 
       
        job.setInputFormatClass(TextInputFormat. 
        class 
        ); 
       
        job.setOutputFormatClass(TextOutputFormat. 
        class 
        ); 
       
        job.setMapOutputKeyClass(Record. 
        class 
        ); 
       
        job.setMapOutputValueClass(IntWritable. 
        class 
        ); 
       
        job.setOutputKeyClass(IntWritable. 
        class 
        ); 
       
        job.setOutputKeyClass(Record. 
        class 
        ); 
       
        success |= job.waitForCompletion( 
        true 
        ); 
       
        return  
        success? 
        0 
        : 
        1 
        ; 
       
        } 
       
        public  
        static  
        void  
        main(String[] args)  
        throws  
        Exception{ 
       
        int  
        res=ToolRunner.run( 
        new  
        Configuration(),  
        new  
        DC_FPTree(), args); 
       
        System.exit(res); 
       
        } 
       
        }

xgboost原理茶尽
阅读XGBoost与BoostedTree基学习器：CART每个叶子节点上面有一个分数不够厉害，所以找一个更强的模型treeensemble对每个样本的预测结果是每棵树预测分数的和目标函数采用boosting（additivetraining）方法，每一次都加入一个新的函数。依赖每个数据点上的误差函数的一阶导数和二阶导（区别于GBDT）。树的复杂度复杂度包含了一棵树里面的叶子个数和输出分数的L2模
力扣 hot100 Day52
124.二叉树中的最大路径和二叉树中的路径被定义为一条节点序列，序列中每对相邻节点之间都存在一条边。同一个节点在一条路径序列中至多出现一次。该路径至少包含一个节点，且不一定经过根节点。路径和是路径中各节点值的总和。给你一个二叉树的根节点root，返回其最大路径和。//自己写的classSolution{public:intmaxpasssum(TreeNode*root,int&maxtmp){i
深入理解 C++ 红黑树：从理论到实践 jdlxx_dongfangxing 开发语言 c++算法
引言在计算机科学领域，数据结构是构建高效算法的基石。而在众多的数据结构中，平衡二叉搜索树因其优秀的查找、插入和删除性能而备受关注。红黑树（Red-BlackTree）作为一种自平衡的二叉搜索树，更是在C++标准库（如STL中的map和set）中得到了广泛应用。本文将深入探讨红黑树的原理、实现及应用，帮助读者全面掌握这一重要的数据结构。红黑树的基本概念红黑树是一种特殊的二叉搜索树，它在每个节点上增加
设计模式（十六）行为型：解释器模式详解
设计模式（十六）行为型：解释器模式详解解释器模式（InterpreterPattern）是GoF23种设计模式中的行为型模式之一，其核心价值在于为某种特定语言或表达式定义一个语法表示，并提供一个解释器来处理该语法结构。它通过构建抽象语法树（AST,AbstractSyntaxTree），将语言的语法规则映射为类层次结构，使得系统能够“理解”并执行自定义语言的指令。解释器模式是实现小型领域特定语言（
Same Tree 小明今晚加班
题目描述Giventwobinarytrees,writeafunctiontocheckiftheyarethesameornot.Twobinarytreesareconsideredthesameiftheyarestructurallyidenticalandthenodeshavethesamevalue.Example1:Input:11/\/\2323[1,2,3],[1,2,3]O
深入详解：决策树在医学影像分割特征选择中的应用与实现猿享天开决策树算法机器学习人工智能
深入详解：决策树在医学影像分割特征选择中的应用与实现决策树（DecisionTree）作为一种经典的机器学习算法，以其简单、直观和可解释性强的特点，在医学影像分割的特征选择中扮演了重要角色。医学影像分割（如分割脑肿瘤、肝脏、肺结节等）需要从高维影像数据中提取关键特征，以提升分割模型的精度和效率。决策树通过构建树形结构，筛选对分割任务最重要的特征，降低数据维度，同时提供可解释的规则。本文将从原理、实
Python XML解析写程序的猿 python
XML是一种用于存储和交换数据的标记语言。Python提供了多种库，可以用于解析XML文件。本指南将介绍三种最常用的解析库：xml.etree.ElementTree、xml.dom.minidom和lxml。xml.etree.ElementTreexml.etree.ElementTree是Python内置的库，用于解析XML文件并将其转换为Python对象。它使用DOM解析器，并且具有简单易
Python 使用xml.etree.ElementTree 解析ARXML文件流动的星 Classic AutoSAR详解 xml ARXML python
目录一、简介二、库的导入及指向根目录三、遍历所有包节点四、变量所有SWC组件五、遍历所有P_Port端口六、遍历所有R_Port端口七、遍历所有R_Port索引八、总结一、简介前面介绍了ARXML的结构，本节讲述解析arxml文件的方法，及常用函数；使用xml.etree.ElementTree块实现了一个简单而高效的API，用于解析和创建XML数据。解析ARXML文件常用的库是：xml.dom.
Python解析xml的库有哪些 PlutoZuo Python python xml
Python解析xml的库有哪些文章目录Python解析xml的库有哪些Python中有很多库可以用来解析XML文件，以下是其中几个常用的库：xml.etree.ElementTree：这是Python标准库中自带的XML解析库，它提供了简单的API用于解析XML文件，并可以通过递归或迭代的方式访问XML元素和属性。例如：importxml.etree.ElementTreeasETtree=ET
226. 翻转二叉树 bbruyew 力扣刷题数据结构算法深度优先 leetcode c语言
题目给你一棵二叉树的根节点root，翻转这棵二叉树，并返回其根节点。解题思路DFS广度有限搜索层序遍历二叉树，遍历过程中交换左右子树代码/***Definitionforabinarytreenode.*structTreeNode{*intval;*structTreeNode*left;*structTreeNode*right;*};*//*DFS广度有限搜索层序遍历二叉树，遍历过程中交换左
111. 二叉树的最小深度
题目给定一个二叉树，找出其最小深度。最小深度是从根节点到最近叶子节点的最短路径上的节点数量。说明：叶子节点是指没有子节点的节点。解题思路BFS广度优先算法：使用队列进行层序遍历，自上而下、逐层地探索树的结构。一旦发现第一个叶子节点，立即返回当前深度作为最小深度。代码/***Definitionforabinarytreenode.*structTreeNode{*intval;*structTre
图论的题目整合（Dijkstra） _Free_fish_ 图论算法
前置知识：Dijkstra题目1AT_abc070_d[ABC070D]TransitTreePath由于点KKK是固定的，并且是无向图（题目说是树），其实可以理解为求点KKK到点xjx_jxj的最短路加上点KKK到点yjy_jyj的最短路。由于边权cic_ici的范围是1≤ci≤1091\lec_i\le10^91≤ci≤109，没有负数，所以用Dijkstra以KKK为起点跑最短路。#incl
【专业技能】数据库索引有哪些类别_你可能听过但不熟悉的那些索引恩比贤AmbitioN 面经分享数据库
数据库索引是用于加速数据查询的特殊结构，根据其功能、存储方式和用途，可以分为多种类别。以下是数据库索引的主要类别及其特点的详细说明：1.按索引结构分类B+树索引（B+TreeIndex）特点：最常见的索引类型，基于B+树结构，适合范围查询、等值查询和排序操作。叶子节点存储所有索引键值，并按顺序链接，支持高效的范围查找。支持最左前缀原则，适用于复合索引。适用场景：适合大多数查询场景，如WHERE、O
深入详解：决策树在医学影像骨科分析中的应用与实现
深入详解：决策树在医学影像骨科分析中的应用与实现决策树（DecisionTree）是一种经典的机器学习算法，以其简单、直观和高可解释性的特点，在医学影像领域的骨科分析中应用广泛。骨科影像分析主要基于X光片、CT或MRI图像，用于骨折检测、骨关节炎分级、骨龄评估等任务。决策树通过构建树形结构，将复杂影像特征转化为清晰的决策规则，特别适合需要可解释性强的医疗场景。本文将从原理、实现细节到具体应用，深入
TreeSet 05大叔数据结构
TreeSet集合默认的规则1.对于数值类型：Integer,Double,默认按照从小到打的顺序进行排序2.对于字符，字符串类型，按照字符在ASCII码表中的数字升序进行排序对于自定义类如何排序1.方法一：默认排序/自然排序：javabean类实现Comparable接口比较规则publicintcompareTo(Studento){//指定排序规则returnthis.getAge()-o.
2023-02-09 克鲁兹王莲
R代码可以如下：```#定义数据a<-c(1,2,3,4,5)b<-c(2,3,4,5,6)c<-c(3,4,5,6,7)d<-c(4,5,6,7,8)#计算数据之间的相关系数cor_coef<-cor(cbind(a,b,c,d))#聚类以及排序hc<-hclust(as.dist(cor_coef))#绘制聚类树plot(hc)#根据聚类树，获取排序后的结果groups<-cutree(hc,
C++AVL树
目录一、平衡搜索二叉树实现方式：二、AVL树的插入三、AVL树的中序遍历、判断、高度以及大小计算一、平衡搜索二叉树实现方式：这里采用平衡因子的方式记录左右子树高度，并在普通搜索二叉树的基础上再每个节点中加上一个指向父节点的指针以方便链接代码如下：templatestructAVLTreeNode{pair_kv;AVLTreeNode*_left;AVLTreeNode*_right;AVLTre
【C++PCL】点云处理总目录持续更新..... 迅卓科技 PCL点云处理 c++开发语言
作者：迅卓科技简介：本人从事过多项点云项目，并且负责的项目均已得到好评！公众号：迅卓科技888重点：每个模块都有参数如何调试的讲解，即调试某个参数对结果的影响是什么，大家有问题可以评论哈，如果文章有错误的地方，欢迎来指出错误的地方。最近更新时间：2025年7月16号目录一、点云储存1.kd-tree2.kd-tree应用3.八叉树二、点云采样1.下采样2.上采样三、点云滤波1.传统滤波2.改进传统
python爬取京东评论(四) 飞向深空
改进在于实现了多个牌子和线程池的改进importrequestsimportjsonfromconcurrent.futuresimportThreadPoolExecutorimporttimeimportrefromlxmlimportetreeclasscpu:def__init__(self):self.headers={'User-Agent':'Mozilla/5.0(WindowsN
【c++】leetcode102 二叉树的层序遍历聿默 #c++刷题专栏 c++算法数据结构
1.题目给你二叉树的根节点root，返回其节点值的层序遍历。（即逐层地，从左到右访问所有节点）。2.解答/***Definitionforabinarytreenode.*structTreeNode{*intval;*TreeNode*left;*TreeNode*right;*TreeNode():val(0),left(nullptr),right(nullptr){}*TreeNode(i
spring cloud 分布式事务回滚，集成第三方模块TX-LCN 原理介绍 UD燕 java spring boot spring 后端
官方文档说明：http://www.txlcn.org/zh-cn/docs/start.html一、tx-lcn第三方开源服务地址：https://github.com/codingapi/tx-lcn/tree/5.0.2.RELEASE1、拉取5.0.2.RELEASE版本的代码二、配置步骤：快速开始说明TX-LCN主要有两个模块，Tx-Client(TC)Tx-Manager(TM).TC
h265webjs 在vue3中的使用
h265webjs播放器文章目录h265webjs播放器前言WebAssembly的发展一、h265webjs是什么？二、使用步骤1.在项目引入h265webjs[gitub地址](https://github.com/numberwolf/h265web.js/tree/master/dist)2.在src/utils创建一个executor.js文件3.视频的展示前言回顾什么是H.265？本文
手把手教你使用python爬虫之xpath 景天科技苑爬虫副业实战零基础进阶教学 python 爬虫开发语言 xpath
文章目录xpath1.xpath解析的编码流程2.使用方法2.调用etree对象的xpath方法结合不同形式的xpath表达式进行标签定位和数据提取3.案例应用（1）爬取第一页（2）下载多页xpath环境安装：pipinstalllxml1.xpath解析的编码流程1.创建一个etree类型的对象，然后把即将被解析的页面源码数据加载到该对象中2.调用etree对象的xpath方法结合着不同形式的x
一天两道力扣（3）薰衣草2333 leetcode leetcode 算法
解法一：classSolution(object):definvertTree(self,root):ifnotroot:returnNoneroot.left,root.right=root.right,root.leftself.invertTree(root.right)self.invertTree(root.left)returnroot解析：递归解法二：classSolution(ob
2025.7.22 测试总结
Fromnfls2025SummerCampS+题目后的括号(a,b)(a,b)(a,b)表示(难度，考场思考率)目录T3矩形坑洞覆盖（easy+,80%）T4ABBA替换（mid-,60%）T5[POI2005]SAM-ToyCars（mid-,95%）T7[SCOI2006]zh_tree（mid+,40%）T8CF627DPreorderTest（mid+,5%）总结T3矩形坑洞覆盖（eas
mysql索引和查询优化 Itzel_yuki mysql mysql索引 mysql查询优化高性能mysql 总结
BTree索引：1、对于组合索引，如果查询中有某个列是范围查询，则其右边所有列都无法使用索引优化查询2、高性能索引，索引的列不能是表达式的一部分，也不能是函数的参数。应该养成简化where查询的习惯，始终将索引列单独放在符号的一侧。3、前缀索引和索引的选择性：在创建前缀索引时，选择选择性更丰富的前缀长度。4、mysql无法使用前缀索引做orderBy和groupby，也无法使用前缀索引做覆盖扫描。
2022-05-05 Ocean佘
▍今日一句Insummer,thesongsingsitself.—TheBotticellianTrees,Poet,WilliamCarlosWilliams夏声似管弦。——《波提切利的树》威廉·卡洛斯·威廉斯，诗人▍今日一学·拓展若夫乘天地之正，而御六气之辩，以游无穷者，彼且恶乎待哉？故曰：至人无己，神人无功，圣人无名。——《逍遥游》庄子三籁：天籁；地籁；人籁非彼无我，非我无所取。以道观之，
2025 睿抗机器人开发者大赛CAIP-编程技能赛-本科组（省赛）题解弥彦_ 睿抗算法 c++
目录前言RC-u1早鸟价考察算法：思路：注意点：accode：RC-u2谁进线下了？III考察算法：思路：注意点：accode：RC-u3点格棋评价：考察算法：思路：注意点：accode：RC-u4TreeTree的考察算法：思路：注意点：accode：RC-u5游戏设计师考察算法：思路：注意点：accode：前言被t3折磨坏了，几乎全部时间都在调t3，最后只拿了36分，呜呜呜。RC-u1早鸟价考
MySQL索引机制解析：B+树、索引类型与优化策略 hdzw20 mysql复习 mysql b树数据库
MySQL索引机制解析：B+树、索引类型与优化策略索引是MySQL数据库中提高查询效率的关键。深入理解索引的底层机制、不同类型及其优化策略，对于数据库性能调优和面试准备都至关重要。本文将围绕B+树、聚簇索引与非聚簇索引、索引下推、覆盖索引以及自适应哈希索引等核心概念进行阐述。1.B+树vsB树：为何MySQL选择B+树？B树（B-tree）和B+树（B±tree）都是常用的多路平衡查找树，它们旨在
金蝶云苍穹树形单据体创建及插件的简单使用涎涎
树形单据体介绍单据体，用来在界面上显示、录入多行多列数据。树形单据体与单据体的不同之处在于，树形单据体中的数据行之间，可以设置父子从属关系，形成树形结构。树形单据体创建通过模板创建单据带组织模板单据选中单据体添加高级面板选中高级面板子容器，插入树形单据体按如下步骤设置工具栏设置树形单据体表名t_treebill_entry树形单据体功能添加字段开启显示序号列和显示选择列保存并授权退出当前账号，ad
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

FP-Tree算法的实现

支持度和置信度

FP-Tree算法

Java实现

用Hadoop来实现

你可能感兴趣的:(tree)