MapReduce 实现k-means聚类

MapRedute 实现k-means聚类



while (Iteration++    < 10)  {


RUN a JOB  ==>

Map函数

     完成每个记录到聚类中心距离的计算并重新标记其属于的新聚类类别

      假设该记录record到中心点A[k]  的距离是最短的,则

      Emit(a[k], record);

Reduce函数

      根据Map函数得到的中间结果计算出新的聚类中心,供下一轮MapReduce迭代使用

      每个reduce函数处理分到一个中心点 a[k] 的所有记录,由这些记录生成一个新的中心点 b[k]

      Emit(b[k], record);   


}

你可能感兴趣的:(mapreduce,hadoop,k-means,datamining)