MapReduce

MapReduce关系数据库

多目的:用于数据分析、数据编辑、批量互动任务

通过“ACID transactions”机制实现高度数据完整

 大量兼容工具用于加载、管理、报告、数据图形化和信息挖掘

 支持SQL语言——用于数据分析最广泛的语言
SOL语言自动优化从根本上提升性能

 通过连接协议、映射层和用户定义函数,将SQL和熟悉的编程语言集成

MapReduce (Hadoop)

为大型集群设计(超过1000台计算机)

极高的稳定性,长时间保持高效运行,即使个别机器宕机

 数据以“原始格式”存储于文件系统,加载时无需将数据转换成表

 没有专用的查询语言,开发者熟悉Java、Python或Perl

 开发者决定性能而非查询语句优化

 Hadoop开源项目基于企业赞助,随时间成熟,就像Linux和Apache

你可能感兴趣的:(mapreduce,hadoop,linux,数据挖掘,python)