企业级Ruby开发曙光:开源ActiveWarehouse插件发布

在整个软件开发社区里,对Ruby和Rails的赞扬声从没有间断过,除了它是否能够适应企业开发的需要。比如,Rails是否能处理海量的业务数据?通过ActiveWarehouse的最新发布,开源方面的Rails程序员Anthony Eden向社区奉献了解决此问题的插件,使得使用Ruby on Rails构建数据仓库变得轻而易举。现在,ActiveWarehouse已经是最活跃的RubyForge项目之一,有关它新特性的发布路线图看上去也是那么吸引人:

ActiveWarehouse插件能简化在Rails里开发数据仓库应用。数据仓库是一个相比于运行事务处理而言,为满足分析需要而专门设计的数据库。一个典型的数据仓库可以存储好几年的数据,从不同的运行数据中提取数据。数据仓库通常是高度非规范化的,这和倾向于规范化的交易系统恰好相反。

这个版本里有很多显著的功能:Fact生成器、维度(Dimension)和立体(Cube);多维支持;集合(Aggregate)的自动生成和其他特性,未来还会包括更多。

要从多个数据源将数据提取到数据仓库,ActiveWarehouse需要和ActiveWarehouse转换和加载(ETL)组件配合使用:

ETL可以处理大部分在整合现有系统(如delimited、fixed-width、XML和数据库源等)时要用到的基本数据源类型。通过定制的解析器它还可以被扩展。另外它还有足够多可用的转换,增加新的也很容易。这一系统具有良好的可扩展性。

现有的一些其他功能也很吸引人,如虚拟源字段;对预/后处理代码的支持;ETL领域特定语言(DSL)控制文件等。但目前批量载入只对MySQL可用。Anthony在性能问题上仍在努力,这对数据库领域而言是至关重要的。

你可以通过一个全面的概览来了解ActiveWarehouse和ETL组件的功能。

你可能感兴趣的:(企业级Ruby开发曙光:开源ActiveWarehouse插件发布)