当一个大型应用试图在一个单一的数据库表增加TB的数据时,性能经常会下降,对所有数据编索引对数据的读写都会很耗时,显然,如果我们根据某种策略将单一的表数据存储到不同的数据库表中,将会大大提高性能,切分将是一个令人振奋的可选方法。
切分分为纵向切分和横向切分,纵向切分就是将数据库表为单元进行切分,不同的数据存储到不同的数据库中,例如:有数据库表A,B,其中A存储在数据库A中,B存储在数据库中。
横向切分,将同一个表的数据进行切分,表中的数据分别存储到不同的数据库中,例如:同一个数据库表,亚洲的数据存储在数据库A中,其它洲的存储在数据库B中。
hibernate Shards 就是一个让应用横向切分的分布式数据库解决方案,它可以让一个 Hibernate应用很简单的加入横向切分功能,以下是我在通过参考一些文摘后应用JAVA写的一个测试例子,本例子就以存储 天气预报 信息来进行,我们将要做的是将天气预报信息按洲的方式存储到对应的数据库,来达到性能的提升。
在继续本例程开始之前你需要下载:
Hibernate3.2 应用开发包:http://sourceforge.net/projects/hibernate/files/hibernate3/
Hibernate3.0 Shards 应用开发包:http://sourceforge.net/projects/hibernate/files/hibernate-shards/
Spring2.5 应用开发包:http://www.springsource.org/download
开发包准备好后我们按以下过程来开始Hibernate Shards 旅程:
1、创建数据库与数据库表:
在本示例我将使用SQL SERVER 200 来做测试
create database ASIA --亚洲相关信息数据库 create database AFRICA --非洲相关信息数据库 GO --在ASIA与AFRICA 数据库中分别创建天气预报数据表 --创建天气序报数据表 IF EXISTS(SELECT 1 FROM SYSOBJECTS WHERE NAME='WEATHER_REPORT') DROP TABLE WEATHER_REPORT GO CREATE TABLE WEATHER_REPORT ( REPORT_ID VARCHAR(50) PRIMARY KEY DEFAULT 0 NOT NULL, --预报ID CONTINENT varchar(20) not null, --所属的洲 LATITUDE FLOAT, --纬度 LONGITUDE FLOAT, --经度 TEMPERATURE INT, --温度 REPORT_TIME datetime --预报日期 )
2、创建工程
为了更切实意,我使用MYECLIPSE创建一个名为:hibernateShards JAVA 工程并将下载的相关应用包添加引用,开发可根据自身使用的工具选择
2.1、创建hibernate 相关切分配置文件shard0.hibernate.cfg.xml 和 shard1.hibernate.cfg.xml
shard0.hibernate.cfg.xml:
<!-- 切分的 hibernate 配置文件,每个数据库都应有这样一个描述文件 --> <hibernate-configuration> <session-factory name="HibernateSessionFactory0"> <property name="dialect">org.hibernate.dialect.SQLServerDialect</property> <property name="connection.driver_class">com.microsoft.jdbc.sqlserver.SQLServerDriver</property> <property name="connection.url">jdbc:microsoft:sqlserver://localhost:1433;DatabaseName=ASIA</property> <property name="connection.username">sa</property> <property name="connection.password">sa</property> <!-- 切分 ID,需保持一致 --> <property name="hibernate.connection.shard_id">0</property> <!-- 对跨切分关系是否进行检查,在生产环境尽量设为 false,因为检查会非常花时间 --> <property name="hibernate.shard.enable_cross_shard_relationship_checks">true</property> </session-factory> </hibernate-configuration>
shard1.hibernate.cfg.xml:
<hibernate-configuration> <session-factory name="HibernateSessionFactory0"> <property name="dialect">org.hibernate.dialect.SQLServerDialect</property> <property name="connection.driver_class">com.microsoft.jdbc.sqlserver.SQLServerDriver</property> <property name="connection.url">jdbc:microsoft:sqlserver://localhost:1433;DatabaseName=AFRICA</property> <property name="connection.username">sa</property> <property name="connection.password">sa</property> <!-- 切分 ID,需保持一致 --> <property name="hibernate.connection.shard_id">1</property> <!-- 对跨切分关系是否进行检查,在生产环境尽量设为 false,因为检查会非常花时间 --> <property name="hibernate.shard.enable_cross_shard_relationship_checks">true</property> </session-factory> </hibernate-configuration>
我们看到以上二个文件内容非常类似,唯一不同的是数据库名和切分ID不同
2.2、建立相关hibernate对象关系映射文件和相关持久对象
weather.hbm.xml
<hibernate-mapping package="com.hibernateshards.po"> <class name="WeatherReport" table="weather_report" dynamic-update="true" dynamic-insert="true"> <id name="reportId" column="REPORT_ID" unsaved-value="-1"> <!-- 在这里使用 UUID 来生成主键,以防止ID在插入不同的数据库中ID值重复 --> <generator class="org.hibernate.shards.id.ShardedUUIDGenerator"></generator> </id> <property name="continent" column="CONTINENT" type="string"></property> <property name="latitude" column="LATITUDE" type="float"></property> <property name="longitude" column="LONGITUDE" type="float"></property> <property name="tempErature" column="TEMPERATURE" type="int"></property> <property name="reportTime" column="REPORT_TIME" type="date"></property> </class> </hibernate-mapping>
持久对象:WeatherReport.java
/** * 天气预报相关信息对象 * * @date 2010-10-23下午06:38:21 * * @author ChenTao */ public class WeatherReport { private BigInteger reportId; private String continent; private Float latitude; private Float longitude; private Integer tempErature; private Date reportTime; // getter 和 setter 方法略..... }
2.3、定义切分选策略和创建SessionFactory 对象
WeatherShardSelectionStrategy.java
/** * * 切分选择策略,根据自已定义 * * @date 2010-10-23下午06:58:04 * * @author ChenTao */ public class WeatherShardSelectionStrategy implements ShardSelectionStrategy{ /** * 选择策略: * 如果持久化对象是一个 WeatherReport,那么其所在的洲被确定,因此选择了一个切分。在这种情况下, * 有两个切分:0 和 1,其中切分 0 中包含 亚洲 相关天气预报,切分 1 中包含除亚洲之外所有的洲天气预报。 * 当然在这里可以将每个洲都定义,但这里只做一个测试应用,只描述其操作流程 * */ public ShardId selectShardIdForNewObject(Object obj) { if(obj instanceof WeatherReport){ WeatherReport weatherReport = (WeatherReport) obj; return this.continentShardId(weatherReport.getContinent()); } throw new IllegalArgumentException(); } /** * 根据洲来获取切分 * * @param continent * @return */ private ShardId continentShardId(String continent){ if(Constants.CONTINENT_ASIA.equals(continent)){ return new ShardId(0); } else { return new ShardId(1); } } }
// 创建SessionFactory
ShardedSessionFactoryBuilder.java
public class ShardedSessionFactoryBuilder { private List<String> hibernateConfigurations; private List<String> resourceConfigurations; public void setHibernateConfigurations(List<String> hibernateConfigurations) { this.hibernateConfigurations = hibernateConfigurations; } public void setResourceConfigurations(List<String> resourceConfigurations) { this.resourceConfigurations = resourceConfigurations; } public SessionFactory createSessionFactory(){ Configuration propotypeConfig = this.getPrototypeConfig(this.hibernateConfigurations.get(0), this.resourceConfigurations); List<ShardConfiguration> shardConfigs = new ArrayList<ShardConfiguration>(); for(String hibernateConfig:this.hibernateConfigurations){ shardConfigs.add(this.buildShardConfig(hibernateConfig)); } ShardStrategyFactory shardStrategyFactory = buildShardStrategyFactory(); ShardedConfiguration shardedConfig = new ShardedConfiguration(propotypeConfig,shardConfigs,shardStrategyFactory); return shardedConfig.buildShardedSessionFactory(); } /** * 创建一个 Hibernate 配置 * * @param hibernateFile * hibernate 切分配置文件 * @param resourceFiles * 资源文件 * * @return */ public Configuration getPrototypeConfig(String hibernateFile,List<String> resourceFiles){ Configuration prototypeConfig = this.getConfiguration(hibernateFile); for(String res:resourceFiles){ prototypeConfig.addResource(res); } return prototypeConfig; } public Configuration getConfiguration(String hibernateFile){ return new Configuration().configure(hibernateFile); } private ShardStrategyFactory buildShardStrategyFactory(){ ShardStrategyFactory shardStrategyFactory = new ShardStrategyFactory(){ public ShardStrategy newShardStrategy(List<ShardId> shardIds){ ShardSelectionStrategy pss = new WeatherShardSelectionStrategy(); ShardResolutionStrategy prs = new AllShardsShardResolutionStrategy(shardIds); ShardAccessStrategy pas = new SequentialShardAccessStrategy(); return new ShardStrategyImpl(pss,prs,pas); } }; return shardStrategyFactory; } private ShardConfiguration buildShardConfig(String hibernateConfig){ return new ConfigurationToShardConfigurationAdapter(this.getConfiguration(hibernateConfig)); } }
2.4、定义数据访问接口和实现对象
接口定义
WeatherReportDao.java
/** * 天气预报数据操作相关接口定义 * * @date 2010-10-23下午06:38:50 * * @author ChenTao */ public interface WeatherReportDao { /** * 查询所有天气预报相关数据 * * @return * @throws HibernateException */ List<WeatherReport> findAll() throws HibernateException; /** * 根据天气预报ID进行查询 * * @param id java.lang.Integer * * @return * @throws HibernateException */ WeatherReport findById(Integer id) throws HibernateException; /** * 查据天气预报所在的洲进行查询 * * @param continent java.lang.String * * @return * @throws HibernateException */ List<WeatherReport> findByContinent(String continent) throws HibernateException; /** * 保存天气预报数据 * * @param weather com.hibernateshards.po.WeatherReport * * @throws HibernateException */ void save(WeatherReport weather) throws HibernateException; /** * 更改天气预报数据 * * @param weather com.hibernateshards.po.WeatherReport * * @throws HibernateException */ void update(WeatherReport weather) throws HibernateException; /** * 删除天气预报数据 * * @param weather com.hibernateshards.po.WeatherReport * * @throws HibernateException */ void delete(WeatherReport weather) throws HibernateException; }
真实的数据操作对象
WeatherReportDaoImpl.java
/** * 天气预报数据层交互对象,用于处理数据的查找与CURD操作 * * @date 2010-10-23下午06:28:25 * * @author ChenTao */ public class WeatherReportDaoImpl implements WeatherReportDao { private SessionFactory sessionFactory; public WeatherReportDaoImpl() { super(); } @SuppressWarnings("unchecked") public List<WeatherReport> findAll() throws HibernateException { return (List<WeatherReport>) getHibernateTemplate().execute( new HibernateCallback() { public Object doInHibernate(Session session) throws HibernateException { return session.createQuery("from WeatherReport w") .list(); } }); } @SuppressWarnings("unchecked") public List<WeatherReport> findByContinent(final String continent) throws HibernateException { return (List<WeatherReport>) getHibernateTemplate().execute( new HibernateCallback() { public Object doInHibernate(Session session) throws HibernateException { return session .createQuery( "from WeatherReport as weather where weather.continent=?") .setString(0, continent.trim()).list(); } }); } public WeatherReport findById(final Integer id) throws HibernateException { return (WeatherReport) getHibernateTemplate().execute( new HibernateCallback() { public Object doInHibernate(Session session) throws HibernateException { return session .createQuery( "from WeatherReport as weather where weather.reportId=?") .setInteger(0, id).uniqueResult(); } }); } public void save(final WeatherReport weather) throws HibernateException { this.getHibernateTemplate().save(weather); } public void update(final WeatherReport weather) throws HibernateException { this.getHibernateTemplate().saveOrUpdate(weather); } public void delete(final WeatherReport weather) throws HibernateException { this.getHibernateTemplate().delete(weather); } public void setSessionFactory(final SessionFactory sessionFactory) { this.sessionFactory = sessionFactory; } private HibernateTemplate getHibernateTemplate() { return new HibernateTemplate(sessionFactory); } }
2.5、配置Spring
因为前面我们以经下载了 spring 相关开发包,我将要使用spring来加载相关配置和托管相应Bean创建和SessionFactory对象的创建
weatherSpring-config.xml
<beans> <bean id="shardedSessionFactoryBuilder" class="com.hibernateshards.shardsupport.ShardedSessionFactoryBuilder"> <property name="hibernateConfigurations"> <list> <value>shard0.hibernate.cfg.xml</value> <value>shard1.hibernate.cfg.xml</value> </list> </property> <property name="resourceConfigurations"> <list> <value>com/hibernateshards/po/weather.hbm.xml</value> </list> </property> </bean> <!-- 连接域对象 --> <bean id="sessionFactory" factory-bean="shardedSessionFactoryBuilder" factory-method="createSessionFactory"></bean> <bean id="weatherReportDao" class="com.hibernateshards.domain.WeatherReportDaoImpl"> <property name="sessionFactory"> <ref bean="sessionFactory"/> </property> </bean> </beans>
2.6、测试
通过以上的流程下来所有需要实现的代码和配置都已完成,虽然写了这么多,也不知道是否真的可以实现跨数据进行数据库的CRUD操作,为了验证真实性,我写了一个测试对象进
行测试,包含对数据的CRUD 都通过测试,来看下面测试方法:
WeatherReportTest.java
/** * 对 Shards 进行测试 * * @date 2010-10-23下午06:37:56 * @author ChenTao */ public class WeatherReportTest { /** * Spring 的上下文, */ private static ApplicationContext ac; /** * 数据操作对象 */ private static WeatherReportDao weatherReportDao; public static void main(String[] args) { try { /* 加载 spring 配置 */ loadConfig(); weatherReportDao = (WeatherReportDao) getAc().getBean("weatherReportDao"); /* 亚洲,以下数据将会增加到 ASIA 数据库中 */ // save(Constants.CONTINENT_ASIA); /* 非洲,以下数据将会增加到 AFRICA 数据库中 */ // save(Constants.CONTINENT_AFRICA); /* 对数据进行修改 */ // update(); /* 对数据进行删除 */ // delete(); List<WeatherReport> weatherList = null; /* 查询所有天气预报数据,这将会扫描所有的数据库 */ weatherList = finaAll(); print(weatherList); // // 按洲查询,指定某个数据库查询,其体看配置 // weatherList = findByContinent(Constants.CONTINENT_ASIA); // print(weatherList); } catch (Exception e) { e.printStackTrace(); } } private static List<WeatherReport> finaAll() throws Exception { if (null != weatherReportDao) { return weatherReportDao.findAll(); } throw new Exception("No Data!"); } private static List<WeatherReport> findByContinent(String continent) throws Exception { if (null != weatherReportDao) { return weatherReportDao.findByContinent(continent); } throw new Exception("No Data!"); } private static void save(String continent) throws Exception { if (null != weatherReportDao) { WeatherReport weather = new WeatherReport(); weather.setContinent(continent); weather.setLatitude(30.20F); weather.setLongitude(60.10F); weather.setTempErature(28); weather.setReportTime(new java.sql.Date(new java.util.Date() .getTime())); weatherReportDao.save(weather); System.out.println("数据保存成功"); } } private static void update() throws Exception { WeatherReport weather = new WeatherReport(); weather.setReportId(BigInteger.valueOf((long)100)); weather.setContinent(Constants.CONTINENT_ASIA); weather.setLatitude(100.20F); weather.setLongitude(100.10F); weather.setTempErature(34); weather.setReportTime(new java.sql.Date(new java.util.Date() .getTime())); weatherReportDao.update(weather); System.out.println("数据修改成功"); } private static void delete() throws Exception { WeatherReport weather = new WeatherReport(); weather.setReportId(BigInteger.valueOf((long)100)); weather.setContinent(Constants.CONTINENT_ASIA); weather.setLatitude(50.20F); weather.setLongitude(60.10F); weather.setTempErature(28); weather.setReportTime(new java.sql.Date(new java.util.Date() .getTime())); weatherReportDao.delete(weather); System.out.println("数据删除成功"); } private static void loadConfig() throws Exception { loadConfig("weatherSpring-config.xml"); } private static void loadConfig(String configFile) throws Exception { ac = (new ClassPathXmlApplicationContext(configFile)); } public static ApplicationContext getAc() { return ac; } private static void print(List<WeatherReport> weatherList) { if (null != weatherList && weatherList.size() > 0) { for (WeatherReport w : weatherList) { System.out.println("预报ID:" + w.getReportId() + "=洲" + w.getContinent()); } } } }
通过以上测试我们发现,当 Continent 为 ASIA 数据插入到了 ASIA 数据库中,当Continent 为 AFRICA 数据插入到了AFRICA数据库中,同时我们在查询的时候可以查询所有的数
据,查询所有的数据在这里不建议使用,我在这里提供了findByContinent按洲查询,这样就只会读取相关洲的数据库,而避免了在读取相应洲的数据时排描所有洲的数据,增加了
应用程序的读写效率,这样对于一个大型应中,数据量大的应用是一个非常适用的一个选择。
但使用切分不足的时一定要确定应用程序的规模和数据增长量,对于一般中小型应用不建议使用横向切分,因为横向切分会带来应用的开发成本和资源成本,当应用需要改变会增加维护成本,并且需要设定应用的存储和检索的特定逻辑
需要有朋友可以下载本例程的实例代码,由于上传文件大小有限制,所以本人只上传了相应的源代码,相应的开发工具包需要读者自身下载并导入。本例程的代码本人都经过测试并成功运行,如有问题可加:63267818 群进行讨论
本例程参考文摘:
Hibernate Shards:http://docs.jboss.org/hibernate/shards/3.0/reference/en/html_single/
Hibernate Shards API Documentation
http://docs.jboss.org/hibernate/stable/shards/api/
http://www.cnblogs.com/RicCC/archive/2010/04/14/hibernate-shards-3-architecture.html