yushibing717

JAVA基于遗传算法的中药药对挖掘系统的设计与实现(源代码+论文)

目录

1 引言. 1

1.1 背景. 1

1.2 意义. 1

2 理论基础. 1

2.1 关联规则及存在的问题. 1

2.2 双向关联规则. 2

2.3 遗传算法简介. 4

3 需求分析及设计方案. 5

4 基于遗传算法的双向关联规则挖掘算法具体流程及实现. 7

4.1 位图矩阵实现. 7

4.2 编码. 9

4.3 适应度函数. 11

4.3.1 适应度函数设计. 11

4.3.2 适应度函数的实现. 11

4.4 规则的提取. 14

4.5 遗传操作. 15

4.6 算法流程. 18

5 测试. 18

结论. 21

参考文献. 22

致谢. 23

声明. 24

引言
1. 背景

我国作为最大的中药材资源国，有着传统中医药文明的发祥地的地位，但是如今正面临着诸多挑战。我国，在世界的中药市场上却未能占有基本的主导地位。反而日本、韩国等国家成功地利用现代数据挖掘科技把中药行业发展成现代产业，占据了国际市场相当的份额，因此，继承和发展中医药不仅是中医界也是全国其他科研院校和科研机构的重要课题。中药对数据挖掘就是利用药对数据库从大量的中药对中抽取隐含的、未知的、有意义的药物组配模式。中药对数据挖掘将为中医方剂理论研究和中医临床用药研究提供重要模式参考，也为方剂配伍理论研究，尤其是新药对、新药组发现研究提供新方法和现代技术手段。

1. 意义

关联规则是数据挖掘中的重要技术之一，它能反映在事务数据库中数据项之间同时出现的规律，并发现不同数据项之间的联系。关联规则通过量化的数字描述数据项A的出现对数据项B的出现产生的影响。例如在大型商场中牛奶的销售对面包的销售的影响，发现这样的规则不仅可以应用于商品货架设计、货存安排，而且可以根据购买模式对用户进行分类，制定相应商务决策、销售策略。

由于关联规则挖掘具有重要的现实意义，吸引了许多学者的研究，提出了众多的关联规则挖掘算法。目前，所有的关联规则挖掘算法都是基于支持度-置信度框架理论，具有较多的局限性。本文通过分析这些不足之处，引入双向关联规则的概念，实现了基于遗传算法的双向关联规则挖掘算法。

理论基础
1. 关联规则及存在的问题

关联规则是形如A=>B的蕴涵式，挖掘关联规则分为两步：第一步是识别所有的频繁项集，即支持度不小于用户指定的最小支持度的项集；第二步是从频繁项集中构造其置信度不低于用户给定最小置信度的规则，即强规则。这种基于支持度-置信度框架理论的关联规则挖掘方法存在如下问题：

（1）不能有效地发现低支持度高置信度的有趣规则

基于支持度-置信度框架理论的关联规则挖掘方法找到的强规则必须同时满足最小支持度阈值和最小置信度阈值，但有时人们感兴趣的规则往往是低支持度高置信度的[8]。例如，超市中两物品A和B，它们的销售量虽然很低，但经常是同时被顾客购买，管理人员希望将这种低支持度高置信度的规则找出来。

（2）不能确定“相互依赖”的规则

关联规则反映A、B同时出现的概率和A出现的条件下B出现的条件概率。这样的规则只能确定A对B的“依赖”，不能同时确定B对A的“依赖”，但很多时候人们感兴趣的是“相互依赖”的规则。例如，中药的药组药对中，药之间必须是“相互依赖”的，如果药物A和B是药对，则必须是A通常与B配伍，同时B也是通常与A配伍。如果只是A通常与B配伍，但B并不常与A配伍，则A和B不是药对，因为B通常是只起辅助药性作用的药，这类药常在各种方剂中出现。用基于支持度-置信度框架理论的关联规则挖掘方法不能找出上述中药药组药对。

（3）找到的强规则并不一定是有趣的，甚至是错误的

假定对分析涉及的家用电脑和VCD播放机的事务感兴趣。在所分析的10000个事务中，6000个事务包含家用电脑，7500个事务包含VCD播放机，4000个事务同时包含家用电脑和VCD播放机。运行传统的关联规则挖掘程序，最小支持度30%，最小置信度60%，将发现下面的关联规则：

buys(X,“computer”) buys(X,“vcd-player”)

[support=40%,confidence=66%]

该规则是强关联规则。可事实上，电脑和VCD播放机是负相关的，买其中之一实际上减少了买另一种的可能性，因为购买VCD播放机的可能性是75%，大于66%。

1. 双向关联规则

定义1（双向关联规则）：设I={i1,i2,…,im}是项的集合，任务相关的数据D是数据库事务的集合，其中每个事务T是项的集合，使得T

I。每个事务有一个标示符，称作TID。设A是一个项集，事务T包含A当且仅当 A

T。如果A

I，B

I，并且A∩B=Æ，则形如AóB的表达式称为双向关联规则。

显然双向关联规则是同时满足A=>B和B=>A的规则。反过来也可以说同时满足A=>B和B=>A的规则是双向关联规则。所有双向关联规则Aó B有两个置信度。一个是关联规则A=>B的置信度：

conf(A=>B) = P(B|A) = P(AB) / P(A)

另一个是关联规则B=>A的置信度：

conf(A=>B) = P(A|B) = P(AB) / P(B)

置信度conf(A=>B)表示A出现的条件下B出现的条件概率，也就是A和B同时出现的概率与A出现的概率的比值。它反映了A对B的依赖程度。它的值越大，则A对B的依赖越强；反之，值越小，则A对B的依赖越弱。如果值为1，则意味着A的每一次出现都伴随着B的出现（反过来则不一定），A对B是100%的依赖。

置信度conf(B=>A)表示B出现的条件下A出现的条件概率，也就是B和A同时出现的概率与B出现的概率的比值。它反映了B对A的依赖程度。它的值越大，则B对A的依赖越强；反之，值越小，则B对A的依赖越弱。如果值为1，则意味着B的每一次出现都伴随着A的出现（反过来则不一定），B对A是100%的依赖。

双向关联规则A óB的这两个置信度共同反映了A和B的相互依赖程度。我们很多时候对相互依赖程度高的规则——即下面定义的强双向规则感兴趣。

定义2（强双向规则）：规则A=>B和B=>A同时满足最小置信度阈值（min_conf）的双向规则称作强双向规则。

下面把上述概念推广到多个项集之间的情况。

定义3（n个项集的双向关联规则）：设CiÌI(2

(2C2C3…Cn、C2=>C1C3…Cn、…、Ci=>C1C2…Ci-1Ci+1…Cn、…、Cn=>C1C2…Cn-1的规则，此时C1=>C2C3…Cn、C2=>C1C3…Cn、…、Ci=>C1C2…Ci-1Ci+1…Cn、…、Cn=>C1C2…Cn-1的置信度分别为：

Conf(C1=>C2C3…Cn) = P(C2C3…Cn|C1) = P(C1C2…Cn) / P(C1)

Conf(C2=>C1C3…Cn) = P(C1C3…Cn|C2) = P(C1C2…Cn) / P(C2)

……

Conf(Cn=>C1C3…C(n-1)) = P(C1C2…C(n-1)|Cn) = P(C1C2…Cn) / P(Cn)

如果C1=>C2C3…Cn、C2=>C1C3…Cn、…、Ci=>C1C2…Ci-1Ci+1…Cn、…、Cn=>C1C2…Cn-1同时满足最小置信度阈值（min_conf），则项集C1、C2、…、Cn的双向关联规则是强双向规则。

项的集合称为项集(itemset)，包含k个项的项集称为k-项集。我们把上述概念用于k-项集，可得到如下定义：

定义4（项的置信度）：设Tk={I1,I2,…,Ik}是一个k-项集，Ii（1≤I≤k）是Tk的一项，则k-项集Tk的项Ii的置信度conf(Ii,Tk)为事务数据库D中包含{Ii}的事务同时包含{I1,I2,…,I(i-1),I(i+1),…,Ik}的百分比，即：

Conf(Ii,Tk) = P({I1,I2, …,I(i-1),I(i+1), ,Ik}|{Ii})=P({I1,I2, …,Ii, …,Ik})/P({Ii})

定义5（k-项集强双向规则）：设Tk={I1,I2,…,Ik}是事务数据库D中一个k-项集，如果Tk的任一项的置信度都满足最小置信度阈值(min_conf)，则称k-项集Tk为符合强双向规则的k-项集，简称k-项集强双向规则。

1. 遗传算法简介

遗传算法（Genetic Algorithm, GA）是近几年发展起来的一种崭新的全局优化算法。1962年霍兰德(Holland)教授首次提出了GA算法的思想，它借用了仿真生物遗传学和自然选择机理，通过自然选择、遗传、变异等作用机制，实现各个个体的适应性的提高。从某种程度上说遗传算法是对生物进化过程进行的数学方式仿真。

这一点体现了自然界中"物竞天择、适者生存"进化过程。与自然界相似，遗传算法对求解问题的本身一无所知，它所需要的仅是对算法所产生的每个染色体进行评价,把问题的解表示成染色体，并基于适应值来选择染色体，使适应性好的染色体有更多的繁殖机会。在算法中也即是以二进制编码的串。并且，在执行遗传算法之前，给出一群染色体，也即是假设解。然后，把这些假设解置于问题的“环境”中，也即一个适应度函数中来评价。并按适者生存的原则，从中选择出较适应环境的染色体进行复制, 淘汰低适应度的个体，再通过交叉，变异过程产生更适应环境的新一代染色体群。对这个新种群进行下一轮进化，至到最适合环境的值。

由于遗传算法是由进化论和遗传学机理而产生的搜索算法，所以在这个算法中会用到很多生物遗传学知识，下面是将会用到的一些术语说明：

一、染色体(Chromosome)

染色体又可以叫做基因型个体(individuals),一定数量的个体组成了群体(population),群体中个体的数量叫做群体大小。

二、基因(Gene)

基因是串中的元素，基因用于表示个体的特征。例如有一个串S＝1011，则其中的1，0，1，1这4个元素分别称为基因。

三、适应度(Fitness)

各个个体对环境的适应程度叫做适应度(fitness)。为了体现染色体的适应能力，引入了对问题中的每一个染色体都能进行度量的函数，叫适应度函数. 这个函数是计算个体在群体中被使用的概率。

四、种群（population）

染色体带有特征的个体的集合称为种群。该集合个体数称为种群个体的大小。

需求分析及设计方案

由于事务数据库一般只具有对大量数据的存取、检索功能，对于用户的一般性的使用可以满足，然而，正是由于数据库中存放了大量的数据，不同的数据项，以及多个数据项之间还存在有大量的隐含的、未知的、有意义的数据关系，这些关系对于用户有着及其重要的作用，所以数据挖掘便在此情况下产生了。

遗传算法是数据挖掘技术中的一个重要算法。这是由于它具有快捷、简便、鲁棒性强、适于并行处理以及高效、实用等显著特点，在各类结构对象的优化过程中显示出明显的优势。它的思想源于生物遗传学和适者生存的自然规律，是具有“生存＋检测”的迭代过程的搜索算法。遗传算法以一种群体中的所有个体为对象，并利用随机化技术指导对一个被编码的参数空间进行高效搜索。其中，选择、交叉和变异构成了遗传算法的遗传操作；初始种群编码、初始群体个数的设定、适应度函数的设计、遗传操作设计、控制参数设定五个要素组成了遗传算法的核心内容。

与传统的搜索方法相比，遗传算法具有如下特点：

（1）搜索过程不直接作用在变量上，而是在参数集进行了编码的个体。此编码操作，使得遗传算法可直接对结构对象（集合、序列、矩阵、树、图、链和表）进行操作。

（2）搜索过程是从一组解迭代到另一组解，采用同时处理群体中多个个体的方法，降低了陷入局部最优解的可能性，并易于并行化。

（3）采用概率的变迁规则来指导搜索方向，而不采用确定性搜索规则。对搜索空间没有任何特殊要求，只利用适应性信息，不需要导数等其它辅助信息，适应范围更广。

中国自古以来就有着传统中医药文明的发祥地的地位,中药是我国特有的资源，但是中国本土中医学长期以来的发展并不是很大，在国际医学界就更不具有很强的地位。多年的时间过去了，中药方剂的更新和发展并没有很大的变化，很多都还建立在很久以前就有的方剂基础之上，没有出现比较多的较新的方剂，应用遗传算法的数据挖掘系统在此情况下可以发挥着及其重要的作用。通过数据系统能够在药对数据库的大量数据中，找到很多隐含的、未知的、并很有应用价值的药对药组以及很多的有意义的药物组配的规则和模式。中药对数据挖掘还将为中医方剂理论研究和中医临床用药研究提供重要模式参考，也为方剂配伍理论研究，尤其是新药对、新药组发现研究提供新方法和现代技术手段。

在系统进行数据挖掘过程中，为了减少对事务数据库的扫描、提高挖掘效率，本文先把事务数据库转化成位图矩阵，然后再在此位图矩阵上挖掘有趣的强双向关联规则。下面是对位图矩阵模型的描述。

用Ik(k为自然数)表示事务数据库中的一项，I1、I2、…、Ik、…、In表示事务数据库中的所有项。用Tj(i1,i2,…,ik,…,in)表示事务数据库中的一个事务，ik对应Ik，占用1位(bit),当事务Tj含有Ik这项时，Tj的ik位为1,否则为0，所以事务Tj可以用位图i1i2…ik…in来表示。T1、T2、…、Tj、…、Tm表示事务数据库中所有的事务，T1、T2、…、Tj、…、Tm都可以用位图i1i2…ik…in来表示，这样所有这些位图就构成了事务数据库的位图矩阵。

I1 I2 I3 I4 I5

图1 一个位图矩阵的例子

1	1	0	1	0
0	1	0	0	1
1	0	1	1	0
1	1	1	0	1
1	0	1	0	0
1	1	0	0	1
0	1	0	1	0

图1就是一个位图矩阵。该位图矩阵对应的事务数据库含I1、I2、I3、I4、I5共5个项，含T1、T2、T3、T4、T5、T6、T7共7个事务。事务T1的位图为11010，所以含I1、I2、I4三个项；事务T2的位图为01001，所以含I2、I5两个项；事务T3的位图为10110，所以含I1、I3、I4三个项；事务T4的位图为11101，所以含I1、I2、I3、I5四个项；事务T5的位图为10100，所以含I1、I3两个项；事务T6的位图为11001，所以含I1、I2、I5三个项；事务T7的位图为01010，所以含I2、I4两个项。

得到事务数据库的位图矩阵后，就很容易求出某双向关联规则的支持度计数。例如，要求出图1所对应事务数据库中I2和I4同时出现的次数。先设计只包含I2、I4两个项的事物T，其位图为01010。判断由I2和I4构成的规则是否出现在事务Tk中，只需判断T的位图与Tk的位图按位相与操作后得到的新位图是否与T的位图相同。如果相同，则说明事物Tk包含由I2和I4构成的规则；反之则不是。通过用T的位图与事务数据库中每一事务的位图进行上述操作，可以求出由I2和I4构成的规则的支持度计数。这种方法是高效的，理由有两点：一是事务数据库的位图矩阵相对于事务数据库本身在尺寸上大大减小了；二是按位相与运算速度很快。

基于遗传算法的双向关联规则挖掘算法具体流程及实现
1. 位图矩阵实现

本设计使用的后台数据库为SQL2000，用到的数据表为药物表和方剂表。位图矩阵的建立是在查询数据库中数据的基础上产生的。

在查询数据库得到的位图矩阵中，行表示方剂，列表示此数据库中的药物，矩阵中的数据项由1和0表示，假如R[i，j] = 1（R表示位图矩阵，i表示横坐标，j表示纵坐标）,表示第i个方剂中含有第j位对应的药物。建立位图矩阵的步骤如小：

（1）使用sql查询语句，通过查询方编号得到方剂表中的方剂的总数量，以此得到位图矩阵的行，也就相当于上一小节提到的事务Tk。

String queryId = "select 方编号 from 方剂表";

Class.forName("com.microsoft.jdbc.sqlserver.SQLServerDriver");

//通过 JDBC建立数据库连接

Connection dbConn = DriverManager.getConnection(dbURL, userName, userPwd);

//连接到数据库，提供相应的用户名、密码

Statement stmt = dbConn.createStatement(ResultSet.TYPE_SCROLL_SENSITIVE, ResultSet.CONCUR_UPDATABLE);

//用dbConn连接创建SQL语句对象

ResultSet rsId = stmt.executeQuery(queryId);

while(rsId.next()){

drugId[i++] = rsId.getString(1); //把方编号存入数组

}

经过以上语句，此时得到了位图矩阵所需要的行的信息，即方编号，并把此数据存放到名字为drugId的数组中，数组中存放的数据的个数即为方剂的数量，也就是以后用到的位图矩阵的行数。

（2）接下来需要得到位图矩阵的列数和列所对应的药物的名称。

String drugName[]= new String[405];

定义存放药名的数组。

String queryName = "select 药名 from 药物表";

定义查询药物表中药名的sql语句。

ResultSet rsName = stmt.executeQuery(queryName);

定义存放查询得到的结果集的变量。

int p ＝ 0；

while(rsName.next()){

if(p==0){

drugName[i++] = rsName.getString(1);

}

此句判断如果数组中没有数，则直接放入该数。

else{

int j;

for(j=0;j

if(drugName[j].equals(rsName.getString(1)))

break;

}

此循环语句用于判断drugName数组中是否存有与当前药名相同的数据，如果有就直接跳出循环，否则一直执行到所存放的数据处。

f(j==i){

drugName[i++] = rsName.getString(1);

}

如果没有重复数据，则把当前药名存入数组中。

}

p++;

}

由以上语句得到了位图矩阵的列的信息，列的每一位表示一味药，并且药名存放在drugName数组中，此数组中数据的个数即为位图矩阵列的个数。

（3）在行信息和列信息都产生好之后，第三步是产生矩阵的数据，把个矩阵构造完成。

for(i=0;i<1060;i++){

外层for循环控制位图矩阵的行，根据每行为一个方剂，做为一个整体确定每行中的数据项的值。

String queryName1 = "select 药名 from 药物表 where 方编号="+drugId[i];

申明sql语句，用于指定的方编号，查询得到对应方剂中所存放的药物。

ResultSet rsName1 = stmt.executeQuery(queryName1);

申明rsName1结果集对象，每次查询所得到的值都存放在其中，方便以后的数据取用。

while(rsName1.next()){

temp[l++] = rsName1.getString(1);

}

把每次查找出的药名存放在临时数组'temp'中，用于矩阵数据的确定。

int k;

for(k=0;k

外层for循环用于控制数组temp的下标。

for(j=0;j<405;j++){

内层for循环用于控制数组drugName的下标。

if(temp[k].equals(drugName[j])){

matrix[i][j] = '1';

}

else if(matrix[i][j]=='1'&&!(temp[k].equals(drugName[j]))){

}

else {

matrix[i][j] = '0';

}

判断当temp数组和drugName数组的值相等时，对应的位图矩阵的值为字符1，当当前位图矩阵的值为字符1，但是数组temp与drugName数组的不等时，不作任何动作，当以上条件都不满足时，位图矩阵对应位置的值为字符0。

}

经过以上的程序段，就构造出了一个由0和1作为其每项值的矩阵，此矩阵就是所要构建的位图矩阵。位图矩阵的构造完成，为以后的运算带来了不用反复查询事务数据库的繁琐，提高了算法的效率，增加了运算的速度。

1. 编码

用遗传算法进行双向关联规则挖掘，编码是要解决的首要问题。编码方法不仅决定了个体排列形式，而且决定了个体从搜索空间的基因型变换到解空间的表现型时的解码方法。编码方法还影响到交叉、变异等遗传操作。由于前面我们已经用位图矩阵来描述事务数据库，对双向关联规则的挖掘可以直接在位图矩阵上进行。因此本文理所当然采用二进制编码，编码串的长度为事务数据库中项的个数。由前面产生的位图矩阵可以知道，编码串的长度为405。

产生初始种群的代码如下：

for(i=0;i<50;i++){

int t = (int)(Math. random()*28);

//随机产生每行字符数组(个体染色体)中'1'的个数.

while(true){ //如果是0就重新生成.

if(t==0){

t = (int)(Math.random()*28);

}

else

break;

}

int tempLoc[] = new int[t];

//int数组装随机产生的数的下标数(即产生'1'的位置).

for(j=0;j<405;j++){

radomDrug[i][j] = '0';

}

for(j=0;j

int loc;

if(j==0){

loc = (int)(Math.random()*405);

tempLoc[j] = loc;

radomDrug[i][loc] = '1';

}

else{

loc = (int)(Math.random()*405);

for(p=0;p

if(loc==tempLoc[p]){

loc = (int)(Math.random()*405);

p = 0;

}

if(p==j){

tempLoc[j] = loc;

radomDrug[i][loc] = '1';

}

} //产生随机数完毕。

产生初始种群，也就是生成随机数的过程。首先用一个整形变量t存放每次随机产生的1 的个数，因为，通过查询药物数据库中方剂表可以得知，整个方剂表中，所有方剂中的药物最多不超过27味，所以，需要用一个变量控制每次随机产生的个体（随机数）中1的个数。在t产生之后，紧接着就是产生每个个体中1的位置，在此处，代码中所体现的就是用用一个整形数组tempLoc存放，而数组中所存数据的个数则是上一步随机产生的变量t的值来控制，并且在产生除第一个位置的时候，每产生一个位置后都首先与之前tempLoc数组中的数判断，如果当前产生的数与tempLoc数组中的数相同，则要求重新随机产生，直到没有重复为止。位置得到以后，所要做的就是对应位置上项的值给赋值为1，其余的赋值为0，这样经过几层循环的运算后就得到了所要进行遗传算法运算的初始种群了。

1. 适应度函数

4.3.1 适应度函数设计

遗传算法中使用适应度来度量种群中各个体在优化计算中可能达到或有助于找到最优解的优良程度，适应度较高的个体遗传到下一代的概率就较大。适应度函数直接影响问题求解的效率。

本文挖掘的双向关联规则，要求规则中任一项的置信度都必须满足最小置信度阈值(min_conf)。例如， C1、C2、…、Cn的双向关联规则须同时满足：

P(C1C2…Cn) / P(C1) ≥ min_conf

P(C1C2…Cn) / P(C2) ≥ min_conf

……

P(C1C2…Cn) / P(Cn) ≥ min_conf

……

显然只需满足：

P(C1C2…Cn) / max(P(C1),P(C2),…,P(Cn)) ≥ min_conf

即可。max(P(C1), P(C2),…,P(Cn))表示P(C1), P(C2),…,P(Cn)之中的最大值。

于是，将适应度函数设计为：

F(rc1c2…cn) = count(C1C2....Cn) / max(count(C1), count(C2) ,…count(Cn))

其中， rc1c2…cn为C1、C2、…,Cn构成的双向关联规则，count(C1C2....Cn)为C1C2....Cn 的支持度计数，count(C1)、count(C2) 、…、count(Cn) 分别为C1、C2、…、Cn的支持度计数， max(count(C1), count(C2) ,…count(Cn))表示count(C1),、count(C2), 、…、count(Cn), 中的最大值。

4.3.2 适应度函数的实现

由以上的表达式可以得出，要计算种群中个体的适应度首先要计算出

count（C1C2…Cn）和max(count(C1), count(C2) ,…count(Cn))，它们两个作为计算适应度函数的分子与分母。它们两个表达式对应于位图矩阵和种群的关系是以下关系：

count（C1C2…Cn）的计算是通过把每个随机数（种群个体）与位图矩阵中的每个方剂对应的数（每项个值所组成的数）进行与操作，计算其结果等于随机数自身的次数。

count(Ci)是对在位图矩阵的第i列中所有1的累加，即计算在位图矩阵的第i列中为1的次数。max(count(C1), count(C2) ,…count(Cn))则是表示所有累加值中的最大数。

由于在本设计中，使用的编程语言为java语言，为了方便随机个体与位图矩阵中的每项的值进行比较，采用了位图矩阵以及得到的种群都是由0、1字符组成的方式，并不是有真正的二进制数表示。因此，在进行上面提到的个体与位图矩阵的每行的与操作时，是一项一项的比较，并不是真正意义上的与操作。在设计中进行与操作的方式是，判断个体中含有‘1’的位置在位图矩阵的每行对应位置是否也会为‘1’，如果判断为真就相当于进行的与操作等于它本身，则count需要加1，如果某一位置上的‘1’在位图矩阵中的对应位置为‘0’，则相当于进行的与操作不等于它本身，从而count不需要加1。

因此，第一，对位图矩阵中的所有值为‘1’的位置进行记录，此处是用的向量组进行记录，每个向量记录每行中的为‘1’的位置。外循环控制行数，在每次外循环时就给向量分配内存空间，内循环控制每行中的下标的移动，随着下标的移动，查询到值为 ‘1’的下标，并记录到向量中。

Vector Mloc[] = new Vector[1060];

for(i=0;i<1060;i++){

Mloc[i] = new Vector();

for(j=0;j<405;j++){

if(matrix[i][j]=='1'){

Mloc[i].add(j);

}

第二，把产生的种群中的所有值为‘1’的位置进行记录，在此处同样是通过向量组进行的记录，每个向量记录每个种群个体中的‘1’的位置。

Vector Rloc[] = new Vector[50];

for(i=0;i<50;i++){

Rloc[i] = new Vector();

for(j=0;j<405;j++){

if(radomDrug[i][j]=='1'){

Rloc[i].add(j);

}

第三，根据位图矩阵和初始种群中‘1’的位置得到的两个向量数组Mloc和Rloc，每次把Rloc数组中的一向量与数组Mloc中的所有向量比较，每次都比较两个向量中所存放的‘1’的位置，如果Rloc中的向量所存放的数在Mloc中的向量都有相同的数存在，即种群个体与位图矩阵每行所组成的数进行与操作的值等于种群个体自身，则使用数组count记录下每次与操作都等于其自身的次数。

for(i=0;i<50;i++){

flag = false; count[i] = 0;

for(p=0;p<1060;p++){

for(j=0;j

if(Mloc[p].contains(Rloc[i].get(j))){

flag = true;

}

else{

flag = false;

}

if(flag){

count[i]++;

}

经过此段代码的运算，数组count存放了每个初始种群个体与位图矩阵进行与操作等于其自身的次数，即得到了计算适应度函数的分子的值。

第四，计算适应度的分母，即计算出每个初始种群个体中为‘1’的位置在位图矩阵对应列中出现的次数，然后通过max函数计算出刚计算出的次数中的最大值，最后存放计算出的每个最大值在数组中，用于适应度的计算。

for(i=0;i<50;i++){

int countR[] = new int[405];

//countR存放随机数中每行中的为1的数所对应位图矩阵中此列的1个个数。

int k=0;

for(j=0;j<405;j++){

if(radomDrug[i][j]=='1'){

countR[k++] = countD[j];

}

int max = 0;

for(int tt=0;tt

//找到每行中为1的数在位图矩阵中对应列出现的个数的最大值。

if(max

max = countR[tt];

}

countMax[i] = max;

}

第五，把上面计算得到的分子分母值进行计算，得到每个初始种群个体的适应度。

float fit[] = new float[50]; //计算选择概率放在fit数组中.

int fitD[] = new int[50]; //计算适应度,并保存在fitD数组中.

for(i=0;i<50;i++){

fit[i] = ((float)count[i])/((float)countMax[i]);

fitD[i] = (int)(fit[i]*100);

System.out.print(fit[i]+"_ "+fitD[i]+". ");

} //计算出随机数的置信度。

1. 规则的提取

由于挖掘的双向关联规则只要满足最小置信度阈值就是需要的规则，因此在每一代种群计算适应度后，将其中适应度大于或等于min_conf,则把该个体放入规则库中。放入时判断规则库中是否已存在该个体，如果存在，则不放入，在设计中，min_conf是通过输入框输入的到，并把值存放到变量getV中。

for(i=0;i<50;i++){

if(fitD[i]>=getV){

if(z==0){

for(j=0;j<405;j++){

rule[h][j] = radomDrug[i][j];

}

rfitD[h] = fit[i];

h++;

}

else{

int k;

for(k=0;k<50;k++){

for(j=0;j

if(gener[k].equals(ruleStr[j])==false){

continue;

}

else{

break;

}

if(j==h){

for(j=0;j<405;j++){

rule[h][j] = radomDrug[i][j];

}

rfitD[h] = fit[i];

h++;

}

1. 遗传操作

遗传操作主要包括选择、交叉和变异。

（1）选择（selection）

本文的选择操作采用轮盘赌选择法，将个体的适应度与种群的总适应度（种群所有个体的适应度之和）相比，得到该个体的相对适应度，所有个体的相对适应度之和为1。使用个体的相对适应度来作为其在选择操作中被选中的概率，每一轮选择产生一个[0,1]均匀随机数，将该随机数作为选择指针来确定被选个体，适应度大的个体被选中的概率大，参与复制、交叉生成新一代种群的机会就大，反映了自然界生物进化“物竞天择，适者生存”的自然法则。

在本设计中，轮盘赌选择法的实现方式是，首先计算出总的适应度的和sum，然后随机产生1到sum之间的数，根据产生的随机数得到对应的种群个体，此方式正是模拟了遗传的特点，适应度大的被选中的几率就大，反之被选中的几率就小。下面此循环就是计算适应度的总和。

for(i=0;i<50;i++){

sum += fitD[i];

}

以下代码则是轮盘赌算法的实现：

for(i=0;i<50;i++){ //根据随机选择个体.

n = ((int)(Math.random()*val))+1;

sum = 0; j = 0; m = 0;

while(true){

sum += fitD[j];

if(sum>=n){

break;

}

else

m++; j++;

}

gener[i] = Ch[m];

}

最后，把根据轮盘赌算法选中的种群个体存放到gener数组中。

（2）交叉（crossover）

实际应用的事务数据库中项的个数往往比较大，即编码串比较长。为了促进解空间的搜索，防止过早地收敛，本文交叉操作的交叉点数由确定，其中的n为遗传算法的一个输入参数，在运行时设置，可以设置为10、20等。交叉位随机产生。例如，图1所对应的事务数据库，如果n设置成10，则为单点交叉，对于父代个体1“11010”和父代个体2“01001”，若随机产生的交叉点是3，则交叉后产生的子代个体1和子代个体2分别为“11001”、“01010”。

染色体的交叉的实现代码如下：

while(i

m = (int)(Math.random()*50);

//选择进行交换的两个体的下标m,n.

int ra = (int)(Math.random()*50);

n = (m+ra)%50;

p = (int)(Math.random()*405);

//p值为染色体交换位.

CharSequence rt1 = gener[m].subSequence(p,gener[m].length());

//第p位后的染色体交换.

CharSequence rt2 = gener[n].subSequence(p,gener[n].length());

gener[m] = gener[m].replace(gener[m].subSequence(p,gener[m].length()),rt2);

gener[n] = gener[n].replace(gener[n].subSequence(p,gener[n].length()),rt1);

i++;

}

（3）变异（mutation）

因为初始种群的产生是随机的，所以事务数据库中所有的项并不一定都出现在初始种群中，这会造成部分规则的遗漏以及过早收敛。因此本文进行变异操作时，先以一概率随机选择个体，选中后，随机产生变异位，对变异位作翻转操作。

变异的实现，在本设计中是通过随机产生需要进行变异的种群个体和选中个体中需要变异的的染色体位置，然后把此位置对应的值进行翻转，把‘1’变成‘0’，或者把值为‘0’的变成‘1’。

for(j=0;j

p = (int)(Math.random()*405); //个体中染色体变异.

for(k=0;k<10;k++){

p1[k] = (((int)(Math.random()*405))+p)%405;

}

int p2 = (int)(Math.random()*50); //产生变异的个体的位置.

char bianyi[] = gener[p2].toCharArray();

for(k=0;k<10;k++){

if(bianyi[p1[k]]=='1'){

bianyi[p1[k]] = '0';

}

else{

bianyi[p1[k]] = '1';

}

for(k=0;k<405;k++){ //变异后再转换成字符串.

if(k==0){

gener[p2] = String.valueOf(bianyi[k]);

}

else{

gener[p2] += String.valueOf(bianyi[k]);

}

1. 算法流程

开始

产生初始种群

计算适应度，把符合要求的个体放入规则库

达到预设世代数？

选择

交叉

变异

结束

图2 基于遗传算法的双向关联规则挖掘算法流程图

测试

本论文将上述方法用于中药配伍规律的研究中，从大量古今中药方剂中挖掘药对药组。药对是临床上相对固定的两味药物的配伍形式，是中药配伍中的最小单位；药组是临床上相对固定的两味药物以上的配伍形式，也可以把它看作不限于两味药物的特殊药对，这些药对药组对于研究中药配伍规律具有重要意义。

本文实验基于脾胃类方剂库。该方剂库含1060首方剂，涉及405味药。实验采用了基于遗传算法的双向关联规则挖掘算法来寻找药对药组。

此系统具有的数据挖掘功能，其中有两个选择的模式，一是一般模式状态下的双向关联规则挖掘，用户可以输入相应的最小置信度和遗传的代数。

图3 一般模式状态下的双向关联规则挖掘界面

二是高级设置模式下的双向关联规则挖掘，用户可以输入初始种群个数、遗传代数、最小置信度和变异率四个参数。

图4 高级设置状态下的双向关联规则挖掘界面

在以上两个模式下，根据输入的参数运行得到的结果的状态如下所示：

图5 一般模式状态下的双向关联规则挖掘结果显示

图6 高级模式状态下的双向关联规则挖掘结果显示

由以上两种模式下运行得到的结果表明：

（1）用基于遗传算法的双向关联规则挖掘算法得到的药对药组，每味药都满足最小置信度要求，所以那些高支持度低置信度药就被排除了，得到的药对药组都具有重要意义。

（2）基于遗传算法的双向关联规则挖掘算法能找出了有意义的药对药组。

（3）基于遗传算法的双向关联规则挖掘算法不需要反复扫描事务数据库，挖掘规则的速度大大提高。

结论

经过本学期几个月的设计和开发，基于遗传算法的中药药对挖掘系统基本开发完毕。其功能基本符合需求，能够完成根据用户输入的置信度、遗传代数、初始种群个体数量，完成中药数据库数据挖掘功能。但是，由于做此毕业设计的时间较短，因此，该系统还有很多地方存在不足，例如在系统界面和风格方面太过于普通，不够美观，而且用户的操作的内容不够详细丰富；在系统进行数据挖掘过程中，运算的时间过长，给用户的使用带来不够人性化；对毕业设计和论文的具体步骤和相关信息的考察还不能够尽如人意等问题。这些都还有待进一步的完善。

通过对本次毕业设计的相关内容的学习和设计内容的实现，使得作者对程序的编写有了更进一步的认识：编写程序代码并不是最重要的，关键在于前期的需求分析和程序的运算流程的清楚，在没有很好的把思路理清楚之前就盲目的下手编写程序，那样会很浪费时间，效率很低。

最后，本文分析了基于支持度-置信度框架理论的关联规则挖掘算法的不足，引入了双向关联规则的概念，并详细讲解了本设计基于遗传算法的双向关联规则挖掘算法具体流程，同时也实现基于遗传算法的双向关联规则挖掘算法，使用本挖掘系统，可以快速、准确找出事务数据库中有意义的规则。

参考文献

[1] 欧阳为民,蔡庆生.基于垂直数据分布的关联规则高效发现算法[J].软件学报,1999,26(3):754-760。

[2] 周延泉,何华灿.利用广义相关系数改进的关联规则生成算法[J].西北工业大学学报,2001,19(4):639-643。

[3] 王玮,陈恩红.关联规则的相关性研究[J].计算机工程,2000,26(7):6-8。

[4] 王阶,衷敬柏,王永炎.方剂配伍理论历史发展与研究思考[J].中医杂志,2001,42(8):42-46。

[5] 张跃华.试论方剂的组方原则[J].陕西中医,2002,23(4):12-17。

[6] 王小平,曹立明.遗传算法－理论、应用与软件实现[M].西安:西安交通大学出版社,2002,10-79。

[7] 耿详义,张跃平.JAVA 2 实用教程（第二版）[M].北京:清华大学出版社,2005,337-376。

[8] 张晓东.JAVA 数据库高级编程[M].北京:清华大学出版社,2005,79-90。

[9] 黄明,梁旭,曹利超. JAVA信息系统设计与开发实例[M].北京:机械工业出版社,2005,10-35。

你可能感兴趣的:(oracle,数据库)

为什么wal会提升数据库性能浩澜大大数据库
由于对于一个数据库内会存在很多张表，那么当数据库更新表数据时（1）直接写入磁盘实际写入的位置，会根据表的不同对应到不同的磁盘位置，在写入数据的时候，就会不停的寻找磁盘地址，找到地址后再去写入，对于机械硬盘来说，无规律的寻址是非常耗时的，对应SSD来说虽然性能提升很多，但是也会消耗时间；（2）先写入日志，在写入磁盘（WAL）WAL的过程，由于总是按照在文件末尾追加，只要找到文件写入位置，写入修改后，
通俗易懂：MySQL中如何设置只读实例并确保数据一致性？大龄下岗程序员 mysql java mysql spring
在MySQL中设置只读实例主要应用于构建高可用性和扩展性的数据库环境，通常是为了分担读取负载或者用于备份和灾难恢复。以下是创建MySQL只读实例并确保数据一致性的基本步骤：1.创建并配置只读实例-主从复制设置-首先，你需要有一个主数据库实例（Master）负责接收所有的写操作。-创建一个或多个从数据库实例（Slave），并将它们配置为主数据库的复制品。这通常通过设置主从复制（Replication
C#中的PLINQ和LINQ的效率对比搬砖的诗人Z C#c#linq 开发语言
PLINQ（ParallelLINQ）和LINQ（LanguageIntegratedQuery）都是.NET框架中的功能，用于对集合进行查询和操作。它们之间的主要区别在于并行处理能力。LINQ:LINQ是一种用于在.NET应用程序中进行数据查询和操作的语言集成功能。它提供了一种统一的方式来查询各种数据源，如集合、数组、XML、数据库等。LINQ是在单线程环境中执行查询操作的，因此对于大型数据集或
docker怎么端口映射 Lance_mu docker 容器运维
1、默认固定的端口#Web服务器：WebApache或Nginx通常使用80端口HTTP：80HTTPS：443#数据库服务器MySQL：3306PostgreSQL：5432MongoDB：27017Redis：6379#邮件服务器SMTP：25POP3：110IMAP：143#其他服务SSH：22FTP：21DNS（域名解析）：53代理服务器Squid：3128版本控制系统Git：9418(S
新注册的阿里云账号有哪些优惠？阿里云新用户必看优惠大合集阿里云最新优惠和活动汇总
很多用户看到阿里云各种活动中的云服务器、云数据库、企业邮箱等云产品都仅限新用户购买之后，都纷纷直接注册了阿里云新账号之后购买，其实，阿里云新用户不仅可以优惠购买活动中的各种云产品，还有很多优惠，下面是“阿里云最新优惠和活动汇总”整理汇总的阿里云新用户必看优惠大合集。新注册的阿里云账号在购买活动中的云产品之前，还有免费领云产品通用代金券、抽取无门槛代金券、免费试用云服务器和正式购买云服务器等阿里云产
MyBatis高级面试题-2024 my_styles mybatis java 开发语言面试题
MyBatis的核心组件有哪些？首先第一个是，SqlSessionFactory，它就像是一个会话工厂。它的任务是创建SqlSession对象，这个对象是我们与数据库交互的主要途径。SqlSessionFactory的作用很重要，因为它可以帮我们配置数据库连接信息和事务管理等。一旦这个工厂被建立起来，它就会加载一些必要的配置和映射文件，为后续的数据库操作提供一个可靠的基础。第二个是SqlSessi
SQLite版本3中的文件锁定和并发(七）代码工匠云数据库 SQLite C与c++sqlite c++数据库
返回：SQLite—系列文章目录上一篇：自己编译SQLite或将SQLite移植到新的操作系统（六）下一篇：SQLite—系列文章目录正文：1.0SQLite版本3中的文件锁定和并发SQLite版本3.0.0引入了新的锁定和日志功能旨在提高SQLite版本2的并发性的机制并减少作家的饥饿问题。新机制还允许交易的原子提交涉及多个数据库文件。本文档介绍新的锁定机制。目标受众是想要理解和/或修改的程序员
python转码 Desamond python 开发语言
转码在许多场景中都有应用，以下是一些常见的场景：网页开发：当用户在网页上输入文本时，可能需要将特殊字符（如空格、引号、特殊符号等）进行转码，以防止这些字符对URL或HTML代码产生干扰。文件名处理：在处理文件名时，可能需要将特殊字符进行转码，以避免文件名被错误地解析或显示。数据传输：在数据传输过程中，为了确保数据的完整性和正确性，可能需要将数据中的特殊字符进行转码。数据存储：在数据库或数据存储中，
Python | Redis工具类 -拟墨画扇- Python redis 数据库缓存 python
一、需求自动连接Redis数据库，通过连接池处理数据对输出结果进行Log打印并保存到文件二、代码Utils.redisUtils.py#!/usr/bin/envpython#-*-coding:utf-8-*-importredisfromUtils.loggerimportlog"""Redis数据格式(1)字符串|存储形式:key-value:str-存储二进制数据:可以存储任意类型的数据，
数据管理知识体系指南（第二版）-第五章——数据建模和设计-学习笔记键盘上的五花肉数据治理数据库数据仓库数据治理
目录5.1引言5.1.1业务驱动因素5.1.2目标和原则5.1.3基本概念5.2活动5.2.1规划数据建模5.2.2建立数据模型5.2.3审核数据模型5.2.4维护数据模型5.3工具5.3.1数据建模工具5.3.2数据血缘工具5.3.3数据分析工具5.3.4元数据资料库5.3.5数据模型模式5.3.6行业数据模型5.4方法5.4.1命名约定的最佳实践5.4.2数据库设计中的最佳实践5.5数据建模和
项目管理工具最佳实践水岩
各个公司的最佳实践去哪儿jira自定义使用1.jira编号对应git分支命名，后台增加监控程序，新增一个分支，自动解析分支中的jira编号，自动落地到数据库，完成映射2.各个发布系统间信息同步，消息中心（IC）+数据中心（DC）,广播消息加一站式查询，持续集成，推进代码检查质量，分钟级反馈质量检查反思：1.项目管好：针对一线研发人员，简单易用，而不是满足管理层的“统计度量”（...）简化分类字段，
Python Flask 使用数据库安果移不动 python flask 开发语言
pipinstallflask_sqlalchemy官方文档：Flask-SQLAlchemy—Flask-SQLAlchemyDocumentation(3.1.x)为了不报错也需要导入另外两个库#pipinstallflask_sqlalchemy#pipinstallmysqlclient完整代码importosfromflaskimportFlaskfromflask_sqlalchemy
.NET Core 将实体类转换为 SQL(ORM 映射) 你小子在看什么…… .NET .netcore sqlsugar postgresql
一、环境说明PostgreSQL数据库Npgsql数据库连接库SqlSugarORM框架二、映射流程1、创建数据库：检查指定数据库是否存在，如果不存在则创建数据库。2、初始化SqlSugar实例：使用SqlSugarClient初始化数据库连接配置。3、筛选实体类：根据指定的命名空间和排除条件筛选需要创建表的实体类。4、创建表：使用CodeFirst.InitTables方法创建数据库表。////
数据库的魅力：深入探索与应用小黄编程快乐屋数据库
数据库的魅力：深入探索与应用在数字化时代，数据库已经成为信息处理和存储的基石。无论是大型企业还是个人开发者，数据库都是不可或缺的工具。本文将带您深入探索数据库的魅力，了解其基本概念、类型以及应用，并分享一些实用的数据库管理技巧。一、数据库的基本概念数据库，简而言之，就是按照一定规则存储、组织和管理数据的仓库。它可以看作是一个电子化的文件柜，用于存储电子化的文件。这些文件按照特定的数据模型组织起来，
Thinkphp - 详细实现网站系统登录功能，附带 Mysql 数据库设置、Web 前端展示界面、信息校验等（详细代码，即设计过程）王佳斌 +Thinkphp mysql 前端数据库
前言登录功能，是我们几乎开发每个系统都必须的模块。登录功能设计思路，主要包括几个方面。用户输入网址展示登录页面用户输入用户名，密码等点击登录进行信息校验校验通过之后，记录用户登录信息，跳转指定页面用户校验失败，提示失败信息页面目录具体功能实现为了快速搭建可用、美观的页面，我们采用一个比较成熟的前端框架Bootstrap。下面我们到Bootstrap的官网Bootsrap官网下载bootstrap。
设置mysql 数据库和表的编码方式UTF-8 盖盖衍上中间件数据库 mysql oracle
要设置MySQL数据库表和字段的编码方式为UTF-8，可以使用下面的SQL语句：1.设置数据库默认编码为UTF-8：ALTERDATABASEyour_database_nameCHARACTERSETutf8mb4COLLATEutf8mb4_unicode_ci;2.创建表时指定编码为UTF-8：CREATETABLEyour_table_name(column1VARCHAR(100)CHA
kafka-eagle 配置文件修改使用自带的数据库 bright future cheer kafka 数据库分布式
######################################multizookeeper&kafkaclusterlistSettingsprefixedwith‘kafka.eagle.’willbedeprecated,use‘efak.’instead######################################efak.zk.cluster.alias=clu
mysql 常见数据表操作天狼1222 mysql系列 mysql 数据库
前面介绍了数据库表的基本操作。把常用的做一个汇总。时间久了，记不得完整的语法了，再打开一看，就清楚了。1，表操作1，建表+注释CREATETABLEstudent(idINTPRIMARYKEYAUTO_INCREMENTCOMMENT'学号',nameVARCHAR(200)COMMENT'姓名',ageINTCOMMENT'年龄')COMMENT='学生表'2，修改注释--修改表注释-ALTE
GROM学习码小白l golang
什么是GROMGo语言ORM（对象关系映射）库，它提供了一种高效、简洁的方式来操作数据库。通过将数据库表映射为Go语言的结构体，GORM让数据库操作变得更加直观和类型安全。GORM支持主流的数据库系统，包括MySQL、PostgreSQL、SQLite和SQLServer等GORM提供了一系列的API来操作MySQL数据库。以下是一些常用的GORMAPI操作，以及它们在操作MySQL时的用法：安装
centos7 安装influxdb+telegraf+grafana 监控服务器吕吕-lvlv grafana 服务器运维
influxdbinfluxdb是一个时间序列数据库,所有数据记录都会打上时间戳,适合存储数字类型的内容telegraftelegraf可以用于收集系统和服务的统计数据并发送到influxdbgrafanagrafana是一个界面非常漂亮,可直接读取influxdb数据展示成各种图表的开源可视化web软件安装并启动influxdb数据库vim/etc/yum.repos.d/influxdb.re
Mysql数据库MariaDB数据库MHA高可用程序 yichen_china
声明：本次实验使用的是MariaDB数据库，所以本文中所出现的MariaDB与MySQL都是指的是MariaDB！！！MHA（MasterHA）是一款开源的MySQL的高可用程序，它为MySQL主从复制架构提供了automatingmasterfailover功能。MHA在监控到master节点故障时，会提升其中拥有最新数据的slave节点成为新的master节点，在此期间，MHA会通过于其它从节
基于SSM+Vue企业销售培训系统企业人才培训系统企业课程培训管理系统企业文化培训班系统Java 计算机程序老哥
作者主页：计算机毕业设计老哥有问题可以主页问我一、开发介绍1.1开发环境开发语言：Java数据库：MySQL系统架构：B/S后端：SSM(Spring+SpringMVC+Mybatis)前端：Vue工具：IDEA或者Eclipse，JDK1.8，Maven二、系统介绍2.1图片展示注册登录页面：登陆.png前端页面功能：首页、培训班、在线学习、企业文化、交流论坛、试卷列表、系统公告、留言反馈、个
SQL运维_Unix下MySQL-8.0.18配置文件示例 Mostcow SQL sql 运维 unix
SQL运维_Unix下MySQL-8.0.18配置文件示例MySQL是一个关系型数据库管理系统,由瑞典MySQLAB公司开发,属于Oracle旗下产品。MySQL是最流行的关系型数据库管理系统之一,在WEB应用方面,MySQL是最好的RDBMS(RelationalDatabaseManagementSystem,关系数据库管理系统)应用软件之一。MySQL是一种关系型数据库管理系统,关系数据库将
c#IQueryable和IEnumberable的区别彭小彭~ c#基础 c#
IQueryable和IEnumerable是C#中处理集合的两个重要接口，常用于LINQ查询。它们有一些关键区别，适用于不同的场景：1.执行查询的位置IEnumerable:当你对一个IEnumerable序列使用LINQ操作时，这些操作是在本地内存中执行的。如果IEnumerable表示数据库中的数据（例如，使用EntityFramework时），那么整个数据集首先会被加载到内存中，然后再应用
【Hadoop】使用Scala与Spark连接ClickHouse进行数据处理音乐学家方大刚 Scala Hadoop hadoop scala spark
风不懂不懂得叶的梦月不听不听闻窗里琴声意难穷水不见不曾见绿消红霜不知不知晓将别人怎道珍重落叶有风才敢做一个会飞的梦孤窗有月才敢登高在夜里从容桃花有水才怕身是客身是客此景不能久TieYann(铁阳)、薄彩生《不知晓》在大数据分析和处理领域，ApacheSpark是一个广泛使用的高性能、通用的计算框架，而ClickHouse作为一个高性能的列式数据库，特别适合在线分析处理（OLAP）。结合Scala语
Linux系统定时备份mysql数据库 er_得一数据库 mysql oracle
1、创建shell脚本mysql_db_backup并赋予执行权限#!/bin/bash#备份目录BACKUP=/data/backup/db#当前时间DATETIME=$(date+%Y-%m-%d_%H%M%S)echo$DATETIME#数据库地址HOST=localhost#数据库用户名DB_USER=root#数据库密码DB_PW=pwd@123#备份的数据库名DATABASE=Apol
解决sqlalchemy执行语句提示Not an executable object 娜年花开666 #Python android
问题：fromsqlalchemyimportcreate_engine#数据库的变量HOST='127.0.0.1'PORT=3306DATA_BASE='itbz'USER='root'PWD='123456'#DB_URL=f'数据库的名+驱动名://{USER}:{PWD}@{HOST}:{PORT}/{DATA_BASE}'DB_URL=f'mysql+pymysql://{USER}:
MyBatis面试简答题糯米小麻花啊 mybatis
以下是一份MyBatis的高难度简答题，共20题：请解释MyBatis中#{}和${}的区别，并举例说明它们在实际应用中的使用场景。MyBatis的Mapper接口是如何与XML映射文件关联的？如何在MyBatis中实现动态SQL？请列举几种常见的动态SQL元素并解释其作用。描述MyBatis中的ResultMap的作用，并说明如何定义和使用它。MyBatis如何处理数据库中的null值？请解释M
数据库（一）：基本语法一从零开始的奋豆数据库 sql
数据库第二次作业姓名：~~~，学号：~~~，专业：~~~2.66书写SQL查询来获取以下结果:A.星期五的ChangeClose。SELECTChangeCloseFROMNDXWHERETDayOfWeek='Friday';B.星期五的最小、最大和平均ChangeClose。SELECTMIN(ChangeClose)asMinChangeClose,MAX(ChangeClose)asMax
Java中文乱码浅析及解决方案儿时可乖了 java
在Java编程中，中文乱码是一种常见的问题，往往会导致程序在处理字符串时出现意料之外的结果。这通常是因为在不同编码之间转换或不正确处理编码时发生的。本文将剖析Java中文乱码的原因，并提出一些实用的解决方案。文章目录前言一、什么是乱码二、常见乱码场景三、解决方案1.统一编码标准2.数据库编码设置3.文件读写指定编码4.网络传输编码处理5.系统默认编码问题总结前言一、什么是乱码所谓“乱码”，就是指字
多线程编程之join()方法周凡杨 java JOIN 多线程编程线程
现实生活中，有些工作是需要团队中成员依次完成的，这就涉及到了一个顺序问题。现在有T1、T2、T3三个工人，如何保证T2在T1执行完后执行，T3在T2执行完后执行？问题分析：首先问题中有三个实体，T1、T2、T3，因为是多线程编程，所以都要设计成线程类。关键是怎么保证线程能依次执行完呢？ Java实现过程如下： public class T1 implements Runnabl
java中switch的使用 bingyingao java enum break continue
java中的switch仅支持case条件仅支持int、enum两种类型。用enum的时候，不能直接写下列形式。 switch (timeType) { case ProdtransTimeTypeEnum.DAILY: break; default: br
hive having count 不能去重 daizj hive 去重 having count 计数
hive在使用having count()是，不支持去重计数 hive (default)> select imei from t_test_phonenum where ds=20150701 group by imei having count(distinct phone_num)>1 limit 10; FAILED: SemanticExcep
WebSphere对JSP的缓存周凡杨 WAS JSP 缓存
对于线网上的工程，更新JSP到WebSphere后，有时会出现修改的jsp没有起作用，特别是改变了某jsp的样式后，在页面中没看到效果，这主要就是由于websphere中缓存的缘故，这就要清除WebSphere中jsp缓存。要清除WebSphere中JSP的缓存，就要找到WAS安装后的根目录。现服务
设计模式总结朱辉辉33 java 设计模式
1.工厂模式 1.1 工厂方法模式 (由一个工厂类管理构造方法) 1.1.1普通工厂模式(一个工厂类中只有一个方法) 1.1.2多工厂模式(一个工厂类中有多个方法) 1.1.3静态工厂模式(将工厂类中的方法变成静态方法) &n
实例：供应商管理报表需求调研报告老A不折腾 finereport 报表系统报表软件信息化选型
引言随着企业集团的生产规模扩张，为支撑全球供应链管理，对于供应商的管理和采购过程的监控已经不局限于简单的交付以及价格的管理，目前采购及供应商管理各个环节的操作分别在不同的系统下进行，而各个数据源都独立存在，无法提供统一的数据支持；因此，为了实现对于数据分析以提供采购决策，建立报表体系成为必须。业务目标 1、通过报表为采购决策提供数据分析与支撑 2、对供应商进行综合评估以及管理，合理管理和
mysql 林鹤霄
转载源：http://blog.sina.com.cn/s/blog_4f925fc30100rx5l.html mysql -uroot -p ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) [root@centos var]# service mysql
Linux下多线程堆栈查看工具(pstree、ps、pstack) aigo linux
原文：http://blog.csdn.net/yfkiss/article/details/6729364 1. pstree pstree以树结构显示进程$ pstree -p work | grep adsshd(22669)---bash(22670)---ad_preprocess(4551)-+-{ad_preprocess}(4552) &n
html input与textarea 值改变事件 alxw4616 JavaScript
// 文本输入框(input) 文本域(textarea)值改变事件 // onpropertychange(IE) oninput(w3c) $('input,textarea').on('propertychange input', function(event) { console.log($(this).val()) });
String类的基本用法百合不是茶 String
字符串的用法; // 根据字节数组创建字符串 byte[] by = { 'a', 'b', 'c', 'd' }; String newByteString = new String(by); 1,length() 获取字符串的长度 &nbs
JDK1.5 Semaphore实例 bijian1013 java thread java多线程 Semaphore
Semaphore类一个计数信号量。从概念上讲，信号量维护了一个许可集合。如有必要，在许可可用前会阻塞每一个 acquire()，然后再获取该许可。每个 release() 添加一个许可，从而可能释放一个正在阻塞的获取者。但是，不使用实际的许可对象，Semaphore 只对可用许可的号码进行计数，并采取相应的行动。 S
使用GZip来压缩传输量 bijian1013 java GZip
启动GZip压缩要用到一个开源的Filter：PJL Compressing Filter。这个Filter自1.5.0开始该工程开始构建于JDK5.0，因此在JDK1.4环境下只能使用1.4.6。 PJL Compressi
【Java范型三】Java范型详解之范型类型通配符 bit1129 java
定义如下一个简单的范型类， package com.tom.lang.generics; public class Generics<T> { private T value; public Generics(T value) { this.value = value; } }
【Hadoop十二】HDFS常用命令 bit1129 hadoop
1. 修改日志文件查看器 hdfs oev -i edits_0000000000000000081-0000000000000000089 -o edits.xml cat edits.xml 修改日志文件转储为xml格式的edits.xml文件，其中每条RECORD就是一个操作事务日志 2. fsimage查看HDFS中的块信息等 &nb
怎样区别nginx中rewrite时break和last ronin47
在使用nginx配置rewrite中经常会遇到有的地方用last并不能工作，换成break就可以，其中的原理是对于根目录的理解有所区别，按我的测试结果大致是这样的。 location / { proxy_pass http://test;
java-21.中兴面试题输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等于 m bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; public class CombinationToSum { /* 第21 题 2010 年中兴面试题编程求解：输入两个整数 n 和 m ，从数列 1 ， 2 ， 3.......n 中随意取几个数 , 使其和等
eclipse svn 帐号密码修改问题开窍的石头 eclipse SVN svn帐号密码修改
问题描述： Eclipse的SVN插件Subclipse做得很好，在svn操作方面提供了很强大丰富的功能。但到目前为止，该插件对svn用户的概念极为淡薄，不但不能方便地切换用户，而且一旦用户的帐号、密码保存之后，就无法再变更了。解决思路：删除subclipse记录的帐号、密码信息，重新输入
[电子商务]传统商务活动与互联网的结合 comsci 电子商务
某一个传统名牌产品，过去销售的地点就在某些特定的地区和阶层，现在进入互联网之后，用户的数量群突然扩大了无数倍，但是，这种产品潜在的劣势也被放大了无数倍，这种销售利润与经营风险同步放大的效应，在最近几年将会频繁出现。。。。如何避免销售量和利润率增加的
java 解析 properties-使用 Properties-可以指定配置文件路径 cuityang java properties
#mq xdr.mq.url=tcp://192.168.100.15:61618; import java.io.IOException; import java.util.Properties; public class Test { String conf = "log4j.properties"; private static final
Java核心问题集锦 darrenzhu java 基础核心难点
注意，这里的参考文章基本来自Effective Java和jdk源码 1)ConcurrentModificationException 当你用for each遍历一个list时，如果你在循环主体代码中修改list中的元素，将会得到这个Exception，解决的办法是： 1)用listIterator, 它支持在遍历的过程中修改元素， 2)不用listIterator, new一个
1分钟学会Markdown语法 dcj3sjt126com markdown
markdown 简明语法基本符号 *,-,+ 3个符号效果都一样，这3个符号被称为 Markdown符号空白行表示另起一个段落 `是表示inline代码，tab是用来标记代码段，分别对应html的code，pre标签换行单一段落( <p>) 用一个空白行连续两个空格会变成一个 <br> 连续3个符号，然后是空行
Gson使用二（GsonBuilder） eksliang json gson GsonBuilder
转载请出自出处：http://eksliang.iteye.com/blog/2175473 一.概述 GsonBuilder用来定制java跟json之间的转换格式二.基本使用实体测试类：温馨提示：默认情况下@Expose注解是不起作用的,除非你用GsonBuilder创建Gson的时候调用了GsonBuilder.excludeField
报ClassNotFoundException: Didn't find class "...Activity" on path: DexPathList gundumw100 android
有一个工程，本来运行是正常的，我想把它移植到另一台PC上，结果报： java.lang.RuntimeException: Unable to instantiate activity ComponentInfo{com.mobovip.bgr/com.mobovip.bgr.MainActivity}: java.lang.ClassNotFoundException: Didn't f
JavaWeb之JSP指令 ihuning javaweb
要点 JSP指令简介 page指令 include指令 JSP指令简介 JSP指令（directive）是为JSP引擎而设计的，它们并不直接产生任何可见输出，而只是告诉引擎如何处理JSP页面中的其余部分。 JSP指令的基本语法格式： <%@ 指令属性名="
mac上编译FFmpeg跑ios 啸笑天 ffmpeg
1、下载文件：https://github.com/libav/gas-preprocessor，复制gas-preprocessor.pl到/usr/local/bin/下，修改文件权限：chmod 777 /usr/local/bin/gas-preprocessor.pl 2、安装yasm-1.2.0 curl http://www.tortall.net/projects/yasm
sql mysql oracle中字符串连接 macroli oracle sql mysql SQL Server
有的时候，我们有需要将由不同栏位获得的资料串连在一起。每一种资料库都有提供方法来达到这个目的： MySQL: CONCAT() Oracle: CONCAT(), || SQL Server: + CONCAT() 的语法如下： Mysql 中 CONCAT(字串1, 字串2, 字串3, ...): 将字串1、字串2、字串3，等字串连在一起。请注意，Oracle的CON
Git fatal: unab SSL certificate problem: unable to get local issuer ce rtificate qiaolevip 学习永无止境每天进步一点点 git 纵观千象
// 报错如下： $ git pull origin master fatal: unable to access 'https://git.xxx.com/': SSL certificate problem: unable to get local issuer ce rtificate // 原因：由于git最新版默认使用ssl安全验证，但是我们是使用的git未设
windows命令行设置wifi surfingll windows wifi 笔记本wifi
还没有讨厌无线wifi的无尽广告么，还在耐心等待它慢慢启动么教你命令行设置笔记本电脑wifi： 1、开启wifi命令 netsh wlan set hostednetwork mode=allow ssid=surf8 key=bb123456 netsh wlan start hostednetwork pause 其中pause是等待输入，可以去掉 2、
Linux（Ubuntu）下安装sysv-rc-conf wmlJava linux ubuntu sysv-rc-conf
安装：sudo apt-get install sysv-rc-conf 使用：sudo sysv-rc-conf 操作界面十分简洁，你可以用鼠标点击，也可以用键盘方向键定位，用空格键选择，用Ctrl+N翻下一页，用Ctrl+P翻上一页，用Q退出。背景知识 sysv-rc-conf是一个强大的服务管理程序，群众的意见是sysv-rc-conf比chkconf
svn切换环境，重发布应用多了javaee标签前缀 zengshaotao javaee
更换了开发环境，从杭州，改变到了上海。svn的地址肯定要切换的，切换之前需要将原svn自带的.svn文件信息删除，可手动删除，也可通过废弃原来的svn位置提示删除.svn时删除。然后就是按照最新的svn地址和规范建立相关的目录信息，再将原来的纯代码信息上传到新的环境。然后再重新检出，这样每次修改后就可以看到哪些文件被修改过，这对于增量发布的规范特别有用。检出

JAVA基于遗传算法的中药药对挖掘系统的设计与实现(源代码+论文)

结 论

你可能感兴趣的:(oracle,数据库)

结论