CHAINCH

基于华为FusionInsight的Flume日志采集分析报告

Flume日志采集分析报告

1.日志采集系统简介
2.系统架构

2.1.日志采集系统的整体框架图
2.2.日志采集系统的模块分解图

3.架构分析

3.1.可用性(availablity)

3.1.1.Agent层宕机
3.1.2.Store层宕机

3.2.可靠性(reliability)
3.3.可扩展性(scalability)

3.3.1.Agent层
3.3.2.Store层

4.架构测试

4.1.测试目的
4.2.测试环境

4.2.1.基础环境准备
4.2.2.flume环境准备
4.2.3.Kafka环境准备

4.2.3.1.准备topic
4.2.3.2.准备kerberos认证

4.3.测试项目

4.3.1.架构连通性

4.3.1.1.基本思路
4.3.1.2.实现流程
4.3.1.3.测试步骤

4.3.1.3.1.配置客户端（client）：
4.3.1.3.2. 重启Flume客户端，使配置文件生效
4.3.1.3.3.构造数据
4.3.1.3.4.查看kafka运行结果

4.3.2.断点续传
4.3.3.数据过滤
4.3.4.性能测试
4.3.4.1.Kafka参数影响

4.3.4.2.Channel的对比

5.总结

1.日志采集系统简介

集团各业务平台每天都会产生大量的日志数据。收集业务日志数据，供离线和在线的分析系统使用，正是日志收集系统的要做的事情。高可用性，高可靠性和可扩展性是日志收集系统所具有的基本特征。
本文主要介绍通过Flume实现日志收集系统。Flume是一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统，可以采集文件，socket数据包、文件、文件夹、kafka等各种形式源数据，又可以将采集到的数据(下沉sink)输出到HDFS、hbase、hive、kafka等众多外部存储系统中。

2.系统架构

2.1.日志采集系统的整体框架图

1、整个系统分为两层：Agent层，和Store层。其中Agent层每个机器部署一个进程，负责对单机的日志收集工作；Store层负责提供永久或者临时的日志存储服务，或者将日志流导向其它服务器。

2、Agent层，一台机器可以部署一个或多个agent节点，每个agent节点使用TailFileSource–>KafkaChannel这种方式，将KafkaChannel作为缓冲，效率变高，而且数据不会丢失。这种方法不需要Sink，KafkaChannel相当于Kafka的生产者，这样就充分利用了Kafka集群的优点，当数据量很大的时候，也能承受得住。

3、Store层，使用Kafka存储临时的日志，并给Spark Streaming/Flink系统提供实时日志流，需要永久存储时，可存入hdfs等其他数据源。

2.2.日志采集系统的模块分解图

1、模块命名规则：所有的Source以src开头，所有的Channel以ch开头，所有的Sink以sink开头；

2、Source使用taildir Source，实时保存读取位置至磁盘；Channel使用的KafkaChannel；对于过滤掉的日志使用flume的拦截器（interceptor）；

3.架构分析

3.1.可用性(availablity)

对日志收集系统来说，可用性(availablity)指固定周期内系统无故障运行总时间。要想提高系统的可用性，就需要消除系统的单点，提高系统的冗余度。下面来看看日志收集系统在可用性方面的考虑。

3.1.1.Agent层宕机

Agent宕机分为两种情况：机器死机或者Agent进程中断。对于机器死机，由于产生日志的进程也同样会中断，所以不会再产生新的日志，不存在不提供服务的情况。

对于Agent进程中断，我们有下面三种方式来提高系统的可用性。首先，所有的Agent在supervise的方式下启动，如果进程中断会被系统立即重启，以提供服务。其次，对所有的Agent进行存活监控，发现Agent中断立即报警。最后，对于非常重要的日志，读取时，实时保存读取位置，如使用taildirSource。

3.1.2.Store层宕机

假如store层的kafka异常停机或不可访问，此时Agent层无法写kafka。由于flume内部source到channel端提供事务机制，Agent采集到数据，发送至kafka channel失败，会导致事务回滚，重新发送，直到kafka恢复服务，成功保存，这可以提供较好的容错性。

3.2.可靠性(reliability)

对日志收集系统来说，可靠性(reliability)是指Flume在数据流的传输过程中，保证events的可靠传递。
Flume提供了数据流中点到点的可靠性保证的最基本的单跳消息传递语义。

首先，Agent间的事务交换。Flume使用事务的办法来保证event的可靠传递。Source和Sink分别被封装在事务中，这些事务由保存 event的存储提供或者由Channel提供。这就保证了event在数据流的点对点传输中是可靠的。在多级数据流中，如下图，上一级的Sink和下一级的Source都被包含在事务中，保证数据可靠地从一个Channel到另一个Channel转移。

其次，数据流中 Channel的持久性。Flume中MemoryChannel是可能丢失数据的（当Agent宕机时），但KafkaChannel和FileChannel是持久性的，可以保证数据不丢失。

3.3.可扩展性(scalability)

对日志收集系统来说，可扩展性(scalability)是指系统能够线性扩展。当日志量增大时，系统能够以简单的增加机器来达到线性扩容的目的。

对基于Flume的日志收集系统来说，需要在设计的每一层，都可以做到线性扩展地提供服务。下面将对每一层的可扩展性做相应的说明。

3.3.1.Agent层

对于Agent这一层来说，一个方面，Agent收集日志的能力受限于机器的性能，每个机器部署一个或多个Agent，机器性能允许情况下，可以不断扩展；另一方面，如果机器和Agent节点比较多，可能受限于后端kafka提供的服务。

3.3.2.Store层

对于Store这一层来说，Kafka是分布式系统，可以做到线性扩展。

4.架构测试

4.1.测试目的

基于架构分析，使用测试环境对架构的可用性、可靠性、可扩展性等进行全面测试，以验证我们的架构分析是否正确，以及找出在实际环境中可能还存在的问题。

4.2.测试环境

4.2.1.基础环境准备

集群管理界面（Fusioninsight Manager）：https://192.168.1.201:28443/web/
测试用户：tpdata/!QAZ2wsx
版本：Flume 1.9，Kafka1.1.0，JDK 1.8
服务器IP：

项目	地址
客户端（flume）	192.168.1.180
存储服务器（kafka）	192.168.1.177，192.168.1.178，192.168.1.179
其他（zookeeper）	192.168.1.177，192.168.1.178，192.168.1.179

4.2.2.flume环境准备

flume客户端的安装
1、从fusionInsight manager管理界面下载客户端，下载位置是“集群>服务>flume> 更多>下载客户端”
2、把下载到的客户端上传到要安装的机器上，如果机器上没有jdk，需要先安装jdk，安装jdk步骤：上传jdk到对应服务器，然后解压jdk

tar -xvf jdk包
配置环境：
vi /etc/profile 
添加以下内容
export JAVA_HOME=/tpdata/jdk-8u201（jdk安装目录）
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
完成之后输入Java -version 显示Java版本说明安装成功

3、解压上传的客户端jar包，进入目录

cd /tpdata/client/FusionInsight_Cluster_1_Flume_ClientConfig/Flume/FlumeClient

执行以下命令：

./install.sh -d /tpdata/FlumeClient -f 192.168.1.177,192.168.1.178      -l /var/log/Bigdata  -e 192.168.1.180 -n test1

4、安装成功后的进程信息：
1）查看flume的进程id

ps -ef | grep flume

2）中断flume的client进程，之后flume会自动重启，一般使用这种方式使properties.properties配置文件立刻生效，如：

kill -9    flume的client端口id

5、客户端的卸载

/tpdata/FlumeClient/fusioninsight-flume-1.9.0/inst
./uninstall.sh

4.2.3.Kafka环境准备

4.2.3.1.准备topic

登录192.168.1.177服务器，执行第1步命令创建topic：
1、创建测试topic—flume_test，指定分配5个分区，3个副本；

/tpdata/hadoopclient/Kafka/kafka/bin/kafka-topics.sh --create --topic flume_test --partitions 5 --replication-factor 3 --zookeeper 192.168.1.177:24002,192.168.1.178:24002,192.168.1.179:24002/kafka

2、查看topic列表

/tpdata/hadoopclient/Kafka/kafka/bin/kafka-topics.sh --list --zookeeper 192.168.1.177:24002/kafka

3、查看topic信息，如分区数等

/tpdata/hadoopclient/Kafka/kafka/bin/kafka-topics.sh   --topic flume_test --describe --zookeeper 192.168.1.177:24002/kafka

4、命令端向flume_test生产消息

/tpdata/hadoopclient/Kafka/kafka/bin/kafka-console-producer.sh --broker-list 192.168.1.180:21007,192.168.1.181:21007,192.168.1.182:21007 --topic flume_test --producer.config /tpdata/hadoopclient/Kafka/kafka/config/producer.properties

5、消费flume_test消息
1）从上次消费位置消费：

/tpdata/hadoopclient/Kafka/kafka/bin/kafka-console-consumer.sh --bootstrap-server 192.168.1.180:21007,192.168.1.181:21007,192.168.1.182:21007 --topic flume_test --consumer.config /tpdata/hadoopclient/Kafka/kafka/config/consumer.properties

2）从头开始消费：

/tpdata/hadoopclient/Kafka/kafka/bin/kafka-console-consumer.sh --bootstrap-server 192.168.1.180:21007,192.168.1.181:21007,192.168.1.182:21007 --topic flume_test --new-consumer --from-beginning --consumer.config /tpdata/hadoopclient/Kafka/kafka/config/consumer.properties

6、查看指定消费者组的topic消费位置（offset偏移量）

/tpdata/hadoopclient/Kafka/kafka/bin/kafka-consumer-groups.sh --bootstrap-server 192.168.1.180:21007 --describe --group example-group1 --command-config /tpdata/hadoopclient/Kafka/kafka/config/consumer.properties

7、删除topic

/tpdata/hadoopclient/Kafka/kafka/bin/kafka-topics.sh  --delete --zookeeper 192.168.1.177:24002,192.168.1.178:24002,192.168.1.179:24002/kafka  --topic flume_test

4.2.3.2.准备kerberos认证

1、在flume的conf目录新增jaas.conf文件，内容如下：

KafkaClient {
com.sun.security.auth.module.Krb5LoginModule required
useKeyTab=true
keyTab="/tpdata/user.keytab"
principal="[email protected]"
useTicketCache=false
storeKey=true
debug=true;
};

注意：keyTab和principal的值请按照实际情况配置，所配置的principal需要有相应的kafka的权限。

4.3.测试项目

4.3.1.架构连通性

4.3.1.1.基本思路

客户端：监控采集目录下“a”开头，“.log”结尾的文件，agent使用taildirSource，KafkaChannel，无sink的方式，并使用拦截器剔除“字母开头的记录”，将数据发送至kafka指定topic—flume_test；
存储服务器：查看收集情况；

4.3.1.2.实现流程

4.3.1.3.测试步骤

4.3.1.3.1.配置客户端（client）：

1）登录192.168.1.180服务器，进入Flume客户端的conf目录：

cd /tpdata/FlumeClient/fusioninsight-flume-1.9.0/conf

2）修改properties.properties文件

client.sources = src_taildir
client.channels = ch_kafka
client.sinks =
client.sources.src_taildir.type = TAILDIR
client.sources.src_taildir.filegroups = f1
client.sources.src_taildir.filegroups.f1 = /tpdata/flume/a.*.log
client.sources.src_taildir.headers.f1. = 
client.sources.src_taildir.positionFile = /tpdata/flume/taildir_position.json
client.sources.src_taildir.montime = 
client.sources.src_taildir.byteOffsetHeader = false
client.sources.src_taildir.skipToEnd = false
client.sources.src_taildir.idleTimeout = 12000
client.sources.src_taildir.writePosInterval = 3000
client.sources.src_taildir.batchSize = 10000
client.sources.src_taildir.fileHeader = false
client.sources.src_taildir.fileHeaderKey = file
client.sources.src_taildir.channels = ch_kafka

#二、 set interceptor（可配置多个，也可省略）
# 例：设置正则过滤拦截器
client.sources.src_taildir.interceptors = i1
client.sources.src_taildir.interceptors.i1.type = REGEX_FILTER
# 剔除内容中以英文字母开头的记录
client.sources.src_taildir.interceptors.i1.regex = ^[a-z]|[A-Z].*
# 是否剔除符合规则数据
client.sources.src_taildir.interceptors.i1.excludeEvents = true
# 其他拦截器，参见 https://www.jianshu.com/p/1c60e0df744b

client.channels.ch_kafka.type = org.apache.flume.channel.kafka.KafkaChannel
client.channels.ch_kafka.kafka.bootstrap.servers = 192.168.1.180:21007,192.168.1.181:21007,192.168.1.182:21007
client.channels.ch_kafka.kafka.topic = flume_test
client.channels.ch_kafka.kafka.consumer.group.id = flume-group1
client.channels.ch_kafka.parseAsFlumeEvent = true
client.channels.ch_kafka.migrateZookeeperOffsets = true
client.channels.ch_kafka.kafka.consumer.auto.offset.reset = earliest
client.channels.ch_kafka.kafka.producer.security.protocol = SASL_PLAINTEXT
client.channels.ch_kafka.kafka.consumer.security.protocol = SASL_PLAINTEXT
client.channels.ch_kafka.ignoreLongMessage = false
client.channels.ch_kafka.messageMaxLength = 1000012

4.3.1.3.2. 重启Flume客户端，使配置文件生效

1）查看flume的进程id

ps -ef | grep flume

2）中断flume的client进程，之后flume会自动重启

kill -9    flume的client端口id

3）查看flume的客户端进程情况，以确认配置是否正确

ps -ef | grep flume

4.3.1.3.3.构造数据

1）进入配置的文件采集目录

cd /tpdata/

2）运行构造数据的sh脚本

sh createdata_a.sh

其中，以createdata_a.sh为例：

#!/bin/bash
i=100000000
count=1
while [ $count -le 10000000 ]
do
  echo $i $i $i $i $i>> /tpdata/flume/a2019.log
  let i++
  let count++
done
echo "flag" >> /tpdata/flume/a2019.log

构造的数据格式如下，总共1000万条，末尾另加一条“flag”，用于测试拦截器：

3）将数据放入监控目录

cp a2019.log ./flume/

4.3.1.3.4.查看kafka运行结果

1）登录177服务器，新建flume_consumer.properties，配置flume-group1消费者组：

security.protocol = SASL_PLAINTEXT
kerberos.domain.name = hadoop.hadoop.com
group.id = flume-group1
auto.commit.interval.ms = 60000
sasl.kerberos.service.name = kafka

2）使用flume-group1消费者组进行部分消费：

/tpdata/hadoopclient/Kafka/kafka/bin/kafka-console-consumer.sh --bootstrap-server 192.168.1.180:21007,192.168.1.181:21007,192.168.1.182:21007 --topic flume_test --consumer.config /tpdata/hadoopclient/Kafka/kafka/config/flume_consumer.properties

3）执行以下命令查看消费者组（flume-group1）消费topic（flume_test）的详细信息：

/tpdata/hadoopclient/Kafka/kafka/bin/kafka-consumer-groups.sh --bootstrap-server 192.168.1.180:21007 --describe --group flume-group1 --command-config /tpdata/hadoopclient/Kafka/kafka/config/flume_consumer.properties

注：
PARTITION：topic（flume_test）下面的分区编号；
CURRENT-OFFSET：flume-group1消费者组对每个分区的消费位置；
LOG-END-OFFSET：topic（flume_test）每个分区总的记录数
LAG：flume-group1消费者组对每个分区的剩余多少未消费；

3、计算结果，以LOG-END-OFFSET加总，得1000万条记录，结果正常：

TOPIC	PARTITION	LOG-END-OFFSET
flume_test	1	2000000
flume_test	1	2000000
flume_test	2	2000000
flume_test	3	2000000
flume_test	4	2000000
flume_test	0	2000000
flume_test	合计	10000000

4.3.2.断点续传

1、初始化
初始化4.4.1架构连通性的测试，删除原始的a2019.log，删除并重新创建kafka topic的flume_test，并重启客户端和中心服务器的flume节点，构造数据，步骤参考4.4.1.3.1-4.4.1.3.3；

2、模拟客户端层宕机
1）关闭180节点的客户端

 /tpdata/FlumeClient/fusioninsight-flume-1.9.0/bin/flume-manage.sh stop force

2）查看文件采集位置。
由于source采用的taildir，会实时记录采集位置信息，通过查看taildir_position.json可知，180节点宕机后，a2019.log文件偏移位置（pos）没有继续变化。

 cd /tpdata/flume
 cat taildir_position.json

a2019.log实际为1000000005字节，实际采集至170000000，表明未完成采集：

3、重启宕机的180节点客户端

/tpdata/FlumeClient/fusioninsight-flume-1.9.0/bin/flume-manage.sh start  force
ps -ef | grep flume

4、重启后结果
1）taildir的文件采集位置记录正常：

 cd /tpdata/flume
 ll
 cat taildir_position.json

4）kafka——客户端层宕机，数据不会丢失，但会重复
登录177服务器，使用flume-group1消费者组进行部分消费：

/tpdata/hadoopclient/Kafka/kafka/bin/kafka-console-consumer.sh --bootstrap-server 192.168.1.180:21007,192.168.1.181:21007,192.168.1.182:21007 --topic flume_test --consumer.config /tpdata/hadoopclient/Kafka/kafka/config/flume_consumer.properties

执行以下命令查看消费者组（flume-group1）消费topic（flume_test）的详细信息：

/tpdata/hadoopclient/Kafka/kafka/bin/kafka-consumer-groups.sh --bootstrap-server 192.168.1.180:21007 --describe --group flume-group1 --command-config /tpdata/hadoopclient/Kafka/kafka/config/flume_consumer.properties

采集a2019.log，总共1000万条，最终结果总共10010000条，重复采集10000条，注意，经多次测试，重复采集的量可能为多个批次，也可能未发生重复。

注：数据重复的原因：文件采集时，TailDir的pos位置（taildir_position.json）其实是从内存中读取的，只要操作中间flume进程不挂，就没问题。但进程挂了再重启，只能从磁盘文件taildir_position.json中读取pos，由于内存中的pos位置可能未及时同步到磁盘，导致数据重复。

4.3.3.数据过滤

通过Flume的正则过滤拦截器进行了数据过滤，日志构造了一条字母开头的记录，通过正则过滤拦截器（见客户端配置，regex=¹|[A-Z].*），实现了过滤操作。a2019.log总共10000001条数据，剔除最后一条“flag”记录，最终结果为1000万条数据。

4.3.4.性能测试

4.3.4.1.Kafka参数影响

1、kafka的topic分区数：

由下表可知，kafka的topic分区数在30个左右，采集速度为15.9Mb/s，相比分区数为10或者50都更快，表明kafka的topic分区存在一个最优点，并非越多越好。

channe	Source	Sink	采集文件大小	Batchsize	partition	acks	采集总量（行）	总耗时(s)	采集速度（mb/s）	采集速度（行/s）
kafkaChannel	TailDir	Kafka	953.68	10000	10	-1	10000000	65	14.7	153846
kafkaChannel	TailDir	Kafka	953.68	10000	30	-1	10000000	60	15.9	166667
kafkaChannel	TailDir	Kafka	953.68	10000	50	-1	10000000	63	15.1	158730

2、flumeBatchSize，批次写入Kafka的Event个数

由下表可知，kafka的flumeBatchSize在10万左右，采集速度为29.8Mb/s，相比flumeBatchSize为1万或者100万都更快，表明kafka的flumeBatchSize存在一个最优点，并非越多越好。此外，flume的客户端宕机重启，可能导致一个批次的数据重复，批次越大，数据重复量越多。

channe	Source	Sink	采集文件大小	Batchsize	partition	acks	采集总量（行）	总耗时(s)	采集速度（mb/s）	采集速度（行/s）
kafkaChannel	TailDir	Kafka	953.68	10000	30	-1	10000000	60	15.9	166667
kafkaChannel	TailDir	Kafka	953.68	100000	30	-1	10000000	32	29.8	312500
kafkaChannel	TailDir	Kafka	953.68	1000000	30	-1	10000000	37	25.8	270270

4.3.4.2.Channel的对比

由下表可知，memoryChannel速度最快，为30.8Mb/s，但是根据4.3.4.1结果，将kafka的参数调整到最优，如partition设置为30，Batchsize设为10万，kafkaChannel速度为29.8Mb/s，速度可以与memoryChannel媲美，同时还能更好地保证数据不丢失。

channe	Source	Sink	采集文件大小	Batchsize	partition	acks	采集总量（行）	总耗时(s)	采集速度（mb/s）	采集速度（行/s）
File Channel	TailDir	Kafka	953.68	100000	30	-1	10000000	406	2.3	24631
memoryChannel	TailDir	Kafka	953.68	100000	30	-1	10000000	31	30.8	322581
kafkaChannel	TailDir	Kafka	953.68	100000	30	-1	10000000	32	29.8	312500

注：以上测试其他条件如下
1、测试采用一个agent节点采集本地文件发送至kafka集群；
2、Topic的副本数为2；
3、所用机器为192.168.1.180服务器。

5.总结

经过上述架构分析及架构测试结果，可以得出以下结论：

1、使用Kafka Channel采集日志到kafka性能相对较高，kafka参数对采集速度影响较大，需要选择合适的partition和batchsize等。

2、flume通过tailDir Source和Kafka Channel可以实现日志采集的断点续传，保证采集数据不丢失。
但也存在以下缺点：

①flume可以保证数据不丢失，但可能会导致数据重复，如4.4.2断点续传的测试。
数据重复的原因：客户端突然宕机，tailDir采集的pos位置信息可能未能及时同步至磁盘，客户端重启后，会重新从磁盘中读取pos位置，导致数据重复。
数据重复的解决需要根据实际业务场景，制定相应的举措，如监控预警、按主键去重等。
②客户端宕机，如果无法修复重启，也会导致数据丢失。

a-z ↩︎

你可能感兴趣的:(大数据)

Deepseek技术深化：驱动大数据时代颠覆性变革的未来引擎荣华富贵8 spring boot 搜索引擎后端缓存 redis
在大数据时代，信息爆炸和数据驱动的决策逐渐重塑各行各业。作为一项前沿技术，Deepseek正在引领新一轮技术革新，颠覆传统数据处理与分析方式。本文将从理论原理、应用场景和前沿代码实践三个层面，深入剖析Deepseek技术如何为大数据时代提供颠覆性变革的解决方案。一、技术背景与核心思想1.1大数据挑战与机遇在数据量呈指数级增长的背景下，传统数据处理方法面临数据存储、计算效率和信息提取精度的诸多挑战。
大数据之路：阿里巴巴大数据实践——大数据领域建模综述
为什么需要数据建模核心痛点数据冗余：不同业务重复存储相同数据（如用户基础信息），导致存储成本激增。计算资源浪费：未经聚合的明细数据直接参与计算（如全表扫描），消耗大量CPU/内存资源。数据一致性缺失：同一指标在不同业务线的口径差异（如“活跃用户”定义不同），引发决策冲突。开发效率低下：每次分析需重新编写复杂逻辑，无法复用已有模型。数据建模核心价值性能提升：分层设计（ODS→DWD→DWS→ADS）
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
大数据精准获客并实现高转化的核心思路和实现方法 2401_88470328 大数据精准获客数据分析数据挖掘大数据需求分析 big data
大数据精准获客并实现高转化的核心思路和实现方法大数据精准获客并实现高转化的核心思路和实现方法在当今信息爆炸的时代，企业如何通过海量的数据精准获取潜在客户，并提高转化率，已经成为营销策略中的关键环节。大数据精准获客的核心思路在于数据驱动、多渠道触达以及优化转化路径，从而实现高效的市场推广和客户转化。数据驱动原理和机制数据驱动的核心在于通过分析用户行为数据，挖掘潜在客户的需求和喜好，从而制定更加精准的
一地鸡毛—一个中年男人的日常2021241 随止心语所自欲律
2021年8月31日，星期二，阴有小雨。早起5:30，跑步10公里。空气清新，烟雨朦胧，远山如黛，烟雾缭绕，宛若仙境。空气中湿气很大，朦胧细雨拍打在脸上，甚是舒服，跑步的人明显减少。早上开会，领导说起逐年大幅度下滑的工作业绩，越说越激动，说得脸红脖子粗。开完会又讨论了一下会议精神，心情也有波动，学习热情不高。心里还有一个大事，是今日大数据分析第1次考试，因自己前期没学，而且计算机编程方面没有任何基
Hive详解
一：Hive的历史价值1，Hive是Hadoop上的KillerApplication，Hive是Hadoop上的数据仓库，Hive同时兼具有数据仓库中的存储引擎和查询引擎的作用；而SparkSQL是一个更加出色和高级的查询引擎，所以在现在企业级应用中SparkSQL+Hive成为了业界使用大数据最为高效和流行的趋势。2，Hive是Facebook的推出，主要是为了让不动Java代码编程的人员也能
智慧施工：AI技术赋能建筑安全监测新纪元
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！智慧施工：AI技术赋能建筑安全监测新纪元在现代建筑行业中，施工安全始终是核心关注点之一。随着科技的飞速发展，人工智能（AI）和大数据分析逐渐成为提升施工安全的重要工具。本文将探讨如何利用智能化软件和大模型API来构建高效的施工安全监测系统，并介绍一款强大的开发工具——InsCodeAIIDE的应用场景及其
智慧工地系统：建筑行业数字化变革的引领者青云智慧园区 java
在建筑行业积极迈向数字化转型的浪潮中，智慧工地系统凭借“数据驱动、智能管控、协同增效”的核心优势，深度融合物联网、大数据、人工智能等前沿技术，构建起覆盖工程项目全生命周期的精细化管理体系。以下将从系统架构、核心功能模块、应用价值以及未来展望等方面，全方位剖析智慧工地系统如何实现施工全过程的智能化、高效化管理。一、系统架构：打造一体化协同管理平台智慧工地系统采用先进的分层架构设计，以底层的数据采集层
Hive与Hudi集成：增量大数据处理方案 AI大数据智能洞察大数据与AI人工智能大数据AI应用 hive hadoop 数据仓库 ai
Hive与Hudi集成：增量大数据处理方案关键词：Hive、Hudi、增量大数据处理、数据集成、数据湖摘要：本文主要探讨了Hive与Hudi集成的增量大数据处理方案。我们将深入了解Hive和Hudi的核心概念，剖析它们之间的关系，详细阐述集成的算法原理与操作步骤，通过实际项目案例展示如何进行开发环境搭建、代码实现与解读。同时，会介绍该集成方案的实际应用场景、相关工具和资源，探讨未来发展趋势与挑战。
获取三网实时访客---无忧获客大数据无牛_abc3
很多传统行业的公司与企业对于运营商大数据的理解还是很基础的，大多数都是在买资源程度的认识。一些敢于尝试运营商大数据获客的传统企业自然会受益颇多。运营商大数据所提供的获客服务也非常简单，就是将自身的用户数据资源、针对不同的企业去制定有个性化需求的获客标准，运营商大数据根据不同的企业，和行业去进行精准客户的部署和分配，让相关合作的企业通过运营商提供的CRM平台进行一个有效的触达。运营商大数据已经在全国
DeepSeek在大数据领域正掀起一场深刻的变革智海观潮 AI 大数据 deepseek AI
随着人工智能技术的飞速发展，DeepSeek作为一款行业领先的开源大模型，正在大数据领域掀起一场深刻的变革。其强大的数据处理和分析能力，为各行业带来了新的机遇和变革，推动数据与业务的深度融合。以下是DeepSeek在大数据领域的一些典型的潜在应用：1.加速数据处理与分析流程在传统的大数据应用中，数据收集、预处理和分析往往是一个繁琐且耗时的工程。DeepSeek凭借其高效的算法和强大的计算能力，极大
IoTDB智能分析节点AINode：时序数据分析的新引擎时序数据说 iotdb 数据分析数据挖掘时序数据库数据库大数据 ai
在大数据与物联网的驱动下，时序数据处理需求激增，如何高效存储、管理并实时分析海量时序数据成为技术挑战。作为专为时序数据设计的数据库，IoTDB通过引入智能分析节点（AINode），将机器学习能力原生集成到数据库中，实现了“数据存储-分析-决策”的一体化闭环。本文将深入解析AINode的核心功能、技术优势及实际应用场景。AINode：IoTDB的智能分析引擎AINode是IoTDB推出的第三种内生节
Python爬虫【五十八章】Python数据清洗与分析全攻略：从Pandas到深度学习的异常检测进阶程序员_CLUB Python入门到进阶 python 爬虫 pandas
目录背景与需求分析第一章：结构化数据清洗实战（Pandas核心技法）1.1数据去重策略矩阵1.2智能缺失值处理体系第二章：深度学习异常检测进阶2.1自动编码器异常检测（时序数据）2.2图神经网络异常检测（关系型数据）第三章：综合案例实战案例1：金融交易反欺诈系统案例2：工业传感器异常检测第四章：性能优化与工程实践4.1大数据处理加速技巧4.2模型部署方案第五章：方法论总结与展望5.1方法论框架5.
《剑指offer》-算法篇-排序小新学习屋数据结构与算法算法 leetcode 职场和发展数据结构与算法
题目最小的K个数数组中的逆序对代码实现最小的K个数题目描述：输入n个整数，找出其中最小的K个数。例如输入4,5,1,6,2,7,3,8这8个数字，则最小的4个数字是1,2,3,4,。思路：按照各种排序算法，找到排序结果的前K个数。思路1：最简单的方案，对数组进行排序，取最小的k个思路2：借鉴快速排序的思想，找partition的基准点povit，比较povit和k值的大小思路3:大数据处理的思想，
ZooKeeper在Hadoop中的协同应用：从NameNode选主到分布式锁实现码字的字节 hadoop布道师分布式 zookeeper hadoop 分布式锁
Hadoop与ZooKeeper概述Hadoop与ZooKeeper在大数据生态系统中的核心位置和交互关系Hadoop的架构与核心组件作为大数据处理的基石，Hadoop生态系统由多个关键组件构成。其核心架构主要包含HDFS（HadoopDistributedFileSystem）和YARN（YetAnotherResourceNegotiator）两大模块。HDFS采用主从架构设计，由NameNo
优查查PROB版本使用介绍，优查查官网查询入口无忧达人
优查查最新版本PROB版本上线，优查查PROB版本的查询报告更全面，同时价格还是以前的价格，优查查大数据信用查询一次的价格是30，当然这个价格只限本文介绍的渠道，渠道我会放在文末，大家自行获取即可。优查查使用起来非常的流程，可以快速查询出来我们自身有没有信用稳定，优查查官网查询入口，每个人都可以使用优查查一键查询自己的信用，只能查询自己的信用，别人的信用是查询不了的。优查查使用入口放在文末了，划到
贝融助手要交68块钱查询是合理吗？其实是很多人搞错查询渠道了无忧达人
我们都知道查询信用的平台都是需要收费，具体的收费每个平台都是不一样的，目前行业中收费基本上都是在30-100，其中大平台的收费会低一些，因为体量大可以降低自身的营业成本，这个原理和其它行业一样。贝融助手查询大数据信用收费是30（本文介绍的渠道），这个价格得益于贝融助手平台的体量，已经把价格做的非常低了，像信用行业大平台的价格基本上都是趋于行业的平均值，太高了太低了都不是正常值。贝融助手查询入口放在
深度评测：拼多多官方返利APP vs 其他返利平台，谁更胜一筹？日常购物技巧呀
购物新宠儿！拼多多官方返利APP，引领智能返利新时代。随着科技的不断发展智能化已经成为了各个领域的发展趋势。在返利领域也不例外拼多多官方返利app凭借其强大的智能技术和创新能力正引领着智能返利新时代。这款app通过大数据分析用户行为习惯精准推送符合用户需求的商品和优惠信息。让你在享受智能化服务的同时也能获得更加精准的返利回报。在繁多的返利app中，高省app凭借其独特的优势脱颖而出，成为众多用户的
链表也能整容？聊聊‘重排链表’的那些小技巧与深层逻辑 Echo_Wish LeetCode极客营链表数据结构
“链表也能整容？聊聊‘重排链表’的那些小技巧与深层逻辑”今天我们不聊大数据，不聊AI，咱回归算法的“原点”——链表。别看它简单，里面的很多技巧在面试、在工程开发里都能救你一命。今天我就带你聊聊重排链表（ReorderList），以及它背后的思路和一些值得深挖的细节。1.先说说“重排链表”到底是啥？简单来说：给你一个单链表，比如：1->2->3->4->5要求你把它重新排列成：1->5->2->4-
朋友圈点赞也能造假？社交媒体数据欺诈识别的那些事
“朋友圈点赞也能造假？社交媒体数据欺诈识别的那些事”咱们先聊个现实点的：你刷朋友圈、微博、抖音的时候，有没有发现一些账号的点赞数、评论数特别整齐划一？要么都是那种无意义的“支持”“666”，要么一夜之间视频播放量暴涨，看着就不太对劲。其实，这背后很可能就是数据欺诈，而且这种现象在社交媒体上特别常见。作为一个做大数据分析的人，我最直观的感受就是：社交媒体上的数据从来不是完全干净的，里面水分多得很。如
好用的酒店预订软件有哪些？酒店预订哪个软件便宜好项目高省
哪个酒店预订App更省钱？想要预订酒店却担心价格过高？试试这些超值的酒店预订App吧！【美团】：专注于三四线城市，性价比超高！经济型酒店最受欢迎，但用户忠诚度稍低。【飞猪】：阿里旗下平台，依托强大系统和大数据。受年轻人喜爱，但产品同质化较突出，需注意商家管控和用户纠纷解决。要领取优惠券，我们需要使用APP或者登录官方网站。在进入APP后，我们可以通过以下几种途径来获取内部优惠券。一、直返直返的口号
大数据量查询计算引发数据库CPU告警问题复盘懒虫虫~ 业务解决方案大表治理
大数据量查询计算引发数据库CPU告警问题复盘一、背景二、根因分析三、解决方案方案1：多线程+缓存方案2：利用中间表+缓存四、总结一、背景2025年7月份某天，CDP系统每天不定时推送我们的Portal服务，生产环境运营看板会展示统计数据，发现接口响应缓慢，随之而来数据库监控告警，发现数据库CPU达到了80%。由于表数据量大，计算统计复杂，多线程使用不当，导致数据库服务器爆表。其中A表数据量达到1亿
Elasticsearch－索引原理 ouyang+
最近在参与一个基于Elasticsearch作为底层数据框架提供大数据量(亿级)的实时统计查询的方案设计工作，花了些时间学习Elasticsearch的基础理论知识，整理了一下，希望能对Elasticsearch感兴趣/想了解的同学有所帮助。同时也希望有发现内容不正确或者有疑问的地方，望指明，一起探讨，学习，进步。介绍Elasticsearch是一个分布式可扩展的实时搜索和分析引擎,一个建立在全文
结婚纪念日是婚礼当天还是领证那天？？壹刻所闻
领证日子和结婚日子大部分都是分开的，所以很多新人弄清楚结婚纪念日是需要过领证那天还是举办婚礼那天。两个日子都会有人过，不过根据大数据显示，大部分的人选择的是举办婚礼的日子。一、结婚纪念日按领证还是婚礼1、领证结婚证纪念日是按领结婚证的那一天算的。只有领了结婚证，两人才是合法夫妻关系，才能受法律保护。而举办婚礼只不过是告诉双方的亲友两人结婚了，邀请双方的亲友一起吃了顿饭罢了，不具备法律效应。如果只是
这个“看不见的问题”，才是工业数据管理的终极难题 CSDN资讯 TDengine 大数据
在谈论#工业数据管理时，我们常常会听到“4V”这样的术语，而在#大数据领域，也有类似的版本，甚至扩展成了5V、6V、乃至8V。但一个问题随之而来：这些被广泛引用的数据特征，真的代表了用户的痛点吗？真的切中了工业企业在实际应用中最棘手的挑战吗？TDengine解决方案架构师陈展隆结合自己多年服务工业客户的经验，分享了他对这个问题的深入观察与思考。或许，我们该重新思考：数据管理的“用户”到底是谁？又是
99% 的 Python 开发者都不知道的 gzip 高级用法 coder_风逝 Python数据挖掘分析 python servlet 开发语言
前言：为什么数据压缩如此重要？在当今大数据时代，数据存储和传输成本已成为每个开发者必须考虑的问题。想象一下，当你需要处理日志文件、API响应或数据库备份时，原始数据往往占用大量空间。Python内置的gzip模块提供了一种简单高效的解决方案，可以轻松将数据压缩到原大小的1/3甚至更小！本文将带你深入掌握gzip的核心用法，让你的Python程序在处理大数据时如虎添翼。1.gzip模块基础介绍gzi
Python中的 filter() | 函数详解 2401_87650616 python 开发语言
目录前言一、基本概念基本语法二、使用方式1.使用lambda函数2.使用普通函数3.使用None过滤假值三、filter()与列表推导式对比1.filter()方式2.列表推导式方式3.选择建议四、常见应用场景1.过滤偶数2.过滤空字符串3.过滤None值4.过滤质数五、注意事项与最佳实践1.惰性求值：filter()返回的是迭代器，只在需要时计算，节省内存2.性能考虑：对于大数据集，filter
Java笔记--二维数组、冒泡排序、二分法我是小废物 intellij-idea java
一把刀的锋刃很不容易越过；因此智者说得救之道是困难的--印度《吠陀经》一、二维数组1、概念学校的班每个班有很多个学生，所以，可以用数组来存储，而我们又同时有很多个大数据班。这个也应该用一个数组来存储。如何来表示这样的数据呢?Java就提供*了二维数组供我们使用。由此可见：其实二维数组其实就是一个元素为一维数组的数组。2、格式（1）格式1：数据类型[][]变量名=new数据类型[m][n];m表示这
贝融助手如何注册使用？贝融助手查询信用会上征信吗？无忧达人
贝融助手采用的是全新的智能查询体系，贝融助手针对个人及企业的一个工具，可以让你在很短的时间就可以知道自己的信用好不好，是一个体系非常完善的信用平台。贝融助手注册使用流程，第一次使用贝融助手不知道具体流程，可以接着往下看，新人也能轻松学会使用贝融助手，查询信用不需要求别人，自己就能快速查询自身信用问题，一键生成信用报告。贝融助手查询入口放在文末了，划到文章结尾就可以看到查询入口贝融助手用大数据和人工
大数据开发系列（六）----Hive3.0.0安装配置以及Mysql5.7安装配置 Xiaoyeforever hive mysql hive hadoop 数据库
一、Hive3.0.0安装配置:(Hive3.1.2有BUG）hadoop3.1.2Hive各个版本下载地址：http://archive.apache.org/dist/hive/，这里我们下载hive3.0.01、解压：tar-xzvfapache-hive-3.0.0-bin.tar.gz-C/usr/lib/JDK_2021cd/usr/lib/JDK_20212.改名称.将解压以后的文件
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round