lofe︎

Hadoop-HDFS

概述

HDFS (Hadoop Distributed File System), 它是一个文件系统, 用于存储文件, 通过目录树来定位文件 ; 其次, 它是分布式的, 由很多服务器联合起来实现其功能, 集群中的服务器有各自的角色。
使用场景 : 适合一次写入, 多次读出的场景, 且不支持文件的修改。
优点
高容错性
适合处理大数据
可构建在廉价机器之上
缺点
不适合低延时数据访问
无法高效的对大量小文件进行存储
不支持高并发写入、文件随机修改

组成架构

NameNode : 就是Master, 是一个管理者。
1. 管理HDFS的名称空间 ;
2. 配置副本策略 ;
3. 管理数据块 (Block) 映射信息 ;
4. 处理客户端读写请求。
DataNode : 就是Slave, NameNode下达命令, DataNode执行实际的操作。
1. 存储实际的数据块 ;
2. 执行数据块的读写操作。
Client : 就是客户端。
1. 文件切分。文件上传HDFS时, Client将文件切分成一个一个的Block, 然后进行上传 ;
2. 与NameNode交互, 获取文件的位置信息 ;
3. 与DataNode交互, 读取或者写入数据 ;
4. Client提供一些命令来管理HDFS, 比如NameNode格式化 ;
5. Client通过一些命令来访问HDFS, 比如对HDFS增删改操作。
SecondaryNameNode : 并非NameNode的热备。当NameNode挂掉时, 它并不能替换NameNode。
1. 辅助NameNode, 分担其工作量, 比如定期合并Fsimage和Edits, 并推送给NameNode ;
2. 在紧急情况下, 可辅助恢复NameNode。

文件块大小

HDFS中的文件在物理上是分块存储 (Block), 块的大小可以通过配置参数(dfs.blocksize)来规定, 默认Hadoop1.x版本中是64M ; Hadoop2.x版本中是128M。
如果HDFS的块设置太小, 则会增加寻址时间, 降低效率。
如果HDFS的块设置太大, 则从磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间, 导致程序在处理该块数据时, 会非常慢。
HDFS块大小的设置主要取决于磁盘传输速率。

HDFS的Shell操作

基本语法 : bin/hadoop fs 具体命令或 bin/hdfs dfs 具体命令

启动Hadoop集群 在hadoop安装目录下执行

[user01@node01 hadoop-3.1.3]$ sbin/start-dfs.sh
[user01@node02 hadoop-3.1.3]$ sbin/start-yarn.sh

输出该命令参数 -help

[user01@node01 hadoop-3.1.3]$ hdfs dfs -help rm

显示目录信息 -ls [-C] [-d] [-h] [-q] [-R] [-t] [-S] [-r] [-u] [-e] [
…]
```
[user01@node01 hadoop-3.1.3]$ hdfs dfs -ls /
```

创建目录 -mkdir [-p] …

[user01@node01 hadoop-3.1.3]$ hdfs dfs -mkdir -p /test

从本地剪切到HDFS -moveFromLocal …

[user01@node01 hadoop-3.1.3]$ hdfs dfs -moveFromLocal ./test.txt /test/test.txt

从本地拷贝到HDFS -copyFromLocal [-f] [-p] [-l] [-d] [-t ] …

[user01@node01 hadoop-3.1.3]$ hdfs dfs -copyFromLocal ./test2.txt /test/test2.txt

从本地拷贝到HDFS -put [-f] [-p] [-l] [-d] …

[user01@node01 hadoop-3.1.3]$ hdfs dfs -put ./test4.txt /test/

从HDFS下载文件到本地 -get [-f] [-p] [-ignoreCrc] [-crc] …

[user01@node01 hadoop-3.1.3]$ hdfs dfs -get /test/test.txt ./

合并下载多个文件 -getmerge [-nl] [-skip-empty-file]

[user01@node01 hadoop-3.1.3]$ hdfs dfs -getmerge /test/* ./test3.txt

从HDFS拷贝到本地 -copyToLocal [-f] [-p] [-ignoreCrc] [-crc] …

[user01@node01 hadoop-3.1.3]$ hdfs dfs -copyToLocal /test/test2.txt ./

在HDFS中, 从一个路径拷贝到另一个路径 -cp [-f] [-p | -p[topax]] [-d]
…
```
[user01@node01 hadoop-3.1.3]$ hdfs dfs -cp /test/test2.txt /test2/test3.txt
```

在HDFS中, 移动文件 -mv …

[user01@node01 hadoop-3.1.3]$ hdfs dfs -mv /test/test.txt /test2/

追加一个文件到HDFS已经存在的文件末尾 -appendToFile …

[user01@node01 hadoop-3.1.3]$ hdfs dfs -appendToFile ./test.txt /test/test.txt

显示文件内容 -cat [-ignoreCrc] …

[user01@node01 hadoop-3.1.3]$ hdfs dfs -cat /test/test.txt

修改文件所属权限 -chgrp -chmod -chown

[user01@node01 hadoop-3.1.3]$ hdfs dfs -chmod 777 /test/test.txt
[user01@node01 hadoop-3.1.3]$ hfds dfs -chown user02:user02 /test/test.txt
[user01@node01 hadoop-3.1.3]$ hdfs dfs -chgrp group01 /test/test.txt

显示一个文件的末尾 -tail [-f] [-s ]

[user01@node01 hadoop-3.1.3]$ hdfs dfs -tail /test/test4.txt

删除文件或文件夹 -rm [-f] [-r|-R] [-skipTrash] [-safely]
…
```
[user01@node01 hadoop-3.1.3]$ hdfs dfs -rm /test/test.txt
```

删除空目录 -rmdir [–ignore-fail-on-non-empty] …

[user01@node01 hadoop-3.1.3]$ hdfs dfs -rmdir /test3

统计文件夹的大小信息 -du [-s] [-h] [-v] [-x] …

-s 显示所有总大小
-h 以人类可读的方式格式化文件的大小，而不是字节数
-v 选项显示标题行
-x 不包括快照

[user01@node01 hadoop-3.1.3]$ hdfs dfs -du -s -h /test

设置HDFS中文件的副本数(最终取决于节点数量) -setrep [-R] [-w]
…
```
[user01@node01 hadoop-3.1.3]$ hdfs dfs -setrep 5 /test/test.txt
```

HDFS客户端操作

首先, 需在Windows中配置Hadoop的环境变量

创建一个Maven工程
导入依赖

<dependencies>
    <dependency>
        <groupId>junit</groupId>
        <artifactId>junit</artifactId>
        <version>4.12</version>
    </dependency>
    <dependency>
        <groupId>org.apache.logging.log4j</groupId>
        <artifactId>log4j-slf4j-impl</artifactId>
        <version>2.12.0</version>
    </dependency>
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-client</artifactId>
        <version>3.1.3</version>
    </dependency>
</dependencies>

添加日志 : 在src/main/resources目录下, 新建一个文件, 命名为 “log4j2.xml” , 在文件中填入 ↓

<?xml version="1.0" encoding="UTF-8"?>
<Configuration status="error" strict="true" name="XMLConfig">
    <Appenders>
        <!-- 类型名为Console，名称为必须属性 -->
        <Appender type="Console" name="STDOUT">
            <!-- 布局为PatternLayout的方式，
            输出样式为[INFO] [2018-01-22 17:34:01][org.test.Console]I'm here -->
            <Layout type="PatternLayout"
                    pattern="[%p] [%d{yyyy-MM-dd HH:mm:ss}][%c{10}]%m%n" />
        </Appender>
    </Appenders>
    
    <Loggers>
        <!-- 可加性为false -->
        <Logger name="test" level="info" additivity="false">
            <AppenderRef ref="STDOUT" />
        </Logger>

        <!-- root loggerConfig设置 -->
        <Root level="info">
            <AppenderRef ref="STDOUT" />
        </Root>
    </Loggers>
</Configuration>

HDFS文件下载

@Test
public void testCopyToLocal() throws URISyntaxException, IOException, InterruptedException {
    //1. 获取文件系统
    URI uri = new URI("hdfs://LIFE:9820");
    Configuration conf = new Configuration();
    FileSystem fileSystem = FileSystem.get(uri, conf, "atguigu");
    //2. 下载操作
    // boolean delSrc 指是否将原文件删除
    // Path src 指要下载的文件路径
    // Path dst 指将文件下载到的路径
    // boolean useRawLocalFileSystem 是否开启文件校验
    fileSystem.copyToLocalFile(false, new Path("/test.txt"),
            new Path("e:/test.txt"), true);
    //3. 关闭资源
    fileSystem.close();
}

HDFS文件夹删除

@Test
public void testDelete() throws URISyntaxException, IOException, InterruptedException {
    //1. 获取文件系统
    URI uri = new URI("hdfs://LIFE:9820");
    Configuration conf = new Configuration();
    FileSystem fileSystem = FileSystem.get(uri, conf, "atguigu");
    //2. 删除操作
    fileSystem.delete(new Path("/test/test.txt"), true);
    //3. 关闭资源
    fileSystem.close();
}

HDFS文件名更改/移动

@Test
public void testRename() throws URISyntaxException, IOException, InterruptedException {
    //1. 获取文件系统
    URI uri = new URI("hdfs://LIFE:9820");
    Configuration conf = new Configuration();
    FileSystem fileSystem = FileSystem.get(uri, conf, "atguigu");
    //2. 修改文件名
    fileSystem.rename(new Path("/test/test.txt"), new Path("/test/test4.txt"));
    //3. 关闭资源
    fileSystem.close();
}

HDFS文件详情查看

@Test
public void testListFiles() throws URISyntaxException, IOException, InterruptedException {
    //1. 获取文件系统
    URI uri = new URI("hdfs://LIFE:9820");
    Configuration conf = new Configuration();
    FileSystem fileSystem = FileSystem.get(uri, conf, "atguigu");
    //2. 获取文件详情
    RemoteIterator<LocatedFileStatus> listFiles = fileSystem.listFiles(new Path("/"), true);
    // 输出详情
    while (listFiles.hasNext()) {
        LocatedFileStatus status = listFiles.next();
        // 文件名
        System.out.println(status.getPath().getName());
        // 长度
        System.out.println(status.getLen());
        // 权限
        System.out.println(status.getPermission());
        // 分组
        System.out.println(status.getGroup());
        // 获取存储的块信息
        BlockLocation[] blockLocations = status.getBlockLocations();
        for (BlockLocation blockLocation : blockLocations) {
            // 获取块存储的主机节点
            String[] hosts = blockLocation.getHosts();
            for (String host : hosts) {
                System.out.println(host);
            }
        }
        System.out.println("------------- 分割线 ---------------");
    }
    //3. 关闭资源
    fileSystem.close();
}

HDFS文件和文件夹判断

@Test
public void testListStatus() throws URISyntaxException, IOException, InterruptedException {
    //1. 获取文件系统
    URI uri = new URI("hdfs://LIFE:9820");
    Configuration conf = new Configuration();
    FileSystem fileSystem = FileSystem.get(uri, conf, "atguigu");
    //2. 判断是文件还是文件夹
    FileStatus[] fileStatuses = fileSystem.listStatus(new Path("/"));
    for (FileStatus fileStatus : fileStatuses) {
        // 如果是文件
        if(fileStatus.isFile()){
            System.out.println("file:" + fileStatus.getPath().getName());
        }else{
            System.out.println("dire:" + fileStatus.getPath().getName());
        }
    }
    //3. 关闭资源
    fileSystem.close();
}

HDFS的数据流

HDFS写数据流程

客户端通过Distributed FileSystem模块向NameNode请求上传文件，NameNode检查目标文件是否已存在，父目录是否存在。
NameNode返回是否可以上传。
客户端请求第一个 Block上传到哪几个DataNode服务器上。
NameNode返回3个DataNode节点，分别为dn1、dn2、dn3。
客户端通过FSDataOutputStream模块请求dn1上传数据，dn1收到请求会继续调用dn2，然后dn2调用dn3，将这个通信管道建立完成。
dn1、dn2、dn3逐级应答客户端。
客户端开始往dn1上传第一个Block（先从磁盘读取数据放到一个本地内存缓存），以Packet为单位，dn1收到一个Packet就会传给dn2，dn2传给dn3；dn1每传一个packet会放入一个应答队列等待应答。
当一个Block传输完成之后，客户端再次请求NameNode上传第二个Block的服务器。（重复执行3-7步）。

网络拓扑 - 节点距离计算

在HDFS写数据的过程中，NameNode会选择距离待上传数据最近距离的DataNode接收数据。这个最近距离为 :
两个节点到达最近的共同祖先的距离总和。

机架感知

机架感知说明
http://hadoop.apache.org/docs/r3.1.3/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html#Data_Replication

For the common case, when the replication factor is three, HDFS’s
placement policy is to put one replica on the local machine if the
writer is on a datanode, otherwise on a random datanode, another
replica on a node in a different (remote) rack, and the last on a
different node in the same remote rack.

对于常见情况，当副本数为3时，HDFS的放置策略是，如果writer位于datanode上，则将一个副本放在本地机器上，否则将另一个副本放在另一个(远程)机架上的节点上。

Hadoop3.1.3副本节点选择

第一个副本在Client所处的节点上。如果客户端在集群外, 则随机选择一个。
第二个副本在另一个机架的随机一个节点。
第三个副本在第二个副本所在机架的随机节点。

HDFS的读数据流程

客户端通过Distributed FileSystem向NameNode请求下载文件，NameNode通过查询元数据，找到文件块所在的DataNode地址。
挑选一台DataNode（就近原则，然后随机）服务器，请求读取数据。
DataNode开始传输数据给客户端（从磁盘里面读取数据输入流，以Packet为单位来做校验）。
客户端以Packet为单位接收，先在本地缓存，然后写入目标文件。

NameNode和SecondaryNameNode工作机制

由于NameNode的元数据是存储在内存中的, 故存在元数据丢失的风险, 因此会在磁盘中备份元数据的FsImage(镜像文件)。当内存中的元数据更新时, 如果同时更新FsImage, 就会导致效率过低, 但如果不更新, 就会发生数据一致性问题, 一旦NameNode节点断电, 就会产生数据丢失。因此, 引入Edits(编辑日志)文件 (只作追加操作, 效率很高) , 每当元数据有更新或者添加元数据时, 修改内存中的元数据并追加到Edits中。但是随着时间延长, 会导致Edits文件数据过大, 效率降低, 而且一旦断电, 恢复元数据需要的时间过长。因此, 需要定期进行FsImage和Edits的合并, 如果这个操作由NameNode节点完成, 则会导致NameNode节点压力过大, 工作效率降低, 因此, 引入一个新的节点SecondaryNameNode, 专门用于对FsImage和Edits的合并。

第一阶段 : NameNode启动
1. 第一次启动NameNode格式化后, 创建FsImage和Edits文件。如果不是第一次启动, 直接加载编辑日志和镜像文件到内存并生成一个空的edits.inprogress文件。
2. 客户端对元数据进行增删改的请求。
3. NameNode记录操作日志, 并更新滚动Edits。
4. NameNode在内存中对元数据进行增删改。
第二阶段 : SecondaryNameNode工作
1. SecondaryNameNode询问NameNode是否需要CheckPoint。带回NameNode是否检查的结果。
  – 触发CheckPoint需要满足两个条件中的任意一个, 到大定时时间或 Edits中数据量到达指定峰值。
2. SecondaryNameNode请求执行CheckPoint。
3. NameNode滚动正在写的Edits日志。
4. 将滚动前的编辑日志和镜像文件拷贝到SecondaryNameNode。
5. SecondaryNameNode加载编辑日志和镜像文件到内存, 并合并。
6. 生成新的镜像文件fsimage.chkpoint。
7. 拷贝fsimage.chkpoint到NameNode。
8. NameNode将fsimage.chkpoint重命名为fsimage。

NameNode被格式化后, 将在$HADOOP_HOME/data/tmp/dfs/name/current目录下产生如下文件

	fsimage_00000000000000000000
	fsimage_00000000000000000000.md5
	seen_txid
	VERSION

FsImage : HDFS文件系统元数据的一个永久性检查点, 其中包含HDFS文件系统的所有目录文件iNode的序列化信息。
Edits : 存放HDFS文件系统的所有的增删改操作。
seen_txid文件保存的是一个数字, 就是最后一个edits_的数字。

- oiv 查看FsImage文件

hdfs oiv -p 文件类型 -i 镜像文件 -o 转换后文件输出路径
hdfs oiv -p XML -i $HADOOP_HOME/data/tmp/dfs/name/current/fsimage_000000000000000025 -o $HADOOP_HOME/fsimage.xml

- oev 查看Edits文件

hdfs oev -p 文件类型 -i 编制日志 -o 转换后文件输出路径
hdfs oev -p XML -i $HADOOP_HOME/data/tmp/dfs/name/current/edits_000000000000000000012_00000000000000000013 -o $HADOOP_HOME/edits.xml

- CheckPoint时间设置
通常情况下, SecondaryNameNode每一小时执行一次。
[hdfs-default.xml]

	<property>
		<name>dfs.namenode.checkpoint.period</name>
		<value>3600</value>
	</property>

一分钟检查一次操作次数, 当操作次数达到1百万时, SecondaryNameNode执行一次。

	<property>
		<name>dfs.namenode.checkpoint.txns</name>
		<value>1000000</value>
		<description>操作动作次数</description>
	</property>
	<property>
		<name>dfs.namenode.checkpoint.check.period</name>
		<value>60</value>
		<description> 1分钟检查一次操作次数</description>
	</property >

集群安全模式

1、NameNode启动
NameNode启动时，首先将镜像文件（Fsimage）载入内存，并执行编辑日志（Edits）中的各项操作。一旦在内存中成功建立文件系统元数据的映像，则创建一个新的Fsimage文件和一个空的编辑日志。此时，NameNode开始监听DataNode请求。这个过程期间，NameNode一直运行在安全模式，即NameNode的文件系统对于客户端来说是只读的。
2、DataNode启动
系统中的数据块的位置并不是由NameNode维护的，而是以块列表的形式存储在DataNode中。在系统的正常操作期间，NameNode会在内存中保留所有块位置的映射信息。在安全模式下，各个DataNode会向NameNode发送最新的块列表信息，NameNode了解到足够多的块位置信息之后，即可高效运行文件系统。
3、安全模式退出判断
如果满足“最小副本条件”，NameNode会在30秒钟之后就退出安全模式。所谓的最小副本条件指的是在整个文件系统中99.9%的块满足最小副本级别（默认值：dfs.replication.min=1）。在启动一个刚刚格式化的HDFS集群时，因为系统中还没有任何块，所以NameNode不会进入安全模式。

查看安全模式状态 bin/hdfs dfsadmin -safemode get
进入安全模式状态 bin/hdfs dfsadmin -safemode enter
离开安全模式状态 bin/hdfs dfsadmin -safemode leave
等待安全模式状态 bin/hdfs dfsadmin -safemode wait

NameNode多目录配置

NameNode的本地目录可以配置成多个，且每个目录存放内容相同，增加了可靠性

具体配置如下
（1）在hdfs-site.xml文件中修改如下内容

	
	    dfs.namenode.name.dir</name>
		file:///${hadoop.tmp.dir}/name1,file:///${hadoop.tmp.dir}/name2</value>
	</property>

（2）停止集群，删除data和logs中所有数据。

	[user01@node01 hadoop-3.1.3]$ rm -rf data/ logs/
	[user01@node01 hadoop-3.1.3]$ rm -rf data/ logs/
	[user01@node01 hadoop-3.1.3]$ rm -rf data/ logs/

（3）格式化集群并启动。

	[user01@node01 hadoop-3.1.3]$ bin/hdfs namenode –format
	[user01@node01 hadoop-3.1.3]$ sbin/start-dfs.sh

DataNode工作机制

一个数据块在DataNode上以文件形式存储在磁盘上, 包括两个文件, 一个是数据本身, 一个是元数据, 包括数据块的长度, 块数据的校验和, 以及时间戳。
DataNode启动后会想NameNode注册, 通过后, 周期性(1小时)的向NameNode上报所有块信息。
每3秒钟心跳一次, 心跳返回结果带有NameNode的命令。如果超过10分钟NameNode没有收到某个DataNode的心跳, 则认为该节点不可用。
集群运行中可以安全加入和退出一些机器。
DataNode节点保证数据完整性的方法 ---- 校验和
当DataNode读取Block时, 它会计算CheckSum(校验和)。
如果计算后的CheckSum, 与Block创建时的值不一样, 说明Block已经损坏。
Client读取其他DataNode上的Block。
常见的校验和算法crc(32)、md5(128)、sha1(160)
DataNode在其文件创建后周期性验证CheckSum。
DataNode掉线时限参数设置
1、DataNode进程死亡或者网络故障造成DataNode无法与NameNode通信
2、NameNode不会立即把该节点判定为死亡，要经过一段时间，这段时间暂称作超时时长。
3、HDFS默认的超时时长为10分钟+30秒。
4、如果定义超时时间为TimeOut，则超时时长的计算公式为：
TimeOut = 2 × dfs.namenode.heartbeat.recheck-interval + 10 × dfs.heartbeat.interval。
而默认的dfs.namenode.heartbeat.recheck-interval 大小为5分钟，dfs.heartbeat.interval默认为3秒。
hdfs-site.xml 配置文件中的heartbeat.recheck.interval的单位为毫秒，dfs.heartbeat.interval的单位为秒。
```
    dfs.namenode.heartbeat.recheck-interval</name>
    300000</value>
</property>

    dfs.heartbeat.interval</name>
    3</value>
</property>
```

服役新DataNode节点

首先准备新DataNode节点。
在当前DataNode基础上克隆一台新节点, 修改IP地址和主机名称。
删除原来HDFS文件系统留存的文件($HADOOP_HOME/data和log)
source /etc/profile

在新节点启动DataNode, 即可关联到集群

[user01@node04 hadoop-3.1.3]$ hdfs --daemon start datanode
[user01@node04 hadoop-3.1.3]$ yarn --daemon start nodemanager

如果数据不均衡, 可以用命令实现集群的再平衡。

[user01@node01 hadoop-3.1.3]$ sbin/start-balancer.sh

退役旧DataNode节点
白名单用于确定允许访问NameNode的DataNode节点，内容配置一般与workers文件内容一致。黑名单用于在集群运行过程中退役DataNode节点。

添加白名单和黑名单
添加到白名单的主机节点，都允许访问NameNode，不在白名单的主机节点，都会被直接退出。
添加到黑名单的主机节点，不允许访问NameNode，会在数据迁移后退出。
(1) 在NameNode的$HADOOP_HOME/etc/hadoop目录下创建whitelist和blacklist
(2) 在whitelist中添加当前集群正常工作的节点, 黑名单暂时为空。
```
node01
node02
node03
node04
```
(3) 在NameNode的hdfs-site.xml配置文件中增加dfs.hosts配置
```
	dfs.hosts</name>
	/opt/module/hadoop-3.1.3/etc/hadoop/whitelist</value>
</property>

	dfs.hosts.exclude</name>
	/opt/module/hadoop-3.1.3/etc/hadoop/blacklist</value>
</property>
```
(4) 将hdfs-site.xml配置文件分发至所有DataNode节点
(5) 重新启动集群
黑名单退役 : 会有数据迁移 [推荐]
(1) 编辑blacklist文件, 添加要退役的DataNode节点。
```
node04
```
(2) 刷新NameNode和NodeManager状态
```
hdfs dfsadmin -refreshNodes
yarn dfsadmin -refreshNodes
```
白名单退役 : 直接抛弃节点, 没有数据迁移[不推荐]
(1) 编译whitelist文件, 将node04删除, 保留正常节点。
(2) 刷新NameNode
```
hdfs dfsadmin -refreshNodes
```

DataNode多目录配置

DataNode也可以配置成多个目录，每个目录存储的数据不一样。即：数据不是副本

具体配置如下
（1）在hdfs-site.xml中修改如下内容:


	dfs.datanode.data.dir</name>
	file:///${hadoop.tmp.dir}/data1,file:///${hadoop.tmp.dir}/data2</value>
</property>

（2）停止集群，删除data和logs中所有数据。

[user01@node01 hadoop-3.1.3]$ rm -rf data/ logs/
[user01@node01 hadoop-3.1.3]$ rm -rf data/ logs/
[user01@node01 hadoop-3.1.3]$ rm -rf data/ logs/

（3）格式化集群并启动。

[user01@node01 hadoop-3.1.3]$ bin/hdfs namenode –format
[user01@node01 hadoop-3.1.3]$ sbin/start-dfs.sh

HDFS小文件存档

一个文件块会占用NameNode150字节的内存。当HDFS中存入大量小文件时, 磁盘存储效率降低, 且会耗尽NameNode大量内存。
解决方法一 : 采用har归档方式，将小文件归档
HDFS存档文件或HAR文件，是一个更高效的文件存档工具，它将文件存入HDFS块，在减少NameNode内存使用的同时，允许对文件进行透明的访问。具体说来，HDFS存档文件对内还是一个一个独立文件，对NameNode而言却是一个整体，减少了NameNode的内存。

需要启动yarn进程
归档文件
把/user/atguigu/input目录里面的所有文件归档成一个叫input.har的归档文件，并把归档后文件存储到/user/atguigu/output路径下。
[use01@node01 hadoop-3.1.3]$ bin/hadoop archive -archiveName input.har –p /user/input /user/output
查看归档文件
[use01@node01 hadoop-3.1.3]$ hadoop fs -lsr /user/output/input.har
[use01@node01 hadoop-3.1.3]$ hadoop fs -lsr har:///user/output/input.har
解归档文件
[use01@node01 hadoop-3.1.3]$ hadoop fs -cp har:/// user/output/input.har/* /user/test
解决方法二 : 采用CombineTextInputFormat
未完…
解决方法三 : 开启JVM重用
如果没有小文件，不要开启JVM重用，因为会一直占用使用到的task卡槽，直到任务完成才释放。
JVM重用可以使得JVM实例在同一个job中重新使用N次，N的值可以在Hadoop的mapred-site.xml文件中进行配置。通常在10-20之间
```
    mapreduce.job.jvm.numtasks</name>
    10</value>
    How many tasks to run per jvm,if set to -1 ,there is no limit</description>
</property>
```
未完…

你可能感兴趣的:(Hadoop-HDFS)

python 大数据框架-马士兵python大数据和java架构 weixin_39938724
hadoop-大数据启蒙-初识HDFS【回放】hadoop-大数据启蒙-初识HDFS(6月11日20:00-22:00)免费试学02hadoop-HDFS理论基础读写流程【回放】hadoop-HDFS理论基础读写流程(6月13日20:00-22:00)免费试学03hadoop-HDFS集群搭建-伪分布式模式【回放】hadoop-HDFS集群搭建-伪分布式模式(6月16日20:00-22:00)04
hadoop-HDFS操作 wenying_44323744 hadoop hdfs eclipse
1.使用的是hadoop的用户登录到系统，那么cd~是跳转到/home/hadoop下。2.在操作hdfs时，需要在hadoop用户下的/usr/local/hadoop，此时是在根目录下。cd/usr/local/hadoop或者cd/cdusr/local/hadoop3.回到Linux的操作目录我们把安装包放在了linux系统下的Downloads文件下，可以sudotar-zxf~/Dow
Ubuntu下配置安装Hadoop 2.2 weixin_30501857 大数据 java 运维
---恢复内容开始---这两天玩Hadoop，之前在我的Mac上配置了好长时间都没成功的Hadoop环境，今天想在win7虚拟机下的Ubuntu12.0464位机下配置，然后再建一个组群看一看。参考资料：1.InstallingsinglenodeHadoop2.2.0onUbuntu：http://bigdatahandler.com/hadoop-hdfs/installing-single-
hadoop-hdfs系统构成 weixin_33701564 大数据 python 操作系统
2019独角兽企业重金招聘Python工程师标准>>>HDFS组成1)NameNode元数据2)DataNode存储文件内容block3)SecondaryNameNode合并NameNode与editsHDFS缺点1)不能低延迟访问2)小文件存取占用大量NameNode内存空间寻道时间超过读取时间3)并发写入,文件随机修改一个文件只能有一个写着仅支持appendHDFS存储数据单元1)文件被切分
hadoop-HDFS 炽热_3a57
1.详情1.架构图在这里插入图片描述2.读写的流程图在这里插入图片描述2.操作1.使用MAVEN集成对应的jar包org.apache.hadoophadoop-common2.7.1org.apache.hadoophadoop-hdfs2.7.12.java代码实现//强制加载hadoop.dllwindows//System.load("F:\\hadoop\\bin\\hadoop.dll
Hadoop-HDFS的DataNode介绍及原理魔笛Love hadoop 大数据
DataNodeDataNode工作机制1、一个数据块在DataNode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据包括数据块的长度,块数据的校验和,以及时间戳。2、DataNode启动后向NameNode注册,通过后,周期性(1小时)的向NameNode上报所有的块信息。3、心跳是每3秒一次,心跳返回结果带有NameNode给该DataNode的命令如复制块数据到另一台机
hadoop-hdfs-site.xml配置文件详解许喜朝笔记 hdfs hadoop
hadoop:hdfs-site.xml配置文件详解hdfs-site.xml配置文件j介绍hadoop-hdfs相关的配置信息hdfs-site.xml配置文件namevaluedescriptionhadoop.hdfs.configuration.version1versionofthisconfigurationfiledfs.namenode.logging.levelinfoThelo
Hadoop-HDFS写流程（从命令行到完成）隔着天花板看星星 hadoop hdfs 大数据
一、简单回顾下HDFS的架构如果不了解HDFS的可以看下我写的一篇博客，这里先贴下官网架构图：二、源码分析源码中写的肯定是最真实的，下面是hadoop官方源码下载地址，我下载的是hadoop-3.2.4，那就一起来看下吧Indexof/dist/hadoop/core1、命令行我们以命令行向HDFS上传一份数据为例，即：hadoopfs-puttest.txt/user/hhs/test_dir我
Hadoop-HDFS高可用隔着天花板看星星 hadoop hdfs 大数据
一、说明在我的博客中已经包含了HDFS高可用的搭建，这里描述下它的原理。原理参考官网介绍：ApacheHadoop3.3.6–HDFSHighAvailabilityUsingtheQuorumJournalManager二、背景在Hadoop2.0.0之前，NameNode是HDFS集群中的单点故障（SPOF）。每个集群只有一个NameNode，如果NameNode节点发生故障会导致整个集群不可
Hadoop-HDFS读流程（从输入命令到回显）隔着天花板看星星 hadoop hdfs 大数据
一、简单回顾下HDFS的架构如果不了解HDFS的可以看下我写的一篇博客，这里先贴下官网架构图：二、静静的思考一会儿爱因斯坦说过：想象力比知识更重要。想象力推动世界，是知识进化的源泉。我们先不看源码，先通过官方架构图和我们对HDFS的了解来想象下读流程是什么样的。我要读HDFS上的一份文件，首先需要知道它在哪台节点上，HDFS上存储的文件都是以块的形式存放在各个DataNode节点上。因此需要知道这
大数据集群增加数据盘，平衡数据盘HDFS Disk Balancer 墨卿风竹大数据 hdfs hadoop Disk Balancer
大数据集群增加数据盘，平衡数据盘HDFSDiskBalancer官网：https://hadoop.apache.org/docs/r3.3.6/hadoop-project-dist/hadoop-hdfs/HDFSDiskbalancer.htmlhdfsdiskbalancer-execute/system/diskbalancer/nodename.plan.jsonhdfsdiskbal
hadoop-hdfs简介及常用命令详解（超详细）大数据魔法师大数据 hadoop hdfs 大数据
文章目录前言一、HDFS概述1.HDFS简介2.HDFS架构3.HDFS文件操作二、HDFS命令介绍1.hdfs命令简介2.HDFS命令的基本语法3.常用的HDFS命令选项三、HDFS常用命令1.列出指定路径下的文件和目录。2.创建一个新的目录。3.将本地文件或目录上传到HDFS。4.从HDFS下载文件或目录到本地文件系统。5.删除HDFS中的文件或目录。6.移动文件或目录。7.显示文件的内容。8
Hadoop-HDFS详解与HA，完全分布式集群搭建(细到令人发指的教程) 毫无感情的dj hadoop hdfs 大数据分布式 zookeeper
前言本篇篇幅较长，有许多集群搭建干货，和枯燥乏味但是面试可能问到的理论知识。思来想去不知道怎样才能鼓励自己加油学习，想想要面对的生活还是假吧意思打开学习视频吧。目录一、引入hdfs是什么hdfs的由来hdfs架构体系hdfs的优缺点优点缺点二、HDFS_block简介和注意事项Block拆分标准三、HDFS_block安全与管理Block数据安全Block的管理效率四、HDFS_Hadoop3完全
Hadoop-HDFS角色工作机制 H.S.T不想卷大数据 hadoop hdfs 大数据
一、角色职责介绍 HadoopDistributedFileSystem(HDFS,分布式文件系统):HDFS是Hadoop应用程序使用分布式存储，HDFS集群主要由管理文件系统元数据的NameNode和存储实际数据的DataNode组成。 1、NameNode【主角色】职责特征：NameNode仅存储HDFS的元数据，文件系统中的所有文件的目录树，并跟踪整个集群中的文件，不存储实际数据；Nam
大数据Hadoop-HDFS_架构、读写流程大沙头三马路 BigDate Linux 大数据 hadoop hdfs HCIA
大数据Hadoop-HDFS基本系统架构HDFS架构包含三个部分：NameNode，DataNode，Client。NameNode：NameNode用于存储、生成文件系统的元数据。运行一个实例。DataNode：DataNode用于存储实际的数据，将自己管理的数据块上报给NameNode，运行多个实例。Client：支持业务访问HDFS，从NameNode,DataNode获取数据返回给业务。多
大数据-hadoop-hdfs 像影子追着光梦游_ 大数据 hadoop hdfs
Hadoop分布式文件系统(HDFS)是指被设计成适合运行在通用硬件(commodityhardware)上的分布式文件系统（DistributedFileSystem）。它和现有的分布式文件系统有很多共同点。但同时，它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统，适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问，非常适合大规模数据集上的应用。HDFS放宽了一部
Python大数据之linux学习总结——day10_hadoop原理笨小孩124 Hadoop 学习总结大数据 python linux
Hadoop原理Hadoop基础分布式和集群Hadoop框架概述生态圈版本更新hadoop架构[重点]官方示例圆周率练习词频统计[重点]需求:步骤:Hadoop-HDFS特点hdfs架构块和副本shell命令Hive环境准备[重点]前提启动hadoop集群启动hdfs和yarn集群启动mr历史服务检查服务配置Hive环境变量回顾shell脚本执行方式配置环境变量先启动hive服务知识点:示例:再连
大数据之hadoop-hdfs知识通俗详解 shw12357 hadoop
目录疑问存储模型（重要）架构设计角色功能NameNodeDataNode元数据持久化安全模式HDFS中的SNNSecondaryNameNode（SNN）Block的副本放置策略HDFS写流程HDFS读流程总结疑问分布式文件系统那么多，为什么hadoop项目中还要开发一个hdfs文件系统？存储模型（重要）文件线性按字节切割成块(block)，具有offset，id文件与文件的block大小可以不一
大数据之hadoop-hdfs完全分布式环境搭建（详细步骤真实可用） shw12357 hadoop 大数据
1，服务器规划本次服务搭建是在原有伪分布式的基础上进行搭建，伪分布式的搭建，参照伪分布式搭建节点NNSNNDNnode01※––node02※※node03––※node04––※2，基础设施jps检查jdk1.8安装，检查网络是否正常，配置hostvim/etc/hosts10.0.0.11node0110.0.0.12node0210.0.0.13node0310.0.0.14node04[r
大数据之hadoop-hdfs伪分布式环境搭建（详细步骤真实可用） shw12357 hadoop
目录版本1，基础设施2，Hadoop的配置（应用的搭建过程）3，启动4，简单使用5，上传自定义块的大小版本centos7+jdk1.8+hadoop2.6.51，基础设施设置网络：vi/etc/sysconfig/network-scripts/ifcfg-ens33TYPE="Ethernet"PROXY_METHOD="none"BROWSER_ONLY="no"DEFROUTE="yes"I
大数据-hadoop入门与部署 Ybb_studyRecord 大数据 hadoop 大数据分布式安装
大数据-hadoop入门与部署大数据-hadoop入门与部署启蒙分治思想单机处理大数据问题集群分布式处理大数据的辩证HadoopHadoop项目/生态hadoop-hdfs存储模型架构设计角色功能元数据持久化安全模式HDFS中的SNN副本放置策略读写流程HDFS写流程HDFS读流程持久化机制用法部署基础设施部署配置初始化运行命令行使用伪分布式:(单一节点)完全分布式:(四节点)大数据-hadoop
Hadoop-HDFS架构与设计临江蓑笠翁大数据 #Hadoop hadoop hdfs 架构
HDFS架构与设计一、背景和起源二、HDFS概述1.设计原则1.1硬件错误1.2流水访问1.3海量数据1.4简单一致性模型1.5移动计算而不是移动数据1.6平台兼容性2.HDFS适用场景3.HDFS不适用场景三、HDFS架构图1.架构图2.Namenode3.Datanode四、HDFS数据存储1.数据块存储2.副本机制五、元数据持久化1.Namenode元数据2.元数据过程3.元数据checkp
大数据学习路线+Java转行大数据最新最全的必备第一手资料大数据客栈i
系统每天关注上限100人1:为了防止关注人数上限，私信收不到，2:私信发网盘链接失效，)3:为了加人气，需要以下，Python，大数据,架构等资料的朋友！免费送给前100评论留言者。私信小编，小编微信，发给你网盘链接，手慢无！学习路线：（一）Linux理论（Linux基础Linux-shell编程高并发:lvs负载均衡高可用&反向代理）（二）Hadoop理论（hadoop-hdfs理论hadoop
Hadoop-HDFS的NameNode和SecondaryNameNode介绍及原理魔笛Love hadoop 大数据
NameNode和SecondaryNameNodeNN和2NN的工作机制NameNode中的元数据是存储：首先,我们做个假设,如果存储在NameNode节点的磁盘中,因为经常需要进行随机访问,还有响应客户请求,必然是效率过低。因此,元数据需要存放在内存中。但如果只存在内存中,一旦断电,元数据丢失,整个集群就无法工作了。因此产生在磁盘中备份元数据的FsImage。这样又会带来新的问题,当在内存中的
3 Hadoop-HDFS PhoenixLuo· 大数据 hadoop hdfs 大数据
目录3.1Apache版本Hadoop重新编译3.1.1为什么要编译Hadoop3.1.2编译环境的准备3.2Hadoop安装3.2.1上传apacheHadoop包并压缩3.2.2修改配置文件3.2.3配置Hadoop的环境3.2.4启动集群3.3Hadoop核心-HDFS3.3.1HDFS概述3.3.2HDFS应用场景适合的应用场景不适合的应用场景3.3.3HDFS架构3.3.4NameNod
大数据技术之Hadoop-HDFS架构只要学不死就往死里学-致自己大数据技术之Hadoop
大数据技术之Hadoop-HDFS架构官方网站简介假设与目标硬件故障流式数据访问大数据集简单一致性模型“移动计算比移动数据便宜”跨异构硬件和软件平台的可移植性NameNode和DataNodes文件系统命名空间数据副本第一步：副本的放置副本的选择安全模式文件系统元数据的持久化通讯协议可靠性数据磁盘故障，心跳和复制集群的再平衡数据的完整性元数据磁盘的故障快照数据组织数据块复制管道辅助功能FS脚本DF
Hadoop-HDFS 基础回顾码虫码农 hadoop
一.blockHDFS作为一种文件系统，当然也需要有‘block’的概念。不过HDFS的block一般比较大，默认为128MB。与普通的管理单个磁盘的文件系统一样，HDFS也将文件分割成block，每个block都作为一个独立的单元分别保存。不同点在于，在HDFS中，小于block的文件不会占用一个block的空间。（比如，文件大小为1MB，那么它会占用一个HDFS的block，但是只使用底层磁盘
大数据之Hadoop-HDFS jackyan163 大数据大数据 hadoop hdfs
第1章HDFS概述1.1HDFS产出背景及定义1.1.1HDFS产生背景随着数据量越来越大，在一个操作系统存不下所有的数据，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。1.1.2HDFS定义HDFS（HadoopDistributedFileSystem），它是一个文件系统，
Hadoop-HDFS 密斯特.张先生 hadoop hdfs 大数据
whatHadoopHDFS(HadoopDistributedFileSystem)是ApacheHadoop中的分布式文件系统。它是一个流行的分布式文件系统,适合运行在的集群上。HDFS的主要特征有:1.分布式:HDFS存储文件的片段称为block,每个block默认大小为128MB,一个文件会被划分成多个block存储在集群的不同节点上。2.容错:HDFS会自动保存文件多份副本,默认保存3份
hadoop-HDFS 不吃香菜lw hdfs hadoop 大数据
1.HDFS简介2.1Hadoop分布式文件系统-HDFS架构2.2HDFS组成角色及其功能（1）Client：客户端（2）NameNode(NN)：元数据节点管理文件系统的Namespace元数据一个HDFS集群只有一个Active的NN（3）DataNode(DN)：数据节点数据存储节点，保存和检索Block一个集群可以有多个数据节点（4）SecondaryNameNode(SNN)：从元数据
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str