Moliay

大数据技术原理与应用笔记

参考：
课程教学（林子雨老师）
程序羊大数据学习路线
HDFS入门
Hbase入门
NoSql入门

文章目录

一、大数据概述
- - 1.1大数据时代
  - 1.2大数据的概念和影响
  - 1.3大数据的应用
  - 1.4大数据的关键技术
  - 1.5大数据,物联网和云计算
  - - 1.5.1 云计算
    - 1.5.2物联网
  - 检测题
二、大数据处理架构Hadoop
- 2.1hello，Hadoop
- - 2.1.1Hadoop简介
  - 2.1.2Apache Hadoop版本演变
- 2.2Hadoop项目结构
- 2.3Linux和Hadoop的安装
- - 2.3.1安装Linux虚拟机
  - 2.3.2安装Hadoop
- 2.4Hadoop集群的部署和使用
三、分布式文件系统HDFS
- 3.1 [分布式文件系统HDFS简介](https://www.cnblogs.com/gzshan/p/10981007.html)
- 3.2HDFS相关概念
- - 块
  - HDFS集群的节点分为两类：namenode和datanode
- 3.3 HDFS体系结构
- 3.4 HDFS存储原理
- 3.5HDFS数据读写过程
- - 3.5.1 HDFS读数据过程
  - 3.5.2 HDFS写数据过程
- 3.6[HDFS编程实践](https://blog.csdn.net/Moliay/article/details/129450964)
- - 3.6.1HDFS常用命令
  - 3.6.2安装Eclipse
  - 3.6.3 HDFS常用Java API及应用实例
四、分布式数据库HBase
- 4.1 HBase简介
- 4.2 HBase数据模型
- 4.3 HBase的实现原理
- 4.4 HBase运行机制
- 4.5 HBase应用方案
- 4.6 [HBase的安装和编程实践](https://blog.csdn.net/Moliay/article/details/129617128)
五、NoSQL数据库
- 5.1 NoSQL数据库
- 5.2 NoSQL与关系数据库的比较
- 5.3 四大类型NoSQL数据库
- - 5.3.1键值数据库和列族数据库
  - 5.3.1键值数据库和列族数据库
- 5.4 NoSQL数据库的理论基石
- 5.5 从NoSQL到NewSQL数据库
- 5.6 文档数据库MongoDB

一、大数据概述

1.1大数据时代

三次信息化浪潮

1.2大数据的概念和影响

大数据的4v特征
volume大量化、velocity快速化、variety多样化、value价值化
- 数据量大
- 数据类型繁多 – 大数据是由结构化和非结构化数据组成的
- 处理速度快
- 价值密度低，商业价值高 – 连续不间断监控过程中，可能有用的数据仅仅有一两秒，但是具有很高的商业价值
大数据的影响
- 思维方式方面：大数据完全颠覆了传统的思维方式（全样而非抽样、效率而非精确、相关而非因果）。
  (因为是全样,所以无需担心误差放大,进而无需关注精确而需关注效率)
- 社会发展方面：大数据决策逐渐成为一种新的决策方式，大数据应用有力促进了信息技术与各行业的深度融合，大数据开发大大推动了新技术和新应用的不断涌现。
- 就业市场方面：大数据的兴起使得数据科学家成为热门职业。
- 人才培养方面：大数据的兴起将在很大程度上改变中国高校信息技术相关专业的现有教学。

1.3大数据的应用

(谷歌预测流感,大数据)

1.4大数据的关键技术

1.5大数据,物联网和云计算

1.5.1 云计算

解决了两个核心问题,即海量数据的分布式存储和分布式处理问题
典型特征是虚拟化和多租户

(老朋友自来水)

(公有云:例如百度)

1.5.2物联网

物联网的关键技术:识别&感知
大数据(此时指数据处理技术,非数据本身):如何存储&如何处理

(三者不断融合发展,相辅相成)

检测题

单位换算
1KB (Kilobyte 千字节)=1024B，
1MB (Megabyte 兆字节简称“兆”)=1024KB，
1GB (Gigabyte 吉字节又称“千兆”)=1024MB，
　　 1TB (Trillionbyte 万亿字节太字节)=1024GB，其中1024=2^10 ( 2 的10次方)，
　　 1PB（Petabyte 千万亿字节拍字节）=1024TB，
　　 1EB（Exabyte 百亿亿字节艾字节）=1024PB，
　　 1ZB (Zettabyte 十万亿亿字节泽字节)= 1024 EB,
　　 1YB (Yottabyte 一亿亿亿字节尧字节)= 1024 ZB,
　　 1BB (Brontobyte 一千亿亿亿字节)= 1024 YB.
(k m g t p e z y b 提屁姨，贼一笔)

二、大数据处理架构Hadoop

2.1hello，Hadoop

2.1.1Hadoop简介

Hadoop发展历程
Apache软件基金会旗下的开源分布式平台，基于Java语言开发，具有很好的跨平台性
核心是分布式文件系统HDFS和MapReduce（分别实现了海量数据的分布式存储&处理）

Hadoop源自始于Apache Nutch项目。

Hadoop的特性
高可靠性、高效性、高可扩展性、高容错性、成本低、运行在Linux平台、支持多种编程语言。

2.1.2Apache Hadoop版本演变

Hadoop2.0增加了HDFS HA和YARN两个系统。

2.2Hadoop项目结构

HDFS：负责分布式文件存储
YARN框架：对计算机资源（例如带宽、内存啥的）进行管理和调度
MapReduce：离线批处理计算
Tez:把作业分析优化后构建有向无环图，得出哪些工作先做哪些工作可以后做以获得最好的工作效率
Spark：类似于Hadoop MapReduce的通用并行框架
区别 Spark基于内存，因而效率比后者高一个数量级
MapReduce基于磁盘
Hive：Hadoop上的数据仓库
支持SQL语句，可以把SQL语句转化为一堆mapreduce作业
Pig：实现流数据处理
提供轻量级的数据分析
（虽说MapReduce已经屏蔽了很多底层的复杂性，但还是很复杂
所以有了Pig这一轻量级的脚本语言）
Oozie：作业流调度系统
ZooKeeper：提供分布式协调一致性（例如分布式锁，集群管理啥的）
HBase列族数据库：支持随机读写，进而支持实时应用（快男）
Flume:日志收集分析框架(例如淘宝借助其进行流数据的收集)
Sqoop：数据导入导出
Ambari:安装部署工具

2.3Linux和Hadoop的安装

2.3.1安装Linux虚拟机

2.3.2安装Hadoop

2.4Hadoop集群的部署和使用

主要是考虑两大核心组件的底层硬件的需求是啥

（其余感觉比较散，之后看情况补充）

三、分布式文件系统HDFS

3.1 分布式文件系统HDFS简介

HDFS：小弟不才，解决了两大核心问题之一

分布式文件系统
数据量上去了，进而有了分布式

集群是个物理形态，分布式是个工作方式。
只要是一堆机器，就可以叫集群，他们是不是一起协作着干活，这个谁也不知道；一个程序或系统，只要运行在不同的机器上，就可以叫分布式，C/S架构也可以叫分布式。集群一般是物理集中、统一管理的，而分布式系统则不强调这一点。所以，集群可能运行着一个或多个分布式系统，也可能根本没有运行分布式系统；分布式系统可能运行在一个集群上，也可能运行在不属于一个集群的多台（2台也算多台）机器上。
作者：Wang Xu
链接：https://www.zhihu.com/question/20004877/answer/13632513
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

HDFS实现目标：
- 兼容廉价的硬件设备
  以企业可以承担的成本，可以使用普通的PC机构成集群。设计之初，就要考虑到能够兼容廉价的硬件设备。
- 实现流数据读写
  区别于传统文件系统（以块数据为单位）之处。满足批量处理数据或海量数据处理的需求。
- 支持大数据集
- 支持简单的文件模型
  为支持高效的数据读写，对文件进行了简化。牺牲了相关性能，但获得了批处理特性。只允许追加，不允许修改。
- 强大的跨平台兼容性
  基于Java实现
HDFS自身的局限性
- 不适合低延迟数据访问
  是为了面向大规模的流式读写，一次读大批量或者全部数据。所以当想要读某条数据时，需要读大量数据，再筛选出来，故实时性不高（HBase具备随机读写特性，实时性处理需求）。
- 无法高效储存大量小文件
  小文件多，索引结构庞大，进而索引效率低
- 不支持多用户写入及修改文件
  只允许追加，不允许修改

3.2HDFS相关概念

块

默认一个块（block）的大小为128MB（HDFS的块这么大主要是为了最小化寻址开销），要在HDFS中存储的文件可以划分为多个分块，每个分块可以成为一个独立的存储单元。
与本地磁盘不同的是，HDFS中小于一个块大小的文件并不会占据整个HDFS数据块。

设计目的：
- 支持面向大规模数据存储
- 降低分布式节点的寻址开销

块并非一味的大就是好

优点：
- 支持大规模文件存储
  可以把大文件进行切割，各个小块可以分布式的存储在不同机器上，则可以突破单机存储容量上限。
- 简化系统设计
  使用抽象的块，而不是整个文件作为存储单元，可以简化存储管理，使得文件的元数据可以单独管理。
- 适合数据备份
  冗余备份。数据块非常适合用于数据备份，进而可以提供数据容错能力和提高可用性。每个块可以有多个备份（默认为三个），分别保存到相互独立的机器上去，这样就可以保证单点故障不会导致数据丢失。

HDFS集群的节点分为两类：namenode和datanode

以管理节点-工作节点的模式运行，即一个namenode和多个datanode.

namenode管理节点：整个HDFS集群的管家
（管理文件系统命名空间，管理文件系统树以及树中的所有目录和文件）

FsImage不维护文件在具体的哪个节点（是通过数据节点和名称节点运行过程中不断地沟通，来实时维护）

保存元信息的种类有：
* 文件名目录名及其之间的层级关系
* 文件目录的所有者及其权限
* 每个文件块的名及文件由哪些块组成

第二名称节点Secondary Namenode：名称节点的冷备份，实现对EditLog的处理

datanode工作节点：存储实际数据（保存到本地的Linux文件系统中）

3.3 HDFS体系结构

中从架构。

机架之间通过光纤高速连接
缺点（第四点因为Secondary Namenode是冷备份）
（冷：不能保证一发生故障就能立刻顶上来）

3.4 HDFS存储原理

底层架构在廉价的集群之上，而廉价的机器们最致命的缺点就是会不断出故障。所以HDFS中的数据都被冗余保存，一般默认为三份（当然也可以自定义其他数值）

数据冗余保存的优点
- 加快数据传输速度
  并行传输
- 检查数据错误
  互为参照
- 保证数据可靠性

存放策略：
第一个副本：存放在上传这个文件的节点上（无需再通过网络传到其他机器上），若提交请求不是来自集群内部而是外部的某个数据节点时，存放在一个磁盘不太满，CPU不太忙的节点
第二个副本：存放在另一个机架上（不同于第一个的机架）
第三个副本：存放在第一个机架的不同节点上
（若还有其他副本，可通过随机算法）

数据读取

机架内部通信代价很小且较快

3.5HDFS数据读写过程

3.5.1 HDFS读数据过程

client访问NameNode，查询元数据信息，获得这个文件的数据块位置列表，返回输入流对象。
就近挑选一台datanode服务器，请求建立输入流。
DataNode向输入流中中写数据，以packet为单位来校验。
关闭输入流
其中，方框内对用户屏蔽，系统自动封装完成。

hadoop中设置了通用文件系统抽象基类FileSystem

通常用的方法有
- open返回的是输入流

3.5.2 HDFS写数据过程

写入时，采用流水线复制

客户端向NameNode发出写文件请求。
检查是否已存在文件、检查权限。若通过检查，直接先将操作写入EditLog，并返回输出流对象。
（注：WAL，write ahead log，先写Log，再写内存，因为EditLog记录的是最新的HDFS客户端执行所有的写操作。如果后续真实写操作失败了，由于在真实写操作之前，操作就被写入EditLog中了，故EditLog中仍会有记录，我们不用担心后续client读不到相应的数据块，因为在第5步中DataNode收到块后会有一返回确认信息，若没写成功，发送端没收到确认信息，会一直重试，直到成功）
client端按128MB的块切分文件。
client将NameNode返回的分配的可写的DataNode列表和Data数据一同发送给最近的第一个DataNode节点，此后client端和NameNode分配的多个DataNode构成pipeline管道，client端向输出流对象中写数据。client每向第一个DataNode写入一个packet，这个packet便会直接在pipeline里传给第二个、第三个…DataNode。
（注：并不是写好一个块或一整个文件后才向后分发）
每个DataNode写完一个块后，会返回确认信息。
（注：并不是每写完一个packet后就返回确认信息，个人觉得因为packet中的每个chunk都携带校验信息，没必要每写一个就汇报一下，这样效率太慢。正确的做法是写完一个block块后，对校验信息进行汇总分析，就能得出是否有块写错的情况发生）
写完数据，关闭输输出流。
发送完成信号给NameNode。
（注：发送完成信号的时机取决于集群是强一致性还是最终一致性，强一致性则需要所有DataNode写完后才向NameNode汇报。最终一致性则其中任意一个DataNode写完后就能单独向NameNode汇报，HDFS一般情况下都是强调强一致性）

3.6HDFS编程实践

(点开本节标题链接，详细展开)

3.6.1HDFS常用命令

启动Hadoop（启动失败的解决之一）

cd /usr/local/hadoop # 到Hadoop安装目录
./sbin/start-dfs.sh #启动hadoop
jps # 看是否三个进程都已启动，则确定hdfs启动成功

3.6.2安装Eclipse

3.6.3 HDFS常用Java API及应用实例

四、分布式数据库HBase

4.1 HBase简介

HBase是BigTable的开源实现。
BigTable

引入目的：解决谷歌公司内部大规模网页搜索问题
- 网页搜索的两种方式
实现
不是直接在底层磁盘上存储，而是架构在谷歌分布式文件系统GFS之上。
优点
- 性能好，可支持PB级别的数据
- 可扩展性好

HBase是高可靠，高性能，面向列，可伸缩的分布式数据库。最主要的特点是用来存储半结构化和非结构化的松散数据

产生原因：为了满足不断增长的数据存储需求
HBase vs BigTable
HBase vs 关系数据库
- 数据类型
  HBase对于数据类型不加以区分，都存储为字符数组
- 数据操作
  没有繁多的数据操作，提高效率
- 存储模式
  基于列存储
- 数据索引
- 数据维护
  不存在常规的替换操作，生成新的版本之后，旧版本依然保留。只有当过了设置的参数期限之后，才会在后台清理掉。
- 可伸缩性

访问接口

what
Hbase是一种分布式存储的数据库。
- Hbase是一种NoSQL数据库，即它和传统的RDBMS数据库那种支持SQL作为查询语言不同
- 技术上讲，它更像是分布式存储而非分布式数据库，缺少很多RDBMS系统的特点。如列类型，辅助索引，触发器和高级查询语言等待。
特点
- 强读写一致
  但不是“最终一致性”的数据存储，使得它很适合高速的计算聚合
- 自动分片
  通过Region分散在集群中，当行数增长的时候，Region也会自动的切分和再分配
- 自动的故障转移
- Hadoop/HDFS集成，和HDFS开箱即用，不用太麻烦的衔接
- 丰富的“简洁、高效”API
  Thrift/REST API,Java API
- 块缓存,布隆过滤器，可以高效的列查询优化
- 操作管理
  Hbase提供了内置的web界面来操作，还可以监控JMX指标
when
- 数据库量要足够多
  数据量小的话，真正能工作的机器量少，剩余的机器都处于空闲的状态。
  因此，当有十亿及百亿行数据，适合Hbase;
  当只有几百万行甚至更少的数据量，适合RDBMS
- 不需要辅助索引，静态类型的列，事务等特性。
  一个已经用RDBMS的系统想要切换到Hbase,则需要重新设计系统
- 保证硬件资源足够
  每个HDFS集群在少于5个节点的时候，都不能表现得很好。因为HDFS默认的复制数量是3，再加上一个Name Node（上一章的老朋友）
  Hbase在单机环境也能运行，但在开发环境的时候使用就好。

4.2 HBase数据模型

HBase是一个稀疏的多维度（四个维度（行键，列族，列限定符，时间戳））的排序的映射表。

其中：

列限定符也可以称为列
一个行可以有一个行键和任意多列
每一个值都是未经解释的字符串也就是Bytes数组
列族可以支持动态扩展，且保留旧的版本（追加时间戳）。

面向行的存储

缺：分析某个特征时都是针对一个列去分析，每次取出一整行代价大

4.3 HBase的实现原理

HBase功能组件
表和Region
所谓“分裂”只是把指向改变，而不改变实际的物理存储
⇨从而保证快速拆分
Region的定位

类似多级目录的思想，顶级目录只能有一张（408还是有点子用的）

三级寻址可采用缓存，加快寻址速度。但是随着数据更新，缓存可能失效。

4.4 HBase运行机制

HBase的系统架构
HBase是借助在Hadoop之上的HDFS分布式文件存储系统之上，并非直接和底层磁盘进行数据交互。

他们分别的功能：

主服务器的功能
Region服务器的工作原理
用户读写数据过程：
1. 写数据
- 在分配到的相应Region服务器下执行
- 写到写缓存之中，写MemStore（不是直接写到磁盘中，考虑到读写开销咯（408好像真的没白学+1））
- 为了保证数据的安全和可恢复性（联想数据库中的恢复机制是冗余），写日志。其中HLog就是日志功能。只有当HLog的内容写回到磁盘之后，才允许写回的数据返回到客户端。
  
  （该图从写入数据考虑的因素考虑，箭头指示并非数据流向和直接目的）
1. 读数据
  同样先到分配的Region服务器下，通过MemStore找缓存，缓存中没有再去访问磁盘中的相关数据。
- 缓存的刷新
  - 系统周期性地把MemStore缓存中的内容写到磁盘的StoreFile文件中，清空缓存，并在Hlog里面写入一个标记
  - 每次刷写都生成一个新的StoreFile文件
    ⇨每个Store包含多个StoreFile文件
  - 每个Region服务器都有一个自己的HLog文件，每次启动都检查该文件，确认最近依次执行缓存刷新之后是否发生新的写入操作
    - 若发现更新
      ⇨先写入MemStore,再刷写到StoreFile，最后删除旧的HLog文件，开始为用户提供服务
Store的工作原理
- StoreFile的合并和分裂
  每次刷写都会产生一个新的StoreFile，当StoreFile过多的话必然影响查找的速度。所以当达到一定的阈值之后就会合并（合并是需要一定的开销）
  
  当合并所得的StoreFile大于相应阈值后，又会进行分裂
HLog的工作原理
- 引入：HBase是通过构建一个集群去管理数据，是个典型的分布式环境，且底层是非常廉价的低端机
  ⇨容易出故障（Zookeeper来检测故障，协同管理小能手）
  ⇨借助写日志备份，以实现故障后的恢复
  HBase为每个Region服务器配备了公共的HLog。每个Region服务器之下所有的Region公用这个公共的HLog。（to提高效率，主要是写性能）
  每次用户更新数据时，需要先写入日志后，再写入MemStore缓存，最后当MemStore中的内容刷写到磁盘。

4.5 HBase应用方案

HBase在实际应用中的性能优化方法
如果想要吧时间靠近的数据都存一起，可以把时间戳作为行键的一部分。
时间戳通常按升序排序，长整型变量64位
⇨越到后时间戳就会越来越大
⇨通过把长整型-时间戳作为行键
⇨保证了最新的数据很快能够命中加速读取
实时性要求高，可采取的措施
HBase怎么检测性能
- Master-status
  是HBase自带的工具通过Web界的方式，可查询HBase运行状态，直接在浏览器中输入地址就可以查看。
- Ganglia

HBase之上如何构建SQL引擎和HBase二级索引

4.6 HBase的安装和编程实践

五、NoSQL数据库

5.1 NoSQL数据库

特点
- 灵活的可扩展性
  有非常强的水平扩展性，可支持在多个节点上进行水平扩展。therefore,可支持海量的数据存储
- 灵活的数据模型
  不同于SQL数据库需要满足严格的数据定义，NoSQL可以动态增加相关的列族
- 和云计算的紧密结合
  云计算的突出优点之一是可根据负载的变化对底层的IT基础设施进行动态地伸缩。NoSQL可充分的利用底层云计算的设施（产生之初就基于云计算背景）。
关系数据库vs非关系数据库的比较
- 传统的关系数据库
  - 优
  - 缺
    - 无法满足海量数据的管理需求
    - 无法满足高并发的需求
    - 无法满足高可扩展性和高可用性的需求
NoSQL

5.2 NoSQL与关系数据库的比较

不同角度的比较
- 数据库原理
  - 关系数据库：具有完备的关系代数理论作为基础√
  - NoSQL数据库：NoSQL数据库缺乏理论基础
- 数据规模
  - 关系数据库：很难实现横向扩展，纵向扩展非常有限
  - NoSQL数据库：具有非常好的水平可扩展性√
- 数据库模式
  - 关系数据库：要定义严格的数据库模式，且要严格遵守事先定义的数据库模式
  - NoSQL数据库：数据模型非常灵活√
- 查询效率
  - 关系数据库：适当数量级查询效率高，数量级增大查询效率下降√
  - NoSQL数据库：未构建面向复杂查询的索引查询性能差
- 事务一致性
  - 关系数据库：遵循ACID事务模型可以保证事务强一致性√
  - NoSQL数据库：只能保证事务的最终执行，而不能保证事务强一致性
- 数据完整性
  - 关系数据库：具有保证完整性的完备机制
  - NoSQL数据库：不能实现完整性约束
- 可扩展性
  - 关系数据库：扩展性一般较差
  - NoSQL数据库：水平扩展性非常好
- 可用性
  - 关系数据库：随着规模增大，为了保证严格的一致性，可用性方面就被削弱了
  - NoSQL数据库：具有非常好的可用性，能够在短时间内迅速返回所需的结果
- 标准化
  - 关系数据库：遵循SQL标准，标准化较为完善
  - NoSQL数据库：未形成通用的行业标准
- 技术支持
  - 关系数据库：很多都是商业数据库，可获得强大的技术和后续服务支持
  - NoSQL数据库：很多都是属于开源产品，处于整个发展的初期阶段
- 可维护
  - 关系数据库：需要管理员维护
  - NoSQL数据库：没有成熟的基础和实践操作规范，维护较为复杂
应用不是非此即彼，通常采用混合型架构
NoSQL数据库
关系数据库
- 优点
  - 具有非常完备的关系代数理论作为基础
  - 有严格的标准
  - 支持事务一致性
  - 可以借助索引机制实现高效的查询
- 缺

5.3 四大类型NoSQL数据库

5.3.1键值数据库和列族数据库

5.4 NoSQL数据库的理论基石

5.5 从NoSQL到NewSQL数据库

5.6 文档数据库MongoDB

本周课程没完成，继续见

为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
Deepseek技术深化：驱动大数据时代颠覆性变革的未来引擎荣华富贵8 spring boot 搜索引擎后端缓存 redis
在大数据时代，信息爆炸和数据驱动的决策逐渐重塑各行各业。作为一项前沿技术，Deepseek正在引领新一轮技术革新，颠覆传统数据处理与分析方式。本文将从理论原理、应用场景和前沿代码实践三个层面，深入剖析Deepseek技术如何为大数据时代提供颠覆性变革的解决方案。一、技术背景与核心思想1.1大数据挑战与机遇在数据量呈指数级增长的背景下，传统数据处理方法面临数据存储、计算效率和信息提取精度的诸多挑战。
大数据之路：阿里巴巴大数据实践——大数据领域建模综述
为什么需要数据建模核心痛点数据冗余：不同业务重复存储相同数据（如用户基础信息），导致存储成本激增。计算资源浪费：未经聚合的明细数据直接参与计算（如全表扫描），消耗大量CPU/内存资源。数据一致性缺失：同一指标在不同业务线的口径差异（如“活跃用户”定义不同），引发决策冲突。开发效率低下：每次分析需重新编写复杂逻辑，无法复用已有模型。数据建模核心价值性能提升：分层设计（ODS→DWD→DWS→ADS）
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
大数据精准获客并实现高转化的核心思路和实现方法 2401_88470328 大数据精准获客数据分析数据挖掘大数据需求分析 big data
大数据精准获客并实现高转化的核心思路和实现方法大数据精准获客并实现高转化的核心思路和实现方法在当今信息爆炸的时代，企业如何通过海量的数据精准获取潜在客户，并提高转化率，已经成为营销策略中的关键环节。大数据精准获客的核心思路在于数据驱动、多渠道触达以及优化转化路径，从而实现高效的市场推广和客户转化。数据驱动原理和机制数据驱动的核心在于通过分析用户行为数据，挖掘潜在客户的需求和喜好，从而制定更加精准的
一地鸡毛—一个中年男人的日常2021241 随止心语所自欲律
2021年8月31日，星期二，阴有小雨。早起5:30，跑步10公里。空气清新，烟雨朦胧，远山如黛，烟雾缭绕，宛若仙境。空气中湿气很大，朦胧细雨拍打在脸上，甚是舒服，跑步的人明显减少。早上开会，领导说起逐年大幅度下滑的工作业绩，越说越激动，说得脸红脖子粗。开完会又讨论了一下会议精神，心情也有波动，学习热情不高。心里还有一个大事，是今日大数据分析第1次考试，因自己前期没学，而且计算机编程方面没有任何基
Serverless架构下Spring Function的创新实践 tmjpz04412 serverless 架构 spring
引言：Serverless与Spring生态的交汇背景介绍：云计算与Serverless架构的兴起Spring生态的演进与云原生适配性核心问题：传统Spring应用如何融入Serverless范式Serverless架构的核心特征与挑战事件驱动、弹性伸缩与按需计费冷启动问题与性能优化需求Spring应用在Serverless环境中的典型瓶颈（如依赖注入、上下文初始化）SpringFunction的
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
深入了解 Kubernetes（k8s）：从概念到实践
目录一、k8s核心概念二、k8s的优势三、k8s架构组件控制平面组件节点组件四、k8s+docker运行前后端分离项目的例子1.准备前端项目2.准备后端项目3.创建k8s部署配置文件4.部署应用到k8s集群在当今云计算和容器化技术飞速发展的时代，Kubernetes（简称k8s）已成为容器编排领域的事实标准。无论是互联网巨头、传统企业还是初创公司，都在广泛采用k8s来管理和部署容器化应用。本文将带
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
H800核心技术突破与行业应用实战智能计算研究中心其他
内容概要在人工智能技术持续迭代的背景下，H800芯片凭借自主架构优化与算力跃升，成为推动行业场景化落地的关键驱动力。本文将从技术路径、性能突破与行业应用三个维度，系统解析H800如何在高并发计算与低延时响应领域实现底层架构创新。首先聚焦其自主架构优化的核心技术路径，包括动态资源调度算法与异构计算单元的深度协同设计，揭示其在能效比与计算密度上的突破逻辑；进一步结合算力跃升的具体表现，探讨该芯片如何通
Hive详解
一：Hive的历史价值1，Hive是Hadoop上的KillerApplication，Hive是Hadoop上的数据仓库，Hive同时兼具有数据仓库中的存储引擎和查询引擎的作用；而SparkSQL是一个更加出色和高级的查询引擎，所以在现在企业级应用中SparkSQL+Hive成为了业界使用大数据最为高效和流行的趋势。2，Hive是Facebook的推出，主要是为了让不动Java代码编程的人员也能
智慧建筑：科技引领房地产与建筑业的未来 RedPhoenix45
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE智慧建筑：科技引领房地产与建筑业的未来随着科技的飞速发展，人工智能（AI）和智能化工具正以前所未有的速度改变着各行各业。在房地产与建筑领域，这种变革尤为显著。从建筑设计到施工管理，再到物业管理，智能化技术正在重塑行业的每一个环节。本文将探讨如何利用先进的智能化工具提升房地产与建筑行业的效率，并介绍一款革命性的开发工具——它
智慧施工：AI技术赋能建筑安全监测新纪元
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！智慧施工：AI技术赋能建筑安全监测新纪元在现代建筑行业中，施工安全始终是核心关注点之一。随着科技的飞速发展，人工智能（AI）和大数据分析逐渐成为提升施工安全的重要工具。本文将探讨如何利用智能化软件和大模型API来构建高效的施工安全监测系统，并介绍一款强大的开发工具——InsCodeAIIDE的应用场景及其
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

大数据技术原理与应用笔记

文章目录

一、大数据概述

1.1大数据时代

1.2大数据的概念和影响

1.3大数据的应用

1.4大数据的关键技术

1.5大数据,物联网和云计算

1.5.1 云计算

1.5.2物联网

检测题

二、大数据处理架构Hadoop

2.1hello，Hadoop

2.1.1Hadoop简介

2.1.2Apache Hadoop版本演变

2.2Hadoop项目结构

2.3Linux和Hadoop的安装

2.3.1安装Linux虚拟机

2.3.2安装Hadoop

2.4Hadoop集群的部署和使用

三、分布式文件系统HDFS

3.1 分布式文件系统HDFS简介

3.2HDFS相关概念

块

HDFS集群的节点分为两类：namenode和datanode

3.3 HDFS体系结构

3.4 HDFS存储原理

3.5HDFS数据读写过程

3.5.1 HDFS读数据过程

3.5.2 HDFS写数据过程

3.6HDFS编程实践

3.6.1HDFS常用命令

3.6.2安装Eclipse

3.6.3 HDFS常用Java API及应用实例

四、 分布式数据库HBase

4.1 HBase简介

4.2 HBase数据模型

4.3 HBase的实现原理

4.4 HBase运行机制

4.5 HBase应用方案

4.6 HBase的安装和编程实践

五、NoSQL数据库

5.1 NoSQL数据库

5.2 NoSQL与关系数据库的比较

5.3 四大类型NoSQL数据库

5.3.1键值数据库和列族数据库

5.3.1键值数据库和列族数据库

5.4 NoSQL数据库的理论基石

5.5 从NoSQL到NewSQL数据库

5.6 文档数据库MongoDB

你可能感兴趣的:(大数据,大数据,云计算,人工智能)

四、分布式数据库HBase