- Hadoop入门学习笔记-第五天(hadoop-hive安装部署与配置笔记)
渣男程序员007
Hadoop入门学习笔记数据库hadoopmysqljavahive
1.准备安装包:MySQL-5.6.26-1.linux_glibc2.5.x86_64.rpm-bundlemysql-connector-java-5.1.39.jar(驱动,需要放入/hive/lib)apache-hive-1.2.1-bin.tar.gz2.安装mysql数据用于储存元数据,hive自带Derby,但该数据库不稳定,使用mysql作为元数据管理1).只需要安装在集群里面的
- Hive编程指南pdf
weixin_30468137
大数据java人工智能
下载地址:网盘下载内容简介······市场中第一本Hive图书。Hive在Hadoop系统中的应用趋势比较可观。作者简介······EdwardCapriolo:Media6degrees公司系统管理员,他是Apache软件基金会成员,还是Hadoop-Hive项目成员。DeanWampler:ThinkBigAnalytics公司总顾问,对大数据问题以及Hadoop和机器学习有专门的研究。Jas
- Hadoop-Hive
不吃香菜lw
hivehadoop数据仓库
1.hive安装部署2.hive基础3.hive高级查询4.Hive函数及性能优化1.hive安装部署解压tar-xvf./apache-hive-3.1.2-bin.tar.gz-C/opt/soft/改名mvapache-hive-3.1.2-bin/hive312配置环境变量:vim/etc/profile#hiveexportHIVE_HOME=/opt/soft/hive312expor
- Spark、RDD、Hive 、Hadoop-Hive 和传统关系型数据库区别
Wzideng
#sparkhadoopsparkhive
HiveHadoopHive和传统关系型数据库区别Spark概念基于内存的分布式计算框架只负责算不负责存spark在离线计算功能上类似于mapreduce的作用MapReduce的缺点运行速度慢(没有充分利用内存)接口比较简单,仅支持MapReduce功能比较单一只能做离线计算Spark优势运行速度快自身生态比较完整sparksqlsparkstreamingsparkmllibSparkMLap
- SQL ON Hadoop-Hive(二)-DDL数据定义语言
风风雨雨中寻觅
hiveHadoophive修改表join连接排序分桶
一.创建数据库Hive中的数据库本质上仅仅是个表的目录或命名空间,在生产环境,如果表非常多,一般会用数据库将生产表组织成逻辑组。Hive中默认使用的数据库是default数据库名+数据库所在的目录位置不能修改--创建数据库(包含数据库键值对属性信息)createdatabaseifnotexiststestcomment'thisislaotian'withdbproperties('creato
- Hadoop-Hive组件部署
王智刚
一、基础环境Hive组件需要基于之前已部署完毕的Hadoop全分布系统,在master节点上实现Hive组件安装。1、Hadoop-全分布式配置(全部配置)2、Hadoop-集群运行(部分配置)#查看之前部署的环境[root@master~]#su-hadoop[
- 【原创】docker配置 hadoop-hive环境
abboo
0.前言安装docker安装并运行phpMyAdmin和MySqlDocker创建网桥,并将容器加入该网络从github克隆代码到本地并修改配置文件生成镜像并运行hive配置项目放在github上https://github.com/Foabo/hadoop-hive1.安装docker参考官方文档,有详细说明,mac上下载了dockerdesktop之后就很方便,连docker-compose都
- Hadoop-Hive常用基础HQL语句
夏光辉
一.数据库1.查询数据库列表showdatabases;2.使用指定的数据库usedefault;3.查看数据库的描述信息descdatabaseextendeddb_hive_03;二.表1.查询表列表showtables;2.查询表的描述信息:descstudent;descextendedstudent;descformattedstudent;3.创建表createtablestudent
- 大数据-hadoop-Hive 启动报错01(2019-05-30 )datastore driver ("com.mysql.jdbc.Driver") was not found in the
Genebrother
hadoophivemysql
具体报错的信息是:Causedby:org.datanucleus.exceptions.NucleusException:Attempttoinvokethe"BONECP"plugintocreateaConnectionPoolgaveanerror:Thespecifieddatastoredriver("com.mysql.jdbc.Driver")wasnotfoundintheCLA
- hadoop-hive本地和伪分布式模式的安装
徐长亮
[2016年以后]基于hadoop的数据平台
前言:关于虚拟机安装hive,hadoop的资料林林总总,对于初学者很难甄别;如下是按照官方doc,一步步经过实践的一种方法,思路比我搜到网上的帖子更清晰;初学,难免有错误的地方,敬请指正。一、虚拟机hadoop的安装1.虚拟机安装linux-redhat操作系统,虚拟机网络类型设置为网桥模式,保证虚拟机可以访问Internet外网2.安装jdk:解压jdk文件(我的jdk是jdk1.8.0_05
- Hadoop-Hive基本使用
qichangjian
大数据学习
Hive基本使用1、创建库:createdatabaseifnotexistsmydb;2、查看库:showdatabases;3、切换数据库:usemydb;4、创建表:createtableifnotexistst_user(idstring,namestring)或createtablet_user(idstring,namestring)rowformatdelimitedfieldste
- 【4.分布式计算】hadoop-hive
梦想家
hive
hive对hdfs中数据进行抽象成表,可以通过sql组装m_p的过程。(更多大数据处理见:https://segmentfault.com/a/11...)。数据通过mysql和hdfs存储,存储格式用的现有文件格式,mysql存结构/hdfs存表数据(比如insertidname4ss,hdfs存4ss)。只是sql到m_p的映射,这过程又比较复杂。所以这里只介绍下hive的执行过程和框架,存储
- Hadoop-Hive 内部表/外部表 分区表/分桶表区别
qichangjian
大数据学习
1)hive中内部表和外部表的区别内部表:又叫管理表,表的创建,和删除都由hive自己决定。外部表:表结构上同内部表,但是存储的数据时自己定义的,外部表在删除的时候只删除元数据,原始数据时不能删除的。内部表和外部表的区别主要体现在两个方面:删除:删除内部表,删除元数据和数据;删除外部表,删除元数据,保留数据。使用:如果数据的所有处理都在Hive中进行,那么倾向于选择内部表,但是如果Hive和其他工
- Hadoop-Hive基础整理(架构以及存储)
qichangjian
大数据学习
1.hive的介绍什么是hive:Hive是基于hadoop的一个数据仓库工具,实质就是一款基于hdfs的MapReduce计算框架,对存储在HDFS中的数据进行分析和管理。hive的工作方式:把存放在hive中的数据都抽象成一张二维表格,提供了一个类似于sql语句的操作方式,这些sql语句最终被hive的底层翻译成为MapReduce程序,最终在hadoop集群上运行,结果也会输出在hdfs之中
- SQL ON Hadoop-Hive(六)-字符串函数+行列转换
扯20080808
Hadoophive
一.hive常用字符串函数1.字符串反转函数reverse(stringA)--返回值类型stringselectreverse('gian')fromiteblog;--'naig'2.带分隔符字符串连接函数concat_ws(stringsep,stringa,stringb,...)--返回值类型stringselectconcat_ws('.','www','iteblog','com')
- SparkSQL:Spark整合Hive
PJ-Javis
Spark
1.安装HiveHive的安装,可以参看Hadoop-Hive快速入门,这里不再重述2.拷贝Hive的配置文件拷贝$HIVE_HOME/conf/hive-site.xml文件到$SPARK_HOME/conf下3.测试Hive本地数据测试文件people.txt1user011234562user021234563user031234564user04123456测试过程:新建一个内部表,导入本
- Hadoop-Hive快速入门
PJ-Javis
HiveSparkhadoopHadoop
Hive是基于Hadoop构建的一套数据仓库分析系统,简单来说它可以把我们所熟悉的Sql语句翻译成MapReduce执行,但是Hive只能对表进行select操作,而不能进行insert、delete、update操作。Hive和Sqoop一样,只要你的Hadoop环境已经搭建好了,安装后就可立即使用。但是它有一个特点:就是你在哪个个目录下执行hive的命令进入到hive模式,它就会在该目录下生成
- hadoop-hive查询ncdc天气数据实例
MrCharles
hadoophive天气数据
使用hive查询ncdc天气数据在hive中将ncdc天气数据导入,然后执行查询shell,可以让hive自动生成mapredjob,快速去的想要的数据结果。1.在hive中创建ncdc表,这个表用来存放ncdc的数据createtablencdc(yearstring,monthstring,datastring,timestring,airstring,astring,bstring,cstr
- hive安装工作记录
malihappy2009
hive职场休闲工作记录
最近安装hive,在安装的过程中,遇到了一些问题,由于我是yum安装的,网上的网友们一般发的都是手动安装的教程,所以在这里和大家分享一下我安装的经验,通过整理,我的安装步骤如下:
1、YUM安装hadoop-hive
sudo yum install hadoop-hive
2、下载mysql-connector-java-5.1.15
- hive安装工作记录
malihappy2009
职场休闲工作记录
最近安装hive,在安装的过程中,遇到了一些问题,由于我是yum安装的,网上的网友们一般发的都是手动安装的教程,所以在这里和大家分享一下我安装的经验,通过整理,我的安装步骤如下: 1、YUM安装hadoop-hive sudo yum install hadoop-hive 2、下载mysql-connector-java-5.1.15(用于hive连接mysql的一个插件) h
- Hive资料整理系列 二 Hive安装及mysql做元数据库 --clouder版本
wf1982
java数据库mysqlhadoopcentosDerby
Debian上安装: Java代码 $ sudo apt-get install hadoop-hive redhat/centos上安装: Java代码 $ sudo yum install hadoop-hive 启动hive控制台: Java代码 $ hive hive> okay,可以使用hive了 你可以参照hive的wiki里的介绍(很全面)玩一
- JAVA中的Enum
周凡杨
javaenum枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。 在实际问题中,有些变量的取值被限定在一个有限的范围内。 例如,一个星期内只有七天 我们通常这样实现上面的定义:
public String monday;
public String tuesday;
public String wensday;
public String thursday
- 赶集网mysql开发36条军规
Bill_chen
mysql业务架构设计mysql调优mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层; (2)控制单表数据量 int型不超过1000w,含char则不超过500w; 合理分表; 限制单库表数量在300以内; (3)控制列数量 字段少而精,字段数建议在20以内
- Shell test命令
daizj
shell字符串test数字文件比较
Shell test命令
Shell中的 test 命令用于检查某个条件是否成立,它可以进行数值、字符和文件三个方面的测试。 数值测试 参数 说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真
实例演示:
num1=100
num2=100if test $[num1]
- XFire框架实现WebService(二)
周凡杨
javawebservice
有了XFire框架实现WebService(一),就可以继续开发WebService的简单应用。
Webservice的服务端(WEB工程):
两个java bean类:
Course.java
package cn.com.bean;
public class Course {
private
- 重绘之画图板
朱辉辉33
画图板
上次博客讲的五子棋重绘比较简单,因为只要在重写系统重绘方法paint()时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。
画图板重绘难在需要重绘的类型很多,比如说里面有矩形,园,直线之类的,所以我们要想办法将里面的图形加入一个队列中,这样在重绘时就
- Java的IO流
西蜀石兰
java
刚学Java的IO流时,被各种inputStream流弄的很迷糊,看老罗视频时说想象成插在文件上的一根管道,当初听时觉得自己很明白,可到自己用时,有不知道怎么代码了。。。
每当遇到这种问题时,我习惯性的从头开始理逻辑,会问自己一些很简单的问题,把这些简单的问题想明白了,再看代码时才不会迷糊。
IO流作用是什么?
答:实现对文件的读写,这里的文件是广义的;
Java如何实现程序到文件
- No matching PlatformTransactionManager bean found for qualifier 'add' - neither
林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match!
网上找了好多的资料没能解决,后来发现:项目中使用的是xml配置的方式配置事务,但是
- Row size too large (> 8126). Changing some columns to TEXT or BLOB
aigo
column
原文:http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large
异常信息:
Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
- JS 格式化时间
alxw4616
JavaScript
/**
* 格式化时间 2013/6/13 by 半仙
[email protected]
* 需要 pad 函数
* 接收可用的时间值.
* 返回替换时间占位符后的字符串
*
* 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数
* 如 YYYY 4占4位 YY 占2位<p></p>
* MM DD hh mm
- 队列中数据的移除问题
百合不是茶
队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下;
//
package com.Thread0715.com;
import java.util.ArrayList;
public class Threa
- Runnable接口使用实例
bijian1013
javathreadRunnablejava多线程
Runnable接口
a. 该接口只有一个方法:public void run();
b. 实现该接口的类必须覆盖该run方法
c. 实现了Runnable接口的类并不具有任何天
- oracle里的extend详解
bijian1013
oracle数据库extend
扩展已知的数组空间,例:
DECLARE
TYPE CourseList IS TABLE OF VARCHAR2(10);
courses CourseList;
BEGIN
-- 初始化数组元素,大小为3
courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 ');
--
- 【httpclient】httpclient发送表单POST请求
bit1129
httpclient
浏览器Form Post请求
浏览器可以通过提交表单的方式向服务器发起POST请求,这种形式的POST请求不同于一般的POST请求
1. 一般的POST请求,将请求数据放置于请求体中,服务器端以二进制流的方式读取数据,HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求,比如请求数据是字符串或者是二进制数据
2. Form
- 【Hive十三】Hive读写Avro格式的数据
bit1129
hive
1. 原始数据
hive> select * from word;
OK
1 MSN
10 QQ
100 Gtalk
1000 Skype
2. 创建avro格式的数据表
hive> CREATE TABLE avro_table(age INT, name STRING)STORE
- nginx+lua+redis自动识别封解禁频繁访问IP
ronin47
在站点遇到攻击且无明显攻击特征,造成站点访问慢,nginx不断返回502等错误时,可利用nginx+lua+redis实现在指定的时间段 内,若单IP的请求量达到指定的数量后对该IP进行封禁,nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在 指定的封禁时间后实行自动解封的目的。
一、安装环境:
CentOS x64 release 6.4(Fin
- java-二叉树的遍历-先序、中序、后序(递归和非递归)、层次遍历
bylijinnan
java
import java.util.LinkedList;
import java.util.List;
import java.util.Stack;
public class BinTreeTraverse {
//private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 };
private int[] array={ 10,6,
- Spring源码学习-XML 配置方式的IoC容器启动过程分析
bylijinnan
javaspringIOC
以FileSystemXmlApplicationContext为例,把Spring IoC容器的初始化流程走一遍:
ApplicationContext context = new FileSystemXmlApplicationContext
("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
- [科研与项目]民营企业请慎重参与军事科技工程
comsci
企业
军事科研工程和项目 并非要用最先进,最时髦的技术,而是要做到“万无一失”
而民营科技企业在搞科技创新工程的时候,往往考虑的是技术的先进性,而对先进技术带来的风险考虑得不够,在今天提倡军民融合发展的大环境下,这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前,对
- spring 定时器-两种方式
cuityang
springquartz定时器
方式一:
间隔一定时间 运行
<bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" />
<bean id="updateSessionIdSchedule
- 简述一下关于BroadView站点的相关设计
damoqiongqiu
view
终于弄上线了,累趴,戳这里http://www.broadview.com.cn
简述一下相关的技术点
前端:jQuery+BootStrap3.2+HandleBars,全站Ajax(貌似对SEO的影响很大啊!怎么破?),用Grunt对全部JS做了压缩处理,对部分JS和CSS做了合并(模块间存在很多依赖,全部合并比较繁琐,待完善)。
后端:U
- 运维 PHP问题汇总
dcj3sjt126com
windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页
解决方法:
后台>系统>系统基本参数>核心设置>关键字替换(是/否),这里选择“是”。
后台>系统>系统基本参数>其他选项>自动提取关键字,这里选择“是”。
2、解决PHP168超级管理员上传图片提示你的空间不足
网站是用PHP168做的,反映使用管理员在后台无法
- mac 下 安装php扩展 - mcrypt
dcj3sjt126com
PHP
MCrypt是一个功能强大的加密算法扩展库,它包括有22种算法,phpMyAdmin依赖这个PHP扩展,具体如下:
下载并解压libmcrypt-2.5.8.tar.gz。
在终端执行如下命令: tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
- MongoDB更新文档 [四]
eksliang
mongodbMongodb更新文档
MongoDB更新文档
转载请出自出处:http://eksliang.iteye.com/blog/2174104
MongoDB对文档的CURD,前面的博客简单介绍了,但是对文档更新篇幅比较大,所以这里单独拿出来。
语法结构如下:
db.collection.update( criteria, objNew, upsert, multi)
参数含义 参数  
- Linux下的解压,移除,复制,查看tomcat命令
y806839048
tomcat
重复myeclipse生成webservice有问题删除以前的,干净
1、先切换到:cd usr/local/tomcat5/logs
2、tail -f catalina.out
3、这样运行时就可以实时查看运行日志了
Ctrl+c 是退出tail命令。
有问题不明的先注掉
cp /opt/tomcat-6.0.44/webapps/g
- Spring之使用事务缘由(3-XML实现)
ihuning
spring
用事务通知声明式地管理事务
事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理,可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知,为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后,就需要将它与切入点关联起来。由于事务通知是在 <aop:
- GCD使用经验与技巧浅谈
啸笑天
GC
前言
GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”,本文就总结一些有关使用GCD的经验与技巧。
dispatch_once_t必须是全局或static变量
这一条算是“老生常谈”了,但我认为还是有必要强调一次,毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug,正确的如下: 1
- linux(Ubuntu)下常用命令备忘录1
macroli
linux工作ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表:ls
ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容,但这样直接运行所得到的信息也是比较少的,通常它可以结合以下这些参数运行以查询更多的信息:
ls / 显示/.下的所有文件和目录
ls -l 给出文件或者文件夹的详细信息
ls -a 显示所有文件,包括隐藏文
- nodejs同步操作mysql
qiaolevip
学习永无止境每天进步一点点mysqlnodejs
// db-util.js
var mysql = require('mysql');
var pool = mysql.createPool({
connectionLimit : 10,
host: 'localhost',
user: 'root',
password: '',
database: 'test',
port: 3306
});
- 一起学Hive系列文章
superlxw1234
hiveHive入门
[一起学Hive]系列文章 目录贴,入门Hive,持续更新中。
[一起学Hive]之一—Hive概述,Hive是什么
[一起学Hive]之二—Hive函数大全-完整版
[一起学Hive]之三—Hive中的数据库(Database)和表(Table)
[一起学Hive]之四-Hive的安装配置
[一起学Hive]之五-Hive的视图和分区
[一起学Hive
- Spring开发利器:Spring Tool Suite 3.7.0 发布
wiselyman
spring
Spring Tool Suite(简称STS)是基于Eclipse,专门针对Spring开发者提供大量的便捷功能的优秀开发工具。
在3.7.0版本主要做了如下的更新:
将eclipse版本更新至Eclipse Mars 4.5 GA
Spring Boot(JavaEE开发的颠覆者集大成者,推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示,