E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python使用spark
python使用
TestLink-API-Python-client库对testLink操作——excel导入
依赖库:TestLink-API-Python-client,xlrd通过pip安装:python3-mpipinstallTestLink-API-Python-client(笔者本地有多个版本python,只有一个版本直接python就可以)url:替换自己的testLink地址http://xx.xx.xx.xx:xxxx/testlink/lib/api/xmlrpc/v1/xmlrpc.
fairytaildhk
·
2025-01-24 15:45
python
python
testLink
excel
【
Spark
】
Spark
Join类型及Join实现方式
Spark
Join类型1.InnerJoin(内连接)示例:valresult=df1.join(df2,df1("id")===df2("id"),"inner")执行逻辑:只返回那些在两个表中都有匹配的行
DataCrafter
·
2025-01-24 13:33
Spark
大数据
计算框架
spark
大数据
分布式
Spark
运行模式及
Spark
on Yarn两种运行模式的区别
Spark
运行模式1.Standalone模式描述:Standalone模式是
Spark
的独立集群模式,
Spark
自己管理资源和调度任务。适合小型集群或个人开发环境。特点:简单易用,适合开发和测试。
DataCrafter
·
2025-01-24 13:03
Spark
大数据
计算框架
spark
大数据
SessionNotCreatedException:消息:无法创建新服务:通过 Python 使用 ChromeDriver 和 SeleniumGrid 的 ChromeDriverService
SessionNotCreatedException:消息:无法创建新服务:通过
Python使用
ChromeDriver和SeleniumGrid的ChromeDriverService首先,你需要确保你的系统中已经安装了
潮易
·
2025-01-24 06:09
python
开发语言
TiDB架构特性
文章目录TiDB整体架构TiDBServerPDServerTiKVServerTi
Spark
TiDBOperatorTiDB核心特性水平扩展高可用TiDB存储和计算能力存储能力-TiKV-LSM计算能力
·
2025-01-24 05:24
#
TiDB
TiDB
大数据学习(七)Python3操作livy(使用pylivy模块)
Livy是一个用于与
Spark
交互的开源REST接口。pylivy是Livy的Python客户端,可以在
Spark
集群上轻松实现远程代码执行。
猪笨是念来过倒
·
2025-01-24 04:46
大数据
大数据
python
【Redis】golang操作Redis基础入门
总结了一篇【Redis】golang操作Redis基础入门
spark
les:喜欢的小伙伴可以点点关注??
m0_74825360
·
2025-01-23 19:14
面试
学习路线
阿里巴巴
redis
golang
数据库
搭建单机伪分布式Hadoop+
spark
+scala
目录一、准备环境包:二、创建centos7虚拟机并配置ip三、链接Xshell并上环境包四、安装JDK1.解压jdk2.设置JAVA环境变量3.执行source使设置生效:4.检查JAVA是否可用。五、免密登陆1.创建ssh秘钥,输入如下命令,生成公私密钥2.将master公钥id_dsa复制到master进行公钥认证,实现本机免密登陆,测试完exit退出六、安装Hadoop软件1.解压hadoo
啥也不会0-0
·
2025-01-23 16:21
分布式
hadoop
spark
CDP中的Hive3之Apache Hive3特性
ApacheHive3架构概述CDP中采用的是ApacheHive3版本,相比Hive1/2,该版本在事务和安全性等方面有重大改进,了解这些版本之间的主要差异对于SQL用户至关重要,包括使用Apache
Spark
对许
·
2025-01-23 16:51
#
Hive
#
Spark
hive
cdp
Hadoop 与
Spark
:大数据处理的比较
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-23 16:50
大数据
经验分享
hadoop
spark
大数据
虚拟机VMware Workstation Pro安装集群+hadoop+
spark
+scala
参考资料:参考视频教程链接:大数据实验虚拟机安装Hadoop和
Spark
_哔哩哔哩_bilibiliup主:孤独时代的硕硕namenode安装选择镜像、路径、磁盘(最好不要c盘)、内存和处理器编辑名称与位置可点击此处自定义硬盘进行设置
落枫兮
·
2025-01-23 15:16
hadoop
spark
scala
大数据手写面试题Scala语言实现大全(持续更新)
目录1.冒泡排序2.二分查找3.快速排序4.归并排序5.手写
Spark
-WordCount6.手写
Spark
程序求平
大模型大数据攻城狮
·
2025-01-23 15:44
大数据
数据结构
算法
面试题
面试宝典
使用iFlyTek
Spark
LLM进行实时聊天应用开发
iFlyTek的
Spark
LLM为开发者提供了强大的聊天模型API,支持灵活的集成和扩展。本文将介绍如何使用
Spark
LLM搭建一个简单的聊天应用,包括基本的API初始化和调用,以及如何实现流式输出。
dagGAIYD
·
2025-01-23 04:53
前端
javascript
java
python
python md5加密字符串_
Python使用
MD5加密字符串示例
Python使用
MD5加密字符串示例Python加密模块有好几个,但无论是哪种加密方式都需要先导入相应的加密模块然后再使用模块对字符串加密。
weixin_39830012
·
2025-01-23 01:27
python
md5加密字符串
有了TiDB,是否还需要“散装”大数据组件?
最近和同事们讨论一个问题:在大数据应用日益增多的今天,如果使用了TiDB这样的一体化数据库,还需要使用那些传统的大数据组件(比如Hadoop、
Spark
等)吗?
狮歌~资深攻城狮
·
2025-01-22 15:02
tidb
数据仓库
数据分析
数据库
分布式
Spark
GraphX原理与代码实例讲解
Spark
GraphX原理与代码实例讲解作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着互联网和大数据技术的迅猛发展,社交网络
AI大模型应用之禅
·
2025-01-22 07:34
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
spark
电影数据分析系统 Springboot协同过滤-余弦函数推荐系统 爬虫2万+数据 大屏数据展示 + [手把手视频教程 和 开发文档]
spark
电影数据分析系统Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示+[手把手视频教程和开发文档【功能介绍】1.java爬取【豆瓣电影】网站中电影数据,保存为data.csv
QQ-1305637939
·
2025-01-21 22:58
毕业设计
大数据毕设
计算机毕业设计
spark
spring
boot
爬虫
大数据
电影推荐
电影分析
玩转至轻云大数据平台-docker部署篇
产品介绍至轻云是一款超轻量级、企业级大数据计算平台,基于
Spark
生态打造。一键部署,开箱即用。
fanciNate454
·
2025-01-21 16:34
大数据
docker
Python使用
import导入模块时执行了模块的文件但报ModuleNotFoundError错误的原因和解决方法
Python使用
import导入模块时执行了模块的文件但报ModuleNotFoundError错误的原因和解决方法当在Python中使用import语句导入模块时,有时候可能会遇到报ModuleNotFoundError
星光璀璨技术之心
·
2025-01-21 12:56
python
开发语言
Python
【1000个GDB技巧之】GDB中使用python脚本的方法以及4个注意事项(define、python、end、gdb.execute、to_string=True)
要点使用define定义函数在define中使用python…end包围
python使用
的代码(python代码也可以不在包围中)在python中使用gdb命令用gdb.execute,并且需要指定to_stringsgdb
北冥的备忘录
·
2025-01-21 10:06
Linux调试方法
python
调试
gdb
hadoop常用命令
Yarn查看提交到资源调度器的任务(任何用yarn资源的都可以看,比如
spark
、tez、mapreduce)看正在运行的yarn任务yarnapplication-list杀死对应的yarn任务yarnapplication-kill
我要用代码向我喜欢的女孩表白
·
2025-01-21 05:54
hadoop
npm
大数据
python使用
多进程multiprocessing
python使用
多进程multiprocessing1多进程解释2进程的演示3进程池方法4pool.map()的解析pool.map()的基本用法返回值语法示例注意事项适用场景5pool.join()详解示例注意事项
小蜗笔记
·
2025-01-20 19:13
python
python
厦门租房信息分析展示(pycharm+python爬虫+py
spark
+pyecharts)(踩坑记录)
厦门租房信息分析展示(pycharm+python爬虫+py
spark
+pyecharts)(踩坑记录)项目地址http://dblab.xmu.edu.cn/blog/2307/踩坑:
Spark
分析文件
吃西红柿的鸡蛋
·
2025-01-20 18:03
大数据
hadoop
spark
python
Python使用
moviepy模块编辑视频时,有可能会出现“TypeError: ‘module‘ object is not callable”的错误提示
Python使用
moviepy模块编辑视频时,有可能会出现“TypeError:‘module‘objectisnotcallable”的错误提示。
CodeWG
·
2025-01-20 18:02
python
开发语言
python使用
Flask框架创建一个简单的动态日历
0.运行效果运行代码,然后在浏览器中访问http://127.0.0.1:5000/,将看到一个动态日历,能够通过点击按钮切换月份。1.安装Flask首先,确保你已经安装了Flask。如果没有,可以使用以下命令安装:pipinstallFlask测试:fromflaskimportFlask#fromflaskimportFlask,render_template,requestapp=Flask
镜花照无眠
·
2025-01-20 11:47
#
Python
python
flask
开发语言
常用Python GUI库推荐!
Python使用
tkinter可以快速的创建GUI应用程序。由于tkinter是内置到Pyth
老男孩IT教育
·
2025-01-20 04:13
python
开发语言
Hadoop 和
Spark
的内存管理机制分析
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-20 03:27
经验分享
hadoop
spark
大数据
大数据学习(五):如何使用 Livy提交
spark
批量任务--转载
Livy是一个开源的REST接口,用于与
Spark
进行交互,它同时支持提交执行代码段和完整的程序。Livy封装了
spark
-submit并支持远端执行。启动服务器执行以下命令,启动livy服务器。.
zuoseve01
·
2025-01-19 22:15
livy
Spark
Livy 指南及livy部署访问实践
背景:Apache
Spark
是一个比较流行的大数据框架、广泛运用于数据处理、数据分析、机器学习中,它提供了两种方式进行数据处理,一是交互式处理:比如用户使用
spark
-shell,编写交互式代码编译成
spark
house.zhang
·
2025-01-19 22:40
大数据-Spark
大数据
大数据学习(四):Livy的安装配置及py
spark
的会话执行
一个基于
Spark
的开源REST服务,它能够通过REST的方式将代码片段或是序列化的二进制代码提交到
Spark
集群中去执行。
猪笨是念来过倒
·
2025-01-19 21:08
大数据
pyspark
探索数据科学新边界:Apache Livy 开源项目详解
探索数据科学新边界:ApacheLivy开源项目详解incubator-livyApacheLivyisanopensourceRESTinterfaceforinteractingwithApache
Spark
fromanywhere
毕艾琳
·
2025-01-19 21:37
python执行js缺少window变量_
python使用
execjs执行含有document、window等对象的js代码,使用jsdom解决...
当我们分析爬虫时,有时候会遇到一些加密参数,这个时候就需要我们逆向分析jspython执行js有一些第三方库因为我用的Python3,所以没用PyV8(安装网上的方法,也没有安装好,可能我太笨了--!如果有会的麻烦指点一下)我用的比较多的就是js2py和execjs有一次在分析js时,我已经找到了对应的加密方法,在浏览器上运行时,直接拿到了结果,开心的一匹然我把js代码复制下来,在Python里通
weixin_39963440
·
2025-01-19 11:41
大数据公司 Databricks 详解
Databricks是一家在大数据和人工智能领域具有重要影响力的美国企业软件公司,以下是关于它的详细技术解析:1.起源与背景:Databricks成立于2013年,由来自加州大学伯克利分校AMP实验室的
Spark
Bj陈默
·
2025-01-19 10:00
大数据
全面解读 Databricks:从架构、引擎到优化策略
导语:Databricks是一家由Apache
Spark
创始团队成员创立的公司,同时也是一个统一分析平台,帮助企业构建数据湖与数据仓库一体化(Lakehouse)的架构。
克里斯蒂亚诺罗纳尔多阿维罗
·
2025-01-19 09:27
架构
spark
大数据
python使用
pyzbar报错filenotfounderror: could not find module ‘libiconv.dll‘
查了好久的问题,也不知道为什么。记录一下解决办法:libiconv.dll需要安装动态连接库,下载地址:https://download.microsoft.com/download/F/3/5/F3500770-8A08-488E-94B6-17A1E1DD526F/vcredist_x64.exe下载完以后双击安装,安装好就没有问题了。
susu1083018911
·
2025-01-19 04:02
python
Python 网页控制自动化 getEdgeDriver
透过
python使用
edge执行自动化时,原来的代码出现报错了执行报错啦:messageinfo如下显示HTTPSConnectionPool(host='msedgedriver.azureedge.net
chenchihwen
·
2025-01-19 00:34
服务器
mysql
运维
使用 Hadoop 实现大数据的高效存储与查询
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-18 23:24
经验分享
大数据
hadoop
分布式
Python使用
QQ邮箱发送邮件提示
python发送qq邮件htmlimportbase64importsmtplibimporttimefromemail.mime.textimportMIMETextdefsend_QQ_mail_HTML():user='
[email protected]
'#发送方的邮箱账号passwd='xruuwiyxdcouddjg'#授权码receiver='
[email protected]
高质量海王哦
·
2025-01-18 23:53
python
python
Spark
源码分析(一)
Spark
Rpc中序列化与反序列化Serializer的抽象类解读 (正在更新中~)别人能写出来的,你也能行!多学习别人的思路,形成自己的思路,高薪工作奔你而来!
Java序列化实现类JavaSerializer(1)JavaSerializationStream类代码实际例子1:序列化(2)JavaDeserializationStream代码实际例子2:反序列化
Spark
小白的大数据历程
·
2025-01-18 22:07
Spark源码解析
开发语言
spark
大数据
分布式
scala
Spark
源码分析(一)
Spark
Rpc中序列化与反序列化Serializer的抽象类解读 (java序列化部分完结,正在更新RpcEnv部分~)
目录(3)JavaSerializerInstance定义了一个Java序列化实例(1)构造方法参数(2)方法1:serializeStream(3)方法2:deserializeStreamdefaultClassLoader(4)方法3:deserializeStreamloader(5)方法4:serialize(6)方法5:deserializeloader(7)方法6:deseriali
小白的大数据历程
·
2025-01-18 22:37
Spark源码解析
spark
java
python
大数据-257 离线数仓 - 数据质量监控 监控方法 Griffin架构
已更完)HDFS(已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis(已更完)Kafka(已更完)
Spark
武子康
·
2025-01-18 10:29
大数据
离线数仓
大数据
数据仓库
java
后端
hadoop
hive
python 服务端主动发数据_
python使用
socket向客户端发送数据的方法
PythonSocket通讯例子详解创新从模仿开始!python中内置的socket模块使得网络编程更加简单化,下面就通过两个小小脚本来了解客户端如何与服务器端建立socket。客户端代码:#clietn.pyif__name__=='__main__':#判断是否调用自己本身,如果不是则__name__为脚本名称...文章余二五2017-11-17991浏览量pythonsocket模块基本的P
weixin_39565910
·
2025-01-18 09:22
python
服务端主动发数据
py
spark
中删除hdfs的文件夹
在py
spark
中保存rdd的内存到文件的时候,会遇到文件夹已经存在而失败,所以如果文件夹已经存在,需要先删除。搜索了下资料,发现py
spark
并没有提供直接管理hdfs文件系统的功能。
TDengine (老段)
·
2025-01-18 09:21
大数据
spark
hadoop
hdfs
mapreduce
Python 爬虫:获取网页数据的 5 种方法
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-18 07:35
经验分享
python
python
开发语言
爬虫
python捕获异常
try:name="aaa"id="aaa"exceptExceptionase:print("任务报错")print(str(e))print(str(traceback.print_exc()))
spark
.sql
青云游子
·
2025-01-18 02:58
python
Spark
任务提交流程
当包含在applicationmaster中的
spark
-driver启动后,会与资源调度平台交互获取其他执行器资源,并通过反向注册通知对应的node节点启动执行容器。
尘世壹俗人
·
2025-01-18 01:21
大数据Spark技术
大数据
spark
读取、写入Clickhouse以及遇到的问题
最近需要处理Clickhouse里面的数据,经过上网查找总结一下
spark
读写Clickhouse的工具类已经遇到的问题点。具体Clickhouse的讲解本篇不做讲解,后面专门讲解这个。
Alex_81D
·
2025-01-18 01:18
大数据基础
大数据从入门到精通
clickhouse
spark
2024年最新Python:Page Object设计模式_python page object,BTAJ大厂最新面试题汇集
知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、
Spark
、Flink)、数据仓库、Python、前端等等。网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是
m0_60707708
·
2025-01-17 20:36
程序员
python
设计模式
开发语言
2024年总结:大转向
职业转向今年我在职业上尝试做了一个转向,具体的结果可能需要比较长的时间来检验我选择是否正确,所以转向的细节我就不全部展开了,可以确定是我依然会专注在Infra和BigData,比如今年我发布了
Spark
SQL
·
2025-01-17 20:11
年度总结
Java爬虫——使用
Spark
进行数据清晰
1.依赖引入 org.apache.
spark
spark
-core_2.13 3.5.3 org.apache.
spark
spark
-sql_2.13 3.5.32.数据加载从MySQL数据库中加载
Future_yzx
·
2025-01-17 20:59
java
爬虫
spark
上一页
21
22
23
24
25
26
27
28
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他