用python抓取yarn和jstorm界面资源信息在grafana展示

背景：大数据系统分布式计算和存储强大功能推动了科技的进步，而在大数据运维过程中计算资源是时刻要关注的指标。为了能够快速了解集群资源使用率，写了个python脚本将数据入到MySQL，再通过grafana在界面进行展示，当然可以把数据落到时序数据库：tdengine或opntsdb上。本文只用于交流和学习。

#！/usr/bin/env python3
# -*- coding: UTF-8 -*-
#抓取yarn集群的队列资源使用信息和jstorm集群资源信息
#@author zjh
#@date:2022-05-13
#小数点保留1位
import json
import requests
import pymysql
import time
from bs4 import BeautifulSoup

#Resourcemanager资源统计
class Resourcinfo:
    def getresource(self,url_dict):
        #初始化插入数据的列表
        for clustername,urlinfo in url_dict.items():
            tmplistdata = []
            print("集群名称：", clustername)
            #1.集群名称
            url = urlinfo + str('/ws/v1/cluster/scheduler')
            req = requests.get(url)
            #将url请求信息json化
            result_json = json.loads(req.text)
            #取字典值到子队列
            result = result_json["scheduler"]["schedulerInfo"]["rootQueue"]["childQueues"]
            csort = 0
            for allqueue in result:
                csort += 1
                queuename = allqueue["queueName"]
                allresource = allqueue["maxResources"]
                usedresource = allqueue["usedResources"]
            
                if  queuename == "root.compute1" or queuename == "root.compute2":
                    tmplist=[]
                    tmplistdata.append(clustername)
                    # 2.总资源数
                    tmplistdata.append(allresource["memory"])
                    tmplistdata.append(allresource["vCores"])
                    # 3.使用资源
                    tmplistdata.append(usedresource["memory"])
                    tmplistdata.append(usedresource["vCores"])
                    #1集群名称
                    Tclustername = clustername
                    #tmplist.append(Tclustername)
                    #2内存使用量TB
                    Tusedmem = usedresource["memory"] / (1024 * 1024)
                    tmplist.append(Tusedmem)
                    #3总内存TB
                    Tallmem = allresource["memory"] / (1024 * 1024)
                    tmplist.append(Tallmem)
                    #4总cu(cu与内存比计算,1:4)
                    Tallcu = allresource["memory"] / (1024 * 4)
                    tmplist.append(Tallcu)
                    #5内存使用率
                    memusedpercent = (usedresource["memory"]) / allresource["memory"] * 100
                    tmplist.append(memusedpercent)
                    #6vcore使用量
                    cu_used=usedresource["vCores"]
                    tmplist.append(cu_used)
                    #7总CU（按vcore计算）
                    Tallcu = allresource["vCores"]
                    tmplist.append(Tallcu)
                    #8 min总CU
                    minallcu = min(Tallcu,allresource["vCores"])
                    tmplist.append(minallcu)
                    #9 CU使用率
                    cuusedpercent = (usedresource["vCores"]) / allresource["vCores"] * 100
                    #print("CU使用率：" + str('%.1f' % cuusedpercent) + "%")
                    tmplist.append(cuusedpercent)
                    #10最大使用率，从内存和cu使用率比较出最大的值
                    maxused=max(memusedpercent,cuusedpercent)
                    tmplist.append(maxused)
                    #11使用率70%前剩余CU
                    spercent = (70 - maxused) * minallcu / 100
                    tmplist.append(spercent)
                    #12使用率80%前剩余CU
                    epercent = (80 - maxused) * minallcu / 100
                    tmplist.append(epercent)
                    #13时间
                    #对数字限制小数位为 1
                    insertdata=[]
                    for dt in tmplist:
                        #if dt is not str:
                        if dt != '':
                            insertdata.append(round(dt,1))
                    #记录当前时间
                    ctime = time.strftime('%Y-%m-%d %H:%M:%S', time.localtime(time.time()))
                    timeArray = time.strptime(ctime, "%Y-%m-%d %H:%M:%S")
                    timestamp = int(time.mktime(timeArray))
                    insertdata.append(ctime)
                    insertdata.append(timestamp)
                    #将集群名称插到列表的第一位
                    insertdata.insert(0,clustername)
                    #将队列名插到列表的第二位
                    insertdata.insert(1,queuename)
                    #获取集群的节点数
                    getnodes=self.getnodestattus(urlinfo)
                    insertdata.insert(1,getnodes[0])
                    insertdata.insert(2,getnodes[1])
                    
                    SQL = cnnMysql.create_sql(self, insertdata)
                    print(SQL)
                    try:
                       cnnMysql.insertdata2mysql(self, SQL)
                    except ValueError:
                       print('SQL不正确，请检查SQL！！！')

    def getnodestattus(self,yarn_url):
        url = yarn_url + str('/ws/v1/cluster/metrics')
        req = requests.get(url)
        # 将url请求信息json化
        result_json = json.loads(req.text)
        # print(result_json)
        # 取字典值到子队列
        result = result_json["clusterMetrics"]
        totalNodes = result["totalNodes"]
        lostNodes = result["lostNodes"]
        unhealthyNodes = result['unhealthyNodes']
        decommissionedNodes = result['decommissionedNodes']
        rebootedNodes = result['rebootedNodes']
        activeNodes = result['activeNodes']
        return totalNodes,activeNodes

#Jstorm集群资源统计
class JstormRS:
    def getJstormResource(self,url_dict):
        # 初始化插入数据的列表
        for clustername, urlinfo in url_dict.items():
            tmplistdata = []
            # 1.集群名称
            jstormUI_url = urlinfo + str('/cluster?name=xx-jstorm')
            req = requests.get(url=jstormUI_url)
            req.encoding = "utf-8"
            html = req.text
            soup = BeautifulSoup(req.text, features="html.parser")
            jstormweb_items = soup.find_all("table", class_="table table-bordered table-hover table-striped center")
            #临时列表
            infolist=[]
            for jstormweb_item in jstormweb_items:
                list = []
                dd = jstormweb_item.text.strip()
                list.append(dd)
                for i in list:
                    t = i.split('\n')
                    tmplist = []
                    if 'Cluster Name' in t:
                        for j in t:
                            if len(j) > 0:
                                tmplist.append(j)
                        Supervisors = tmplist[7]
                        PortsUsage = tmplist[8]
                        allPorts = PortsUsage.split("/")[1]
                        usePorts = PortsUsage.split("/")[0]
                        Topologies = tmplist[9]
                        allMem = (int(allPorts) * 4)
                        useMem = (int(usePorts) * 4)
                        tPortsUsagePercent = (int(usePorts) / int(allPorts)) * 100
                        PortsUsagePercent = round(tPortsUsagePercent, 1)
                        sPercent = (70 - PortsUsagePercent) * int(allPorts) / 100
                        ePercent = (80 - PortsUsagePercent) * int(allPorts) / 100
            infolist.append(clustername)
            infolist.append(Supervisors)
            infolist.append(allPorts)
            infolist.append(usePorts)
            infolist.append(PortsUsagePercent)
            infolist.append(allMem)
            infolist.append(useMem)
            infolist.append(Topologies)
            infolist.append(round(sPercent,1))
            infolist.append(round(ePercent,1))
            
            SQL=cnnMysql.create_sql(self,infolist)
            print(SQL)
            try:
               cnnMysql.insertdata2mysql(self,SQL)
            except ValueError:
               print('SQL不正确，请检查SQL！！！')

#连接MySQL入数据
class cnnMysql:
    #生成插入SQL语句
    def create_sql(self, data):
        if len(data) < 15:
          sql = "insert into jstorm_cluster_resourceinfon(cluster_name,all_sv,all_workers,use_workers,used_percent,all_mem,used_mem," \
                  "topologies,seventy_percent_reserve,eighty_percent_reserve) " \
                  "values(" + "'" + str(data[0]) + "'" + "," + str(data[1])  + "," + str(data[2]) + "," + str(data[3]) + "," + \
           "'" + str(data[4])  + str('%') + "'" + "," + str(data[5]) + ","  + str(data[6]) + "," + str(data[7]) + "," + str(data[8]) + "," + str(data[9]) + \
              ");"
        else:
            sql = "insert into flink_cluster_resourceinfo(cluster_name,totalNodes,activeNodes,cluster_queuename,mem_used," \
                  "mem_total,cu_scale_mem_total,mem_used_percent,cu_used,total_cu,min_cu,cu_used_percent," \
                  "cu_max_percent,seventy_percent_reserve,eighty_percent_reserve) " \
                  "values(" + "'" + str(data[0]) + "'" + "," + str(data[1]) + "," + str(data[2]) + "," + "'" + str(data[3]) + "'" + "," + "'" + str(data[4]) + str('T') + \
                  "'" + "," + "'" + str(data[5]) + str('T') + "'" + "," + str(data[6]) + "," + "'" + str(data[7]) + \
                  str('%') + "'" + "," + str(data[8]) + "," + str(data[9]) + "," + str(data[10]) + "," + "'" + \
                  str(data[11]) + str('%') + "'" + "," + "'" + str(data[12]) + str('%') + "'" + "," + str(data[13]) + "," + str(data[14]) + \
                  ");"
                  
        return sql
        
    def insertdata2mysql(self,sql):
        # db为所使用的数据库
        connent = pymysql.connect(host='192.168.0.1', user='test', passwd='#Q@123456', db='test', charset='utf8')  
        cursor = connent.cursor()
        cursor.execute(sql)
        #提交任务，数据才会写入数据库
        connent.commit()

    def checkdata_mysql(self,table):
        connent = pymysql.connect(host='192.168.0.1', user='test', passwd='#Q@123456', db='test', charset='utf8') 
        cursor = connent.cursor()
        csql = "select * from flink_cluster_resourceinfo;"
        check=cursor.execute(csql)
        return check

if __name__ == '__main__':
    YarnRSinfo = Resourcinfo()
    yarn_dict = {
         '集群1':'http://192.168.10.8:8088',
         '集群2':'http://192.168.12.1:8088',
         '集群3':'http://192.168.10.8:8088'
    }

    YarnRSinfo.getresource(yarn_dict)
    jstorm_dict = {
      'jstorm集群99': 'http://192.168.10.100:8080',
      'jstorm集群100': 'http://192.168.1.12:8080'
    }
    jsrs = JstormRS()
    jsrs.getJstormResource(jstorm_dict)

获取Yarn jmx信息：
curl -i http://xxx:8088/jmx

Hadoop:service=ResourceManager,name=FSOpDurations
Hadoop:service=ResourceManager,name=JvmMetrics
Hadoop:service=ResourceManager,name=ClusterMetrics
Hadoop:service=ResourceManager,name=RpcActivityForPort8033
Hadoop:service=ResourceManager,name=MetricsSystem,sub=Stats
Hadoop:service=ResourceManager,name=QueueMetrics,q0=root,q1=user02
Hadoop:service=ResourceManager,name=QueueMetrics,q0=root,q1=A,q2=C
Hadoop:service=ResourceManager,name=QueueMetrics,q0=root
Hadoop:service=ResourceManager,name=QueueMetrics,q0=root,q1=A
Hadoop:service=ResourceManager,name=QueueMetrics,q0=root,q1=A,q2=B
Hadoop:service=ResourceManager,name=QueueMetrics,q0=root,q1=default
Hadoop:service=ResourceManager,name=QueueMetrics,q0=root,q1=user01

#QueueMetrics
running_0
running_60
running_300
running_1440
FairShareMB Fair share of memory in MB
FairShareVCores Fair share of CPU in vcores
SteadyFairShareMB Steady fair share of memory in MB
SteadyFairShareVCores Steady fair share of CPU in vcores
MinShareMB Minimum share of memory in MB
MinShareVCores Minimum share of CPU in vcores
MaxShareMB Maximum share of memory in MB
MaxShareVCores Maximum share of CPU in vcores
AppsSubmitted application提交个数
AppsRunning 正在运行的application个数
AppsPending 挂起的application个数
AppsCompleted 完成的application个数
AppsKilled 被杀死的application个数
AppsFailed 失败的application个数
AllocatedMB 已分配的内存量
AllocatedVCores 分配给正在运行的应用的虚拟core
AllocatedContainers 已分配容器数
AggregateContainersAllocated Aggregate # of allocated containers
AggregateContainersReleased Aggregate # of released containers
AvailableMB 可用内存量
AvailableVCores 可用虚拟Core数
PendingMB Pending memory allocation in MB
PendingVCores Pending CPU allocation in virtual cores
PendingContainers # of pending containers
ReservedMB 预留内存量
ReservedVCores 预留虚拟Core数
ReservedContainers 预留容器数
ActiveUsers 激活用户数
ActiveApplications 激活的应用数
AppAttemptFirstContainerAllocationDelayNumOps 为应用分配容器延迟数
AppAttemptFirstContainerAllocationDelayAvgTime 为应用分配容器延迟时间
#FSOpDurations
ContinuousSchedulingRunNumOps Duration for a continuous scheduling run
ContinuousSchedulingRunAvgTime
ContinuousSchedulingRunStdevTime
ContinuousSchedulingRunIMinTime
ContinuousSchedulingRunIMaxTime
ContinuousSchedulingRunMinTime
ContinuousSchedulingRunMaxTime
NodeUpdateCallNumOps Duration to handle a node update
NodeUpdateCallAvgTime
NodeUpdateCallStdevTime
NodeUpdateCallIMinTime
NodeUpdateCallIMaxTime
NodeUpdateCallMinTime
NodeUpdateCallMaxTime
UpdateThreadRunNumOps Duration for a update thread run
UpdateThreadRunAvgTime
UpdateThreadRunStdevTime
UpdateThreadRunIMinTime
UpdateThreadRunIMaxTime
UpdateThreadRunMinTime
UpdateThreadRunMaxTime
UpdateCallNumOps Duration for an update call
UpdateCallAvgTime
UpdateCallStdevTime
UpdateCallIMinTime
UpdateCallIMaxTime
UpdateCallMinTime
UpdateCallMaxTime
PreemptCallNumOps Duration for a preempt call
PreemptCallAvgTime
PreemptCallStdevTime
PreemptCallIMinTime
PreemptCallIMaxTime
PreemptCallMinTime
PreemptCallMaxTime
#ClusterMetrics
NumActiveNMs active NMs
NumDecommissionedNMs decommissioned NMs
NumLostNMs lost NMs
NumUnhealthyNMs unhealthy NMs
NumRebootedNMs Rebooted NMs
AMLaunchDelayNumOps AM container launch delay
AMLaunchDelayAvgTime
AMRegisterDelayNumOps AM register delay
AMRegisterDelayAvgTime
#RpcActivityForPort8033
ReceivedBytes Total number of received bytes
SentBytes Total number of sent bytes
RpcQueueTimeNumOps Total number of RPC calls
RpcQueueTimeAvgTime Average queue time in milliseconds
RpcProcessingTimeNumOps Total number of RPC calls (same to RpcQueueTimeNumOps)
RpcProcessingTimeAvgTime Average Processing time in milliseconds
RpcAuthenticationFailures Total number of authentication failures
RpcAuthenticationSuccesses Total number of authentication successes
RpcAuthorizationFailures Total number of authorization failures
RpcAuthorizationSuccesses Total number of authorization successes
RpcClientBackoff
NumOpenConnections NumOpenConnections
CallQueueLength Current length of the call queue

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
python抓包与解包_Python—网络抓包与解包（pcap、dpkt） weixin_39691055 python抓包与解包
pcap安装[root@localhost~]#pipinstallpypcap抓包与解包#-*-coding:utf-8-*-importpcap,dpktimportre,threading,requests__black_ip=['103.224.249.123','203.66.1.212']#抓包：param1eth_name网卡名，如：eth0,eth3。param2p_type日志捕
华为OD机试 - 单向链表中间节点（Java & JS & Python & C & C++）华为OD题库华为od 链表 java
须知哈喽，本题库完全免费，收费是为了防止被爬，大家订阅专栏后可以私信联系退款。感谢支持文章目录须知题目描述输出描述解析代码题目描述给定一个单链表L，请编写程序输出L中间结点保存的数据。如果有两个中间结点，则输出第二个中间结点保存的数据。例如：给定L为1→7→5，则输出应该为7；给定L为1→2→3→4，则输出应该为3；输入描述每个输入包含1个测试用例。每个测试用例：第一行给出链表首结点的地址、结点总
python 推导式(派生、衍生) sanduo112 人工智能 python windows 开发语言
python推导式一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。2.列表(list)推导式3.字典(dict)推导式4.集合(set)推导式5.元组(tuple)推导式二、代码概述一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。Python支持各种数
数据分析：低代码平台助力大数据时代的飞跃发展快乐非自愿数据分析低代码大数据
随着信息技术的突飞猛进，我们身处于一个数据量空前增长的时代——大数据时代。在这个时代背景下，数据分析已经成为企业决策、政策制定、科学研究等众多领域不可或缺的重要工具。然而，面对海量的数据和日益复杂多变的分析需求，传统的数据分析方法往往捉襟见肘，难以应对。幸运的是，低代码平台的兴起为大数据分析注入了新的活力，成为推动大数据时代发展的重要力量。低代码平台，顾名思义，是一种通过少量甚至无需编写代码，就能
数据挖掘|数据预处理|基于Python的数据标准化方法皖山文武数据挖掘数据建模与分析 python 数据挖掘开发语言
基于Python的数据标准化方法1.z-score方法2.极差标准化方法3.最大绝对值标准化方法在数据分析之前，通常需要先将数据标准化（Standardization），利用标准化后的数据进行数据分析，以避免属性之间不同度量和取值范围差异造成数据对分析结果的影响。1.z-score方法Z-score方法是基于原始数据的均值和标准差来进行数据标准化的，处理后的数据均值为0，方差为1，符合标准正态分布
CSV指南：Python程序获取大型CSV文件行数孤独打铁匠Julian 笔记经验分享 python
本指南提供了几种使用Python来获取大型CSV文件行数的方法，并解释了每种方法的适用场景。方法1:使用csv.reader处理复杂CSV文件当你的CSV文件中包含多行字段（即某些字段的值中包含换行符）时，使用csv.reader是一个可靠的选择，因为它能够正确处理这些复杂情况。这个方法适用于大多数大小的CSV文件，但是对于非常大的文件，读取整个文件可能会占用较多的时间和内存。对于极大的文件，考虑
helm 部署 Kube-Prometheus + Grafana + 钉钉告警部署 Kube-Prometheus zxj19880502 grafana prometheus
背景角色IPK8S版本容器运行时k8s-master-1172.16.16.108v1.24.1containerd://1.6.8k8s-node-1172.16.16.109v1.24.1containerd://1.6.8k8s-node-2172.16.16.110v1.24.1containerd://1.6.8安装kube-prometheusmkdir-p/data/yaml/kub
谷歌浏览器驱动Chromedriver（114-120版本）文件以及驱动下载教程 pigerr杨 Python python chrome drivers
ChromeDriver官方网站GitHub||GoogleChromeLabs/chrome-for-testingChromeDriver113-125_JSONChromeforTestingavailability123-125zip白月黑羽Python基础|进阶|Qt图形界面|Django|自动化测试|性能测试|JS语言|JS前端|原理与安装
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
python转码 Desamond python 开发语言
转码在许多场景中都有应用，以下是一些常见的场景：网页开发：当用户在网页上输入文本时，可能需要将特殊字符（如空格、引号、特殊符号等）进行转码，以防止这些字符对URL或HTML代码产生干扰。文件名处理：在处理文件名时，可能需要将特殊字符进行转码，以避免文件名被错误地解析或显示。数据传输：在数据传输过程中，为了确保数据的完整性和正确性，可能需要将数据中的特殊字符进行转码。数据存储：在数据库或数据存储中，
排序算法太多？常用排序都在这了，一篇文章总结和实现所有面试会考的排序算法（基于Python实现）宇宙之一粟不归路之Python #IT面试题收集与总结数据结构与算法算法数据结构排序算法 python java
文章目录排序算法1.常见的排序算法1.1选择排序1.1.1思想1.1.2实现**1.1.3选择排序分析**1.2冒泡排序**1.2.1思想****1.2.2实现****1.2.3冒泡排序分析**1.3插入排序**1.3.1思想****1.3.2实现****1.3.3插入排序分析**1.4归并排序☆☆★**1.4.1思想****1.4.2实现****1.4.3归并排序分析**1.5快速排序☆★★**
27.Python从入门到精通—Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为以山河作礼。 #Python基础入门—详解版 python java 服务器
27.从入门到精通：Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理在Python中，异常处理是一种处理程序在执行期间可能遇到的错误的方法。当Python解释器遇到错误时，它会引发异常。异常是一种Python对象，它包含有关错误的信息，例如错误类型和错误位置。为了处理异常，您可以使用try-except语句。在
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
Python | Redis工具类 -拟墨画扇- Python redis 数据库缓存 python
一、需求自动连接Redis数据库，通过连接池处理数据对输出结果进行Log打印并保存到文件二、代码Utils.redisUtils.py#!/usr/bin/envpython#-*-coding:utf-8-*-importredisfromUtils.loggerimportlog"""Redis数据格式(1)字符串|存储形式:key-value:str-存储二进制数据:可以存储任意类型的数据，
Python dict字符串转json对象，小数精度丢失问题朝如青丝暮成雪 json python
一前言JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式，dict是Python的一种数据格式。本篇介绍一个float数据转换时精度丢失的案例。二问题描述importjsontest_str1='{"π":3.1415926535897932384626433832795028841971}'test_str2='{"value":10.00000}'print
Apache Kafka的伸缩性探究：实现高性能、弹性扩展的关键 i289292951 kafka kafka
引言ApacheKafka作为当今最流行的消息中间件之一，以其强大的伸缩性著称。在大数据处理、流处理和实时数据集成等领域，Kafka的伸缩性为其在面临急剧增长的数据流量和多样化业务需求时提供了无与伦比的扩展能力。本文将深入探讨Kafka如何通过其独特的架构设计实现高水平的伸缩性，以及在实际部署中如何优化和利用这一特性。一、Kafka伸缩性的核心设计分区（Partitioning）与水平扩展Kafk
Python+Requests模拟发送GET请求爱学习的执念自动化测试软件测试技术分享 python 开发语言
模拟发送GET请求前置条件：导入requests库一、发送不带参数的get请求代码如下：以百度首页为例importrequests#发送get请求response=requests.get(url="http://www.baidu.com")print(response.content.decode("utf-8"))#以utf-8的编码输出内容二、发送带参数的get请求发送带参数的get请求有
Python极速入门：五分钟开启实战之旅！知白守黑V Python 编程语言系统运维 python 编程语言 python开发 python学习 python入门 python数据分析
1.Python基础语法和结构：了解Python的基本语法，包括变量、数据类型、运算符、注释等。控制流：掌握条件语句（if-elif-else）、循环（for和while）及其控制（break和continue）。函数：学习如何定义和使用函数，包括参数传递、返回值、作用域和闭包。模块和包：理解如何导入和使用模块，以及如何创建和使用自己的包。2.数据处理列表、元组和集合：学习这些序列类型的操作和方法
Python Flask 使用数据库安果移不动 python flask 开发语言
pipinstallflask_sqlalchemy官方文档：Flask-SQLAlchemy—Flask-SQLAlchemyDocumentation(3.1.x)为了不报错也需要导入另外两个库#pipinstallflask_sqlalchemy#pipinstallmysqlclient完整代码importosfromflaskimportFlaskfromflask_sqlalchemy
PaperWeekly sapienst Papers PaperwithCode General ML
1.Python软件包解决DL在未见过的数据分布下性能差的问题：（1）神经网络和损失分离的模块化设计（2）强大便捷的基准测试能力（3）易于使用但难以修改（4）github:https://github.com/marrlab/domainlabTrainer和Models之间是什么关系Trainer和Models是DomainLab中的两个核心概念。Trainer是一个用于指导数据流向模型并计算S
使用Python读取Excel文件并计算平均分嘻嘻爱编码 Python从入门到放弃 python excel 开发语言
在这篇博客中，我们将探讨如何使用Python的pandas库来读取Excel文件，并计算其中数据的平均分。pandas是一个强大的数据分析工具，它允许我们以简单直观的方式处理表格数据。安装必要的库在开始之前，确保你的环境中安装了pandas和openpyxl库。可以使用以下命令进行安装：pipinstallpandasopenpyxl读取Excel文件首先，我们需要读取Excel文件。假设我们有一
python项目练习——7.网站访问日志分析器 F—— python项目练习 python 信息可视化数据分析数据挖掘开发语言学习
项目功能分析：这个项目可以读取网站的访问日志文件，统计访问量、独立访客数、访问来源等信息，并以图表或表格的形式展示出来。这个项目涉及到文件操作、数据处理、数据可视化等方面的技术。示例代码：importrefromcollectionsimportCounterimportmatplotlib.pyplotaspltdefparse_log_file(log_file):#读取日志文件内容witho
python的while双重循环九九乘法表 Jinm_R python 开发语言
a=1whilea<=9:b=1#乘数每次需要从1开始whileb<=a:print(f"{a}*{b}={a*b}\t",end='')#\t为制表符使乘法表整齐end=''代表用空格代替换行b+=1a+=1print()#乘数每加一换行
【Python】成功解决ModuleNotFoundError: No module named ‘torchinfo‘ 高斯小哥 BUG解决方案合集 python pytorch 新手入门学习 debug
【Python】成功解决ModuleNotFoundError:Nomodulenamed‘torchinfo’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文
centos7 安装influxdb+telegraf+grafana 监控服务器吕吕-lvlv grafana 服务器运维
influxdbinfluxdb是一个时间序列数据库,所有数据记录都会打上时间戳,适合存储数字类型的内容telegraftelegraf可以用于收集系统和服务的统计数据并发送到influxdbgrafanagrafana是一个界面非常漂亮,可直接读取influxdb数据展示成各种图表的开源可视化web软件安装并启动influxdb数据库vim/etc/yum.repos.d/influxdb.re
山东省大数据局副局长禹金涛一行莅临聚合数据走访调研聚合数据 API 大数据人工智能 API
3月19日，山东省大数据局党组成员、副局长禹金涛莅临聚合数据展开考察调研。山东省大数据局数据应用管理与安全处处长杨峰，副处长都海明参加调研，苏州市大数据局副局长汤晶陪同。聚合数据董事长左磊等人接待来访。调研组一行参观了聚合数据展厅，了解了聚合数据的发展历程、数据产品、应用案例、奖项荣誉等情况。并就企业在数据处理和应用方面取得的成绩进行了深入交流。作为最早一批进入大数据行业的企业，聚合数据深耕行业十
Python自动化测试web常见框架汇总自动化测试薰儿软件测试技术分享 python 前端开发语言
1、前言目前，有非常多的Python框架，用来帮助你更轻松的创建web应用。这些框架把相应的模块组织起来，使得构建应用的时候可以更快捷，也不用去关注一些细节（例如socket和协议），所以需要的都在框架里了。接下来我们会介绍不同的选项。经过初期的不起眼，Python已经成为互联网最流行的服务端编程语言之一。根据W3Techs的统计，它被用于很多的大流量的站点很多的大流量的站点很多的大流量的站点，超
python安装jupter在线ide 晚风拂柳颜生活小经验 python3 ide jupter
我在虚拟3.6.8的环境里面安装的，具体用了以下命令；pipinstallipython-ihttps://mirrors.aliyun.com/pypi/simple/pipinstalljupyter-ihttps://mirrors.aliyun.com/pypi/simple/jupyternotebook当然，jupter可以直接通过python环境里script目录下的jupyter-
opencv 十八 python下实现0缓存掉线重连的rtsp直播流播放器摸鱼的机器猫 opencv实战 opencv python 缓存
使用opencv打开rtsp视频流时，会因为网络问题导致VideoCapture掉线；也会因为图像的后处理阶段耗时过长导致opencv缓冲区数据堆积，从而使程序无法及时处理最新的数据。为此对cv2.VideoCapture进行封装，实现0缓存掉线重连的rtsp直播流播放器，让程序能一直处理最新的数据。代码实现fromcollectionsimportdequeimportthreadingimpo
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一

用python抓取yarn和jstorm界面资源信息在grafana展示

你可能感兴趣的:(大数据,Python,python,grafana,开发语言)