wumingxiaoyao

Python 玩转数据 13 - 数据读写 Data I/O for XML File Format

引言

本文主要介绍有关 Python 对 XML 文件格式的读写，及格式化，序列化，更多 Python 进阶系列文章，请参考 Python 进阶学习玩转数据系列

内容提要：

JSON vs. XML
Python 对 XML 数据读写模块
xml ElementTree API
设置获取 XML 属性 .set() and .get()
格式化 XML 输出
Pretty Printing of the XML Tree
xml ElementTree 解析 XML
XPath 遍历 XML 例子
处理 XML Exceptions
读取 XML 转换成 Pandas DataFrame
用 xmltodict 转换 XML 成 JSON

JSON vs. XML

XML: Extensible Markup Language
JSON：JavaScript Object Notation

Example

JSON Example:

XML Example:

比较

相似:
● 两者都是自我描述性语言，可读性强
● 两者都是层级式结构
● 两者都可以被多种语言解析并使用
● 两者都可以从一个 XMLHttpRequest 获取
不同:
● JSON 不用结束标签 tag
● JSON 更短
● JSON 读写更快
● JSON 可以用数组
● XML 只能通过 XML parser 解析
● JSON 可以被普通的 JavaScript function 解析
为什么 JSON 比 XML 更好?
● XML 比 JSON 更难解析
● JSON 可以解析成现在的 JavaScript 对象.

Python 对 XML 数据读写模块

相关资料

XML to JSON with xmltodict
● https://micropyramid.com/blog/how-to-convert-xml-content-into-json-using-xmltodict/
● https://pypi.org/project/xmltodict/
XML to Pandas DataFrame
● http://gokhanatil.com/2017/11/python-for-data-science-importing-xml-to-pandas-dataframe.html
XML Pretty Printing with lxml
● https://lxml.de/tutorial.html
XML Parser: lxml
● https://lxml.de/xpathxslt.html

xml ElementTree API

用来创建和解析 XML

两个主要的类:
● ElementTree - XML and document 操作
● Element - XML element 的封装
ElementTree.find() 和 ElementTree.findall() 方法:
提供 XPath 搜索
• XPath 代表 XML Path Language
• XPath 使用路径的格式来定位 XML 文档中的 nodes 节点

创建 XML:

用 Element 创建一个 root node
用 ElementTree 创建基于 root node 的一个 tree
用 tree.write() 将 XML Tree 保存到一个 XML 文件

from xml.etree.cElementTree import ElementTree
from xml.etree.cElementTree import Element

root = Element("root")
tree = ElementTree(root)

tree.write('results.xml', encoding='utf8')

输出：
生成的 results.xml 内容：

举例：

from xml.etree.cElementTree import ElementTree
from xml.etree.cElementTree import Element
from collections import namedtuple

root = Element('contacts') # 
tree = ElementTree(root)

# create ContactRecord class, its fields are first, last, age and email
Contact = namedtuple("ContactRecord", 'first last age email')
# Information to populate XML tree with 
records = [
    Contact('Tom', 'Smith', 53, '[email protected]'),
    Contact('Phil', 'Hammer', 42, '[email protected]'),
    Contact('Mary', 'Fast', 22, '[email protected]'),
    Contact('Jessica', 'Rest', 33, '[email protected]')
]

records.sort(key=lambda a: a.age, reverse=True)

print("records:\n{}".format(records))

# Now build and append nodes to the XML tree:
for record in records:
    contact = Element('contact') # 
    name    = Element('name') 
    first   = Element('first') # 
    last    = Element('last') 
    email   = Element('email')
    
    name.attrib = {'age': str(record.age)} # < name age='43'>
    first.text = record.first
    last.text = record.last
    email.text = record.email
    name.append(first) # John
    name.append(last)
    contact.append(name)
    contact.append(email)
    root.append(contact)

#  save the built XML tree as an XML file:
tree.write('results.xml', encoding='utf8')

输出：

records:
[ContactRecord(first='Tom', last='Smith', age=53, email='[email protected]'), ContactRecord(first='Phil', last='Hammer', age=42, email='[email protected]'), ContactRecord(first='Jessica', last='Rest', age=33, email='[email protected]'), ContactRecord(first='Mary', last='Fast', age=22, email='[email protected]')]

生成的 results.xml 内容：

设置获取 XML 属性 .set() and .get()

设置和获取属性的方法：

.set(): 设置属性
element.set(name, value)

.attrib(): 设置属性
element.attrib = {name:value}
element.attrib[name] = value

.get(): 获取属性
element.get(name)
element.get(name, default value)

举例：

from xml.etree.cElementTree import ElementTree
from xml.etree.cElementTree import Element
from collections import namedtuple

root = Element('contacts') # 
tree = ElementTree(root)

# create ContactRecord class, its fields are first, last, age and email
Contact = namedtuple("ContactRecord", 'first last age email')
# Information to populate XML tree with 
records = [
    Contact('Tom', 'Smith', 53, '[email protected]'),
    Contact('Phil', 'Hammer', 42, '[email protected]'),
    Contact('Mary', 'Fast', 22, '[email protected]'),
    Contact('Jessica', 'Rest', 33, '[email protected]')
]

records.sort(key=lambda a: a.age, reverse=True)

print("records:\n{}".format(records))

# Now build and append nodes to the XML tree:
for record in records:
    name = Element('name')
    name.set('age', str(record.age))
    # or
    name.attrib = {'age':str(record.age)}
    # or
    name.attrib['age'] = str(record.age)
    # ... the rest of the code
    
    # possible KeyError
    print("age attribute is", name.attrib['age'])
    # possible None
    print("age attribute is", name.get('age'))
    # will use a default 
    print("no age_foo attribute, default is", name.get('age_foo', 50))

输出：

records:
[ContactRecord(first='Tom', last='Smith', age=53, email='[email protected]'), ContactRecord(first='Phil', last='Hammer', age=42, email='[email protected]'), ContactRecord(first='Jessica', last='Rest', age=33, email='[email protected]'), ContactRecord(first='Mary', last='Fast', age=22, email='[email protected]')]
age attribute is 53
age attribute is 53
no age_foo attribute, default is 50
age attribute is 42
age attribute is 42
no age_foo attribute, default is 50
age attribute is 33
age attribute is 33
no age_foo attribute, default is 50
age attribute is 22
age attribute is 22
no age_foo attribute, default is 50

Pretty Printing of the XML Tree

• xml ElementTree 不支持漂亮的格式输出
• minidom API 可以作为一个 work-around
• lxml 版本的 ElementTree 支持漂亮的格式选项

lxml 版本的 ElementTree

https://lxml.de/xpathxslt.html

● 推荐使用 LXML，有丰富的解析器
● 是基于 libxml2 C++ library 开发的
● 是一个验证解析器: 支持 schema 和 DTDs
● 支持 full XPath 语法, 和 XSLT 能力
● 安装: pip install lxml

XLST 是 XML 样式语言 style sheet language，利用它可以将一个 XML 文档转换成 HTML

DTD 是文档类型定义，一个 DID 定义 XML 文档的结构，合法的元素及其属性

letree.tostring(lroot, pretty_print=True).decode(‘utf8’)

import lxml.etree as letree
from collections import namedtuple

# Example: XML pretty printing with lxml
lroot = letree.Element("root")

Contact = namedtuple("ContactRecord", 'first last age email')

records = [
    Contact('Tom', 'Smith', 53, '[email protected]'),
    Contact('Phil', 'Hammer', 42, '[email protected]'),
    Contact('Mary', 'Fast', 22, '[email protected]'),
    Contact('Jessica', 'Rest', 33, '[email protected]')
]
records.sort(key=lambda a: a.age, reverse=True)

for record in records:
    
    contact = letree.Element('contact') # 
    name    = letree.Element('name') 
    first   = letree.Element('first') # 
    last    = letree.Element('last') 
    email   = letree.Element('email')
    
    name.set('age', str(record.age))
    first.text = record.first
    last.text = record.last
    email.text = record.email
    name.append(first) # John
    name.append(last)
    contact.append(name)
    contact.append(email)
    lroot.append(contact)

print(letree.tostring(lroot, pretty_print=True).decode('utf8'))

输出：

<root>
  <contact>
    <name age="53">
      <first>Tom</first>
      <last>Smith</last>
    </name>
    <email>tsmith@boo.com</email>
  </contact>
  <contact>
    <name age="42">
      <first>Phil</first>
      <last>Hammer</last>
    </name>
    <email>phammer@boo.com</email>
  </contact>
  <contact>
    <name age="33">
      <first>Jessica</first>
      <last>Rest</last>
    </name>
    <email>jrest@goo.com</email>
  </contact>
  <contact>
    <name age="22">
      <first>Mary</first>
      <last>Fast</last>
    </name>
    <email>mfast@boo.com</email>
  </contact>
</root>

Minidom API

pretty_xml = minidom.parseString(xml_str).toprettyxml(encoding=‘utf8’)

import xml.etree.cElementTree as etree
from xml.etree.cElementTree import ElementTree
from xml.etree.cElementTree import Element
from collections import namedtuple
from xml.dom import minidom

root = Element('contacts') # 
tree = ElementTree(root)

# create ContactRecord class, its fields are first, last, age and email
Contact = namedtuple("ContactRecord", 'first last age email')
# Information to populate XML tree with 
records = [
    Contact('Tom', 'Smith', 53, '[email protected]'),
    Contact('Phil', 'Hammer', 42, '[email protected]'),
    Contact('Mary', 'Fast', 22, '[email protected]'),
    Contact('Jessica', 'Rest', 33, '[email protected]')
]

records.sort(key=lambda a: a.age, reverse=True)

print("records:\n{}".format(records))

# Now build and append nodes to the XML tree:
for record in records:
    contact = Element('contact') # 
    name    = Element('name') 
    first   = Element('first') # 
    last    = Element('last') 
    email   = Element('email')
    
    name.attrib = {'age': str(record.age)} # < name age='43'>
    first.text = record.first
    last.text = record.last
    email.text = record.email
    name.append(first) # John
    name.append(last)
    contact.append(name)
    contact.append(email)
    root.append(contact)

xml_str = etree.tostring(root)
pretty_xml = minidom.parseString(xml_str).toprettyxml(encoding='utf8')
print(pretty_xml.decode())  

with open("pretty.xml", 'w') as f:
    f.write(pretty_xml.decode())

输出：

records:
[ContactRecord(first='Tom', last='Smith', age=53, email='[email protected]'), ContactRecord(first='Phil', last='Hammer', age=42, email='[email protected]'), ContactRecord(first='Jessica', last='Rest', age=33, email='[email protected]'), ContactRecord(first='Mary', last='Fast', age=22, email='[email protected]')]
<?xml version="1.0" encoding="utf8"?>
<contacts>
        <contact>
                <name age="53">
                        <first>Tom</first>
                        <last>Smith</last>
                </name>
                <email>tsmith@boo.com</email>
        </contact>
        <contact>
                <name age="42">
                        <first>Phil</first>
                        <last>Hammer</last>
                </name>
                <email>phammer@boo.com</email>
        </contact>
        <contact>
                <name age="33">
                        <first>Jessica</first>
                        <last>Rest</last>
                </name>
                <email>jrest@goo.com</email>
        </contact>
        <contact>
                <name age="22">
                        <first>Mary</first>
                        <last>Fast</last>
                </name>
                <email>mfast@boo.com</email>
        </contact>
</contacts>

生成的 pretty.xml 内容：

xml ElementTree 解析 XML

results.xml 内容：


<contacts><contact><name age="53"><first>Tomfirst><last>Smithlast>name><email>[email protected]email>contact><contact><name age="42"><first>Philfirst><last>Hammerlast>name><email>[email protected]email>contact><contact><name age="33"><first>Jessicafirst><last>Restlast>name><email>[email protected]email>contact><contact><name age="22"><first>Maryfirst><last>Fastlast>name><email>[email protected]email>contact>contacts>

解析 results.xml 内容

from xml.etree.cElementTree import ElementTree
from collections import namedtuple

Contact = namedtuple('ContactRecord', 'first last age email')
tree = ElementTree().parse('results.xml')
contacts = []

for contact in tree.getiterator('contact'):
    first = contact.find('.//first').text
    last = contact.find('.//last').text
    age = contact.find('./name').get('age')
    email = contact.find('.//email').text
    contacts.append(Contact(first, last, age, email))
print(contacts)

输出：

[ContactRecord(first='Tom', last='Smith', age='53', email='[email protected]'), ContactRecord(first='Phil', last='Hammer', age='42', email='[email protected]'), ContactRecord(first='Jessica', last='Rest', age='33', email='[email protected]'), ContactRecord(first='Mary', last='Fast', age='22', email='[email protected]')]

XPath 遍历 XML 例子

from xml.etree.cElementTree import ElementTree

xml = '''

  
    
      
        
          2260
        
      
      
        
          
            
              1853
            
          
        
      
    
        
      
        
          3312
        
      
      
        
          
            
              1853
            
          
        
      
    
  
'''

with open("xpath.xml",'w') as f:
    f.write(xml)

fp = open("xpath.xml",'r')
root = ElementTree().parse(fp)
elements = root.findall('Items/Item/ItemAttributes/ListPrice/Amount')
for i in elements:
    print(i.text)

输出：

2260
3312

处理 XML Exceptions

XML 操作可能会抛出异常，所以需要用 try-except 来处理异常。

举例：

from xml.etree.cElementTree import ElementTree
from xml.etree.cElementTree import ParseError
from collections import namedtuple
import sys

try:
    tree = ElementTree().parse('results.xml')
except ParseError as e:
    print('Parse error: {err}'.format(err=e))
    sys.exit()

contacts = []
Contact = namedtuple('ContactRecord', 'first last age email')

for contact in tree.getiterator('contact'):
    try:
        first = contact.find('.//first').text
        last = contact.find('.//last').text
        age = contact.find('./name').get('age')
        email = contact.find('.//email').text
        contacts.append(Contact(first, last, age, email))
    except AttributeError as e:
        print('Element error: {err}'.format(err=e))
print(contacts)

输出：

[ContactRecord(first='Tom', last='Smith', age='53', email='[email protected]'), ContactRecord(first='Phil', last='Hammer', age='42', email='[email protected]'), ContactRecord(first='Jessica', last='Rest', age='33', email='[email protected]'), ContactRecord(first='Mary', last='Fast', age='22', email='[email protected]')]

读取 XML 转换成 Pandas DataFrame

from xml.etree.cElementTree import ElementTree
from xml.etree.cElementTree import ParseError
import pandas as pd
import sys

cols = ['first', 'last','age', 'email']

xml_df = pd.DataFrame(columns = cols,dtype=str)

try:
    tree = ElementTree().parse('results.xml')
except ParseError as e:
    print('Parse error: {err}'.format(err=e))
    sys.exit()

for contact in tree.getiterator('contact'):
    try:
        first = contact.find('.//first').text
        last = contact.find('.//last').text
        age = contact.find('./name').get('age')
        email = contact.find('.//email').text
        xml_df = xml_df.append(
            pd.Series([first, last, age, email],index=cols),
            ignore_index=True)
    except AttributeError as e:
        print('Element error: {err}'.format(err=e))

print("xml_df:\n{}".format(xml_df))

输出：

xml_df:
     first    last age            email
0      Tom   Smith  53   tsmith@boo.com
1     Phil  Hammer  42  phammer@boo.com
2  Jessica    Rest  33    jrest@goo.com
3     Mary    Fast  22    mfast@boo.com

用 xmltodict 转换 XML 成 JSON

• pip install xmltodict
• read XML to OrderedDict

有关 JSON 和 Python Object 序列化和反序列化，请参考Python JSON 操作 - JSON 与 Python 对象，自定义对象之间的互相转化

解析 results.xml 成 JSON 格式：


<contacts><contact><name age="53"><first>Tomfirst><last>Smithlast>name><email>[email protected]email>contact><contact><name age="42"><first>Philfirst><last>Hammerlast>name><email>[email protected]email>contact><contact><name age="33"><first>Jessicafirst><last>Restlast>name><email>[email protected]email>contact><contact><name age="22"><first>Maryfirst><last>Fastlast>name><email>[email protected]email>contact>contacts>

import xmltodict
import json

with open('results.xml') as f:
    xml_input = f.read()

ordered_dict_object_from_xml = xmltodict.parse(xml_input)
print("ordered_dict_object_from_xml:\n{}".format(ordered_dict_object_from_xml))

# serialize ordered_dict_object to json str
json_str_from_xml = json.dumps(ordered_dict_object_from_xml)
print("json_str_from_xml:\n{}".format(json_str_from_xml))

# deserialize json str to python object
json_from_xml = json.loads(json_str_from_xml)
print("json_from_xml:\n{}".format(json_from_xml))

输出：

ordered_dict_object_from_xml:
OrderedDict([('contacts', OrderedDict([('contact', [OrderedDict([('name', OrderedDict([('@age', '53'), ('first', 'Tom'), ('last', 'Smith')])), ('email', '[email protected]')]), OrderedDict([('name', OrderedDict([('@age', '42'), ('first', 'Phil'), ('last', 'Hammer')])), ('email', '[email protected]')]), OrderedDict([('name', OrderedDict([('@age', '33'), ('first', 'Jessica'), ('last', 'Rest')])), ('email', '[email protected]')]), OrderedDict([('name', OrderedDict([('@age', '22'), ('first', 'Mary'), ('last', 'Fast')])), ('email', '[email protected]')])])]))])
json_str_from_xml:
{"contacts": {"contact": [{"name": {"@age": "53", "first": "Tom", "last": "Smith"}, "email": "[email protected]"}, {"name": {"@age": "42", "first": "Phil", "last": "Hammer"}, "email": "[email protected]"}, {"name": {"@age": "33", "first": "Jessica", "last": "Rest"}, "email": "[email protected]"}, {"name": {"@age": "22", "first": "Mary", "last": "Fast"}, "email": "[email protected]"}]}}
json_from_xml:
{'contacts': {'contact': [{'name': {'@age': '53', 'first': 'Tom', 'last': 'Smith'}, 'email': '[email protected]'}, {'name': {'@age': '42', 'first': 'Phil', 'last': 'Hammer'}, 'email': '[email protected]'}, {'name': {'@age': '33', 'first': 'Jessica', 'last': 'Rest'}, 'email': '[email protected]'}, {'name': {'@age': '22', 'first': 'Mary', 'last': 'Fast'}, 'email': '[email protected]'}]}}

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
python抓包与解包_Python—网络抓包与解包（pcap、dpkt） weixin_39691055 python抓包与解包
pcap安装[root@localhost~]#pipinstallpypcap抓包与解包#-*-coding:utf-8-*-importpcap,dpktimportre,threading,requests__black_ip=['103.224.249.123','203.66.1.212']#抓包：param1eth_name网卡名，如：eth0,eth3。param2p_type日志捕
android 自定义曲线图,Android自定义View——贝赛尔曲线 weixin_39767513 android 自定义曲线图
个人博客：haichenyi.com。感谢关注本文针对有一定自定义View的童鞋，最好对贝赛尔曲线有辣么一丢丢了解，不了解也没关系。花5分钟看一下GcsSloop的安卓自定义View进阶-Path之贝塞尔曲线。本文的最终效果图：最终效果图.gif思路首先他是一个只有上半部分的正弦形状的水波纹，很规则。其次，他这个正弦图左右在移动。然后，就是它这个自定义View，上下也在移动，是慢慢增加的最后，优化
浪潮 M5系列服务器IPMI无法监控存储RAID卡问题. Songxwn 硬件服务器服务器运维
简介浪潮的M5代服务器，可能有WebBMC无法查看存储RAID/SAS卡状态的情况，可以通过以下方式修改。修改完成后重启BMC即可生效。ESXiIPMITools使用：https://songxwn.com/ESXi8_IPMI/（Linux也可以直接使用）Linux/ESXiIPMITool下载：https://songxwn.com/file/ipmitoolWindows下载：https:/
华为OD机试 - 单向链表中间节点（Java & JS & Python & C & C++）华为OD题库华为od 链表 java
须知哈喽，本题库完全免费，收费是为了防止被爬，大家订阅专栏后可以私信联系退款。感谢支持文章目录须知题目描述输出描述解析代码题目描述给定一个单链表L，请编写程序输出L中间结点保存的数据。如果有两个中间结点，则输出第二个中间结点保存的数据。例如：给定L为1→7→5，则输出应该为7；给定L为1→2→3→4，则输出应该为3；输入描述每个输入包含1个测试用例。每个测试用例：第一行给出链表首结点的地址、结点总
python 推导式(派生、衍生) sanduo112 人工智能 python windows 开发语言
python推导式一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。2.列表(list)推导式3.字典(dict)推导式4.集合(set)推导式5.元组(tuple)推导式二、代码概述一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。Python支持各种数
【算法分析与设计】去除重复字母五敷有你算法分析与设计 java javascript 开发语言算法数据结构
个人主页：五敷有你系列专栏：算法分析与设计⛺️稳中求进，晒太阳题目给你一个字符串s，请你去除字符串中重复的字母，使得每个字母只出现一次。需保证返回结果的字典序最小（要求不能打乱其他字符的相对位置）。示例示例1：输入：s="bcabc"输出："abc"示例2：输入：s="cbacdcbc"输出："acdb"思路贪心+单调栈实现【字符串删除一个字符使其字典序最小的贪心策略】：对于两个长度相同的字符串，
数据挖掘|数据预处理|基于Python的数据标准化方法皖山文武数据挖掘数据建模与分析 python 数据挖掘开发语言
基于Python的数据标准化方法1.z-score方法2.极差标准化方法3.最大绝对值标准化方法在数据分析之前，通常需要先将数据标准化（Standardization），利用标准化后的数据进行数据分析，以避免属性之间不同度量和取值范围差异造成数据对分析结果的影响。1.z-score方法Z-score方法是基于原始数据的均值和标准差来进行数据标准化的，处理后的数据均值为0，方差为1，符合标准正态分布
CSV指南：Python程序获取大型CSV文件行数孤独打铁匠Julian 笔记经验分享 python
本指南提供了几种使用Python来获取大型CSV文件行数的方法，并解释了每种方法的适用场景。方法1:使用csv.reader处理复杂CSV文件当你的CSV文件中包含多行字段（即某些字段的值中包含换行符）时，使用csv.reader是一个可靠的选择，因为它能够正确处理这些复杂情况。这个方法适用于大多数大小的CSV文件，但是对于非常大的文件，读取整个文件可能会占用较多的时间和内存。对于极大的文件，考虑
springboot集成logback-spring.xml文件 RT_0114 SpringBoot spring boot spring logback
彩色日志日志分debug和error文件输出，方便开发人员运维日志限制最大保管天数日志限制总量大小占用量GB日志限制单个文件大小MB日志显示最大保留天数屏蔽没用的日志${CONSOLE_LOG_PATTERN}${log.path}/debug.log${log.path}/%d{yyyy-MM-dd,aux}/debug.%d{yyyy-MM-dd}.%i.log.gz1024MB50GB365
用XMLHttpRequest发送和接收JSON数据潭池先生 json XMLHttpRequest 前端
百度的AI回答了一个案例：varxhr=newXMLHttpRequest();varurl="your_endpoint_url";//替换为你的API端点vardata=JSON.stringify({key1:"value1",key2:"value2"});xhr.open("POST",url,true);xhr.setRequestHeader("Content-Type","appl
C#中的PLINQ和LINQ的效率对比搬砖的诗人Z C#c#linq 开发语言
PLINQ（ParallelLINQ）和LINQ（LanguageIntegratedQuery）都是.NET框架中的功能，用于对集合进行查询和操作。它们之间的主要区别在于并行处理能力。LINQ:LINQ是一种用于在.NET应用程序中进行数据查询和操作的语言集成功能。它提供了一种统一的方式来查询各种数据源，如集合、数组、XML、数据库等。LINQ是在单线程环境中执行查询操作的，因此对于大型数据集或
谷歌浏览器驱动Chromedriver（114-120版本）文件以及驱动下载教程 pigerr杨 Python python chrome drivers
ChromeDriver官方网站GitHub||GoogleChromeLabs/chrome-for-testingChromeDriver113-125_JSONChromeforTestingavailability123-125zip白月黑羽Python基础|进阶|Qt图形界面|Django|自动化测试|性能测试|JS语言|JS前端|原理与安装
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
标定系列——基于OpenCV实现普通相机、鱼眼相机不同标定板下的标定（五） JANGHIGH 标定 opencv
标定系列——基于OpenCV实现相机标定（五）说明代码解析VID5.xmlin_VID5.xmlcamera_calibration.cpp说明该程序可以实现多种标定板的相机标定工作代码解析VID5.xmlimages/CameraCalibration/VID5/xx1.jpgimages/CameraCalibration/VID5/xx2.jpgimages/CameraCalibratio
3、JavaWeb-Ajax/Axios-前端工程化-Element 所谓远行Misnearch #JavaWeb 前端 ajax elementui java 前端框架
P34Ajax介绍Ajax:AsynchroousJavaScriptAndXML，异步的JS和XMLJS网页动作，XML一种标记语言，存储数据，作用：数据交换：通过Ajax给服务器发送请求，并获取服务器响应的数据异步交互：在不重新加载整个页面的情况下，与服务器交换数据并实现更新部分网页的技术，例如：搜索联想、用户名是否可用的校验等等。同步与异步：同步：服务器在处理中客户端要处于等待状态，输入域名
OpenCV 如何使用 XML 和 YAML 文件的文件输入和输出愚梦者深度学习人工智能计算机视觉 c++opencv
返回：OpenCV系列文章目录（持续更新中......）上一篇：如何利用OpenCV4.9离散傅里叶变换下一篇:目标本文内容主要介绍：如何使用YAML或XML文件打印和读取文件和OpenCV的文本条目？如何对OpenCV数据结构做同样的事情？如何为您的数据结构执行此操作？使用OpenCV数据结构，例如cv::FileStorage,cv::FileNodeorcv::FileNodeIterato
Golang标准库fmt深入解析与应用技巧 walkskyer golang标准库 golang java 数据库
Golang标准库fmt深入解析与应用技巧前言fmt包的基本使用打印与格式化输出函数Print系列函数格式化字符串格式化输入函数小结字符串格式化基本类型的格式化输出自定义类型的格式化输出控制格式化输出的宽度和精度小结错误处理与fmt使用fmt.Errorf生成错误信息fmt包与错误处理的最佳实践小结日志记录与fmtfmt包在日志记录中的应用结合log包使用fmt进行高级日志处理小结fmt与IOfm
flutter 修改app名字和图标肥肥呀呀呀 flutter
一、修改名字在Android中修改应用程序名称：在AndroidManifest.xml文件中修改应用程序名称：打开Flutter项目中的android/app/src/main/AndroidManifest.xml文件。找到标签，然后在android:label属性中修改应用程序的名称，例如：android:label="YourNewAppName"。在strings.xml文件中修改应用程
SQLite版本3中的文件锁定和并发(七）代码工匠云数据库 SQLite C与c++sqlite c++数据库
返回：SQLite—系列文章目录上一篇：自己编译SQLite或将SQLite移植到新的操作系统（六）下一篇：SQLite—系列文章目录正文：1.0SQLite版本3中的文件锁定和并发SQLite版本3.0.0引入了新的锁定和日志功能旨在提高SQLite版本2的并发性的机制并减少作家的饥饿问题。新机制还允许交易的原子提交涉及多个数据库文件。本文档介绍新的锁定机制。目标受众是想要理解和/或修改的程序员
python转码 Desamond python 开发语言
转码在许多场景中都有应用，以下是一些常见的场景：网页开发：当用户在网页上输入文本时，可能需要将特殊字符（如空格、引号、特殊符号等）进行转码，以防止这些字符对URL或HTML代码产生干扰。文件名处理：在处理文件名时，可能需要将特殊字符进行转码，以避免文件名被错误地解析或显示。数据传输：在数据传输过程中，为了确保数据的完整性和正确性，可能需要将数据中的特殊字符进行转码。数据存储：在数据库或数据存储中，
排序算法太多？常用排序都在这了，一篇文章总结和实现所有面试会考的排序算法（基于Python实现）宇宙之一粟不归路之Python #IT面试题收集与总结数据结构与算法算法数据结构排序算法 python java
文章目录排序算法1.常见的排序算法1.1选择排序1.1.1思想1.1.2实现**1.1.3选择排序分析**1.2冒泡排序**1.2.1思想****1.2.2实现****1.2.3冒泡排序分析**1.3插入排序**1.3.1思想****1.3.2实现****1.3.3插入排序分析**1.4归并排序☆☆★**1.4.1思想****1.4.2实现****1.4.3归并排序分析**1.5快速排序☆★★**
27.Python从入门到精通—Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为以山河作礼。 #Python基础入门—详解版 python java 服务器
27.从入门到精通：Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理在Python中，异常处理是一种处理程序在执行期间可能遇到的错误的方法。当Python解释器遇到错误时，它会引发异常。异常是一种Python对象，它包含有关错误的信息，例如错误类型和错误位置。为了处理异常，您可以使用try-except语句。在
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
Python | Redis工具类 -拟墨画扇- Python redis 数据库缓存 python
一、需求自动连接Redis数据库，通过连接池处理数据对输出结果进行Log打印并保存到文件二、代码Utils.redisUtils.py#!/usr/bin/envpython#-*-coding:utf-8-*-importredisfromUtils.loggerimportlog"""Redis数据格式(1)字符串|存储形式:key-value:str-存储二进制数据:可以存储任意类型的数据，
webpack.prod.js（webpack生产环境配置文件）门板_ webpack javascript 前端
生产环境：只打包不运行本地服务器对于在config目录下的webpack.prod.js1.在根目录下运行npxwebpack--config./config/webpack.prod.js2.在package.json文件中配置"build":"npxwebpack--config./config/webpack.prod.js"constpath=require('path')constESL
Python dict字符串转json对象，小数精度丢失问题朝如青丝暮成雪 json python
一前言JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式，dict是Python的一种数据格式。本篇介绍一个float数据转换时精度丢失的案例。二问题描述importjsontest_str1='{"π":3.1415926535897932384626433832795028841971}'test_str2='{"value":10.00000}'print
Numpy、Pandas库的使用貮叁量化投资分析 python python 数据分析
目录Numpy1、概述2、基础操作2.1生成一个numpy的array数组：2.2自定义一个新的数据类型：np.dtype()3、并行化思想4、量化分析应用4.1索引选取和切片选择4.2数据转换与规整4.3逻辑条件进行数据筛选4.4通用序列函数4.5文件保存与读取Pandas1、简介2、Series和DataFrame的使用2.1Series2.2DataFrame3、量化分析应用3.1形成一个p
java实体中返回前端的double类型四舍五入（格式化）婲落ヽ紅顏誶 java
根据业务，需要通过后端给前端返回部分double类型的数值，一般需要保留两位小数，使用jackson转换对象packagecom.ruoyi.common.core.config;importcom.fasterxml.jackson.core.JsonGenerator;importcom.fasterxml.jackson.databind.JsonSerializer;importcom.f
Linux学习系列之vim编辑器（一） llibertyll linux 学习
vi编辑器的操作模式输入模式—aio等—>命令模式<—：键—末行模式从输入/末行模式切换到命令模式都是需要按ESC键注:a光标后输入，i光标前输入，o直接向下加一行输入，O向上加一行输入在vi编辑器中光标的移动（命令行模式下）键组合（命令）光标的移动$光标移动到当前行的结尾0（零）光标移动到当前行的开始GG光标移动到最后一行gg光标移动到第一行在命令行模式下删除与复制的操作键组合（命令）含义dd删
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

Python 玩转数据 13 - 数据读写 Data I/O for XML File Format

引言

JSON vs. XML

Example

比较

Python 对 XML 数据读写模块

xml ElementTree API

设置获取 XML 属性 .set() and .get()

Pretty Printing of the XML Tree

lxml 版本的 ElementTree

Minidom API

xml ElementTree 解析 XML

XPath 遍历 XML 例子

处理 XML Exceptions

读取 XML 转换成 Pandas DataFrame

用 xmltodict 转换 XML 成 JSON

你可能感兴趣的:(#,Python,进阶系列,xml,python,json,lxml,pandas)