Gozen Sanji

Python CookBook —— Chapter 6 （个人笔记）

文章目录

Chap 6 数据编码和处理
- 6.1 读写 CSV 数据 --- csv.reader(), csv.writer(), csv.DictReader(), csv.DictWriter()
- 6.2 读写 JSON 数据 --- dumps(), loads(), dump(), load(), pprint() & indent 参数
- 6.3 解析简单的 XML 数据 --- xml.etree.ElementTree.parse(), find(), iterfind(), findtext(), .tag, .text, .get('xxx')
- 6.4 增量式解析大型 XML 文件 --- 使用迭代器&生成器进行增量式的数据处理
- 6.5 将字典转换为 XML --- 使用 Element 类, tostring(), set(), escape(), unescape()
- 6.6 解析和修改 XML --- doc.getroot(), root.remove(), list(root), root.insert(), doc.write()
- 6.7 利用命名空间解析 XML 文档 --- ???
- 6.8 与关系型数据库的交互 --- ⭐⭐⭐
- 6.9 编码&解码十六进制数 --- binascii.b2a_hex(), binascii.a2b_hex(), base64.b16encode(), base64.b16decode()
- 6.10 编码&解码 Base64 数据 --- base64.b64encode(), base64.b64decode()
- 6.11 读写二进制数组数据 --- Struct(fmt), struct.pack(), struct.unpack(), struct.unpack_from(), struct.size
- 6.12 读取嵌套和可变长二进制数据 --- ???
- 6.13 数据的累加与统计操作 --- Pandas 库的简介

Chap 6 数据编码和处理

6.1 读写 CSV 数据 — csv.reader(), csv.writer(), csv.DictReader(), csv.DictWriter()

下面介绍了在读写 csv 文件时遇到的各种问题与解决方案：

# 1. 对大多数的 CSV 格式的数据读写问题, 都可以使用 csv 库:
import csv

with open('stocks.csv') as f:
    f_csv = csv.reader(f)    # csv.reader() 通过文件对象 f 创建一个 csv.reader 对象
    headers = next(f_csv)    # 对 csv.reader 对象迭代一次获取首行
    print(headers)

    for row in f_csv:    # row 是列表, 通过下标访问字段值
        print(row)


# 2. 使用命名元组增强代码可读性:
from collections import namedtuple

with open('stocks.csv') as f:
    f_csv = csv.reader(f)
    headings = next(f_csv)

    Row = namedtuple('Row', headings)    # 命名元组(类型名, 字段列表)

    for r in f_csv:
        row = Row(*r)    # 传递字段值以实例化命名元组对象
        print(row.Symbol, row.Price, row.Date, sep='\t')    # 通过字段名访问字段值(但要求列名为合法的Python标识符)


# 3. 还可以将数据读取到一个字典序列中:

with open('stocks.csv') as f:
    f_csv = csv.DictReader(f)    # csv.DictReader() 创建一个 csv.DictReader 对象 (内部是 OrderedDict 的可迭代对象)

    for row in f_csv:
        print(row['Symbol'], row['Price'], row['Date'], sep='\t')    # “有序字典”也能通过字段名访问字段值


# 4. 为写入 CSV 数据, 仍可使用 csv 模块, 不过得先创建一个 writer 对象:
headers = ['Symbol', 'Price', 'Date', 'Time', 'Change', 'Volume']
rows = [
    ('AA', 39.48, '6/11/2007', '9:36am', -0.18, 181800),
    ('AIG', 71.38, '6/11/2007', '9:36am', -0.15, 195500),
    ('AXP', 62.58, '6/11/2007', '9:36am', -0.46, 935000),
        ]

with open('stocks_plus.csv', 'w', newline='') as f:    # newline='' 确保写入时没有多余的空行
    f_csv = csv.writer(f)       # 首先创建 writer 对象
    f_csv.writerow(headers)     # 写入一行
    f_csv.writerows(rows)       # 写入多行


# 5. 将“字典序列型”数据写入 CSV 的实现方式:
headers = ['Symbol', 'Price', 'Date', 'Time', 'Change', 'Volume']
rows = [
    {'Symbol': 'AA', 'Price': 39.48, 'Date': '6/11/2007', 'Time': '9:36am', 'Change': -0.18, 'Volume': 181800},
    {'Symbol': 'AIG', 'Price': 71.38, 'Date': '6/11/2007', 'Time': '9:36am', 'Change': -0.15, 'Volume': 195500},
    {'Symbol': 'AXP', 'Price': 62.58, 'Date': '6/11/2007', 'Time': '9:36am', 'Change': -0.46, 'Volume': 935000},
    ]

with open('stocks_plus.csv', 'a', newline='') as f:
    f_csv = csv.DictWriter(f, headers)    # 首先创建 DictWriter 对象 (headers 指定首行, 即字段名)
    f_csv.writeheader()         # 写入上面指定的“首行”
    f_csv.writerows(rows)       # 写入字典序列中的数据


# 6. 你应该总是优先选择 csv 模块来 “分割 or 解析” CSV 数据:
with open('stocks.csv') as f:
    f_csv = csv.reader(f, delimiter=',')    # 关键字参数 delimiter 用于指定分隔符
    for row in f_csv:
        print(row)

""" Remark: 不要自己写代码来分割 csv 的字段, 你有可能会遇到一些棘手的问题(See Page 177) """


# 7. 若你正在读取 CSV 数据并将它们转换为命名元组, 需注意对列名进行 “合法性认证” (See Page 177):
import re

with open('stocks.csv') as f:
    f_csv = csv.reader(f)
    # 使用 RegEx 替换原 CSV 首行(即字段名)中的非法标识符
    # 只允许 a-z & A-Z & (_) 这 3 类字符
    headers = [re.sub(r'[^a-zA-Z_]', '_', h) for h in next(f_csv)]
    Row = namedtuple('Row', headers)    # 使用替换完成后的 headers 创建命名元组类
    for r in f_csv:
        r = Row(*r)
        print(r.Symbol, r.Volume)


# 8. 在 CSV 数据上执行“类型转换”的例子:
""" Remark: 要强调的是, csv 产生的数据都是字符串类型的 """
col_types = [str, float, str, str, float, int]

with open('stocks.csv') as f:
    f_csv = csv.reader(f)
    headers = next(f_csv)

    for row in f_csv:
        # 将 row 中数据按照 col_types 中指定的类型进行转换（这是类型转换的一个重要例子！）
        typed_row = tuple(convert(value) for convert, value in zip(col_types, row))    # tuple 中是一个 genExpr
        print(typed_row)


# 9. 转换从 CSV 中读取的字典中特定字段的例子:
print(format(' Reading as dicts with type conversion ', '*^80'))

# 9.1 首先定义要做类型转换的字段的元组序列
field_types = [
    ('Price', float),
    ('Change', float),
    ('Volume', int)
]

# 9.2 以字典方式读取 CSV 数据的同时进行类型转换
with open('stocks.csv') as f:
    f_csv = csv.DictReader(f)
    for row in f_csv:
        row.update(    # 通过字典的 update 方法直接更新字典的值 (value 经过了类型转换)
            (key, conversion(row[key])) for key, conversion in field_types    # 这也是个 genExpr
        )
        print(row)

若你读取 CSV 数据的目的是做数据分析和统计的话，不妨试一试 Pandas 包。Pandas 包含了一个非常方便的函数 pandas.read_csv()，它可以加载 CSV 数据到一个 DataFrame 对象中去。然后利用该对象就可以生成各种形式的统计、过滤数据以及执行其他高级操作了。

6.2 读写 JSON 数据 — dumps(), loads(), dump(), load(), pprint() & indent 参数

读写 JSON (JavaScript Object Notation) 编码格式的数据，json 模块提供了一种很简单的方式来编码 & 解码 JSON 数据。

# 1. json.dumps() 将 Python Dict 转换为 JSON Str:
import json

data = {
    'name': 'ACME',
    'shares': 100,
    'price': 542.23,
}

json_str = json.dumps(data)
print(type(json_str), '---', json_str)


# 2. json.loads() 将 JSON Str 转换回 Python Dict:
data = json.loads(json_str)
print(type(data), '---', data)    # 注意 key 的引号变化


# 3. 处理 Json 文件时, 可使用 json.dump() & json.load() 来编码 & 解码 Json 数据:

# 3.1 Writing Json data
with open('data.json', 'w') as f:
    json.dump(data, f)    # 将 Python Dict 写入 Json 文件

# 3.2 Reading Json data
with open('data.json', 'r') as f:
    data = json.load(f)
    print(type(data), data)    # 将 Json 文件读取为 Python Dict


# 4. Json 编码前后 True, False, None 的变化:
before = {'a': True, 'b': False, 'c': 'Hello', 'd': None}
after = json.dumps(before)
print(before, after, sep='\n')


# 5. 使用 pprint 模块的 pprint() 函数以打印出 Json 数据的结构:
from pprint import pprint

weather = {
    "HeWeather6": [
        {
            "basic": {
                "cid": "CN101010100",
                "location": "北京",
                "parent_city": "北京",
                "admin_area": "北京",
                "cnty": "中国",
                "lat": "39.90498734",
                "lon": "116.40528870",
                "tz": "8.0"
            },
            "daily_forecast": [
                {
                    "cond_code_d": "103",
                    "cond_code_n": "101",
                    "cond_txt_d": "晴间多云",
                    "cond_txt_n": "多云",
                    "date": "2017-10-26",
                    "hum": "57",
                    "pcpn": "0.0",
                    "pop": "0",
                    "pres": "1020",
                    "tmp_max": "16",
                    "tmp_min": "8",
                    "uv_index": "3",
                    "vis": "16",
                    "wind_deg": "0",
                    "wind_dir": "无持续风向",
                    "wind_sc": "微风",
                    "wind_spd": "5"
                },
                {
                    "cond_code_d": "101",
                    "cond_code_n": "501",
                    "cond_txt_d": "多云",
                    "cond_txt_n": "雾",
                    "date": "2017-10-27",
                    "hum": "56",
                    "pcpn": "0.0",
                    "pop": "0",
                    "pres": "1018",
                    "tmp_max": "18",
                    "tmp_min": "9",
                    "uv_index": "3",
                    "vis": "20",
                    "wind_deg": "187",
                    "wind_dir": "南风",
                    "wind_sc": "微风",
                    "wind_spd": "6"
                },
                {
                    "cond_code_d": "101",
                    "cond_code_n": "101",
                    "cond_txt_d": "多云",
                    "cond_txt_n": "多云",
                    "date": "2017-10-28",
                    "hum": "26",
                    "pcpn": "0.0",
                    "pop": "0",
                    "pres": "1029",
                    "tmp_max": "17",
                    "tmp_min": "5",
                    "uv_index": "2",
                    "vis": "20",
                    "wind_deg": "2",
                    "wind_dir": "北风",
                    "wind_sc": "3-4",
                    "wind_spd": "19"
                }
            ],
            "status": "ok",
            "update": {
                "loc": "2017-10-26 23:09",
                "utc": "2017-10-26 15:09"
            }
        }
    ]
}
pprint(weather)    # pprint() 会按照 key 的“字母顺序”以一种更加美观的方式输出 Json


# 6. 若想获得漂亮の格式化字符串后输出, 可使用 json.dumps() 的 indent 参数, 它会使输出和 pprint() 效果类似:
data = {
    'name': 'ACME',
    'shares': 100,
    'price': 542.23,
}
# 对比下面两种输出效果
print(json.dumps(data))
print(json.dumps(data, indent=4))    # indent 使 json 得以结构化地输出

一般来讲，JSON 解码会根据提供的数据创建 dicts or lists，若想要创建其他类型的对象，可以给 json.loads() 传递 object_pairs_hook or object_hook 参数。

# 7. 下面演示如何解码 JSON 数据并在一个 OrderedDict 中保留其顺序:
from collections import OrderedDict

# 7.1 这是一个 Json Str, 注意这里的 key 必须使用双引号(")
s = '{"name": "ACME", "shares": 50, "price": 490.1}'

# 7.2 关键字参数 object_pairs_hook 指定将 Json Str 输出为 OrderedDict
data = json.loads(s, object_pairs_hook=OrderedDict)
print(type(data), data)

最后两个例子暂时看不懂

6.3 解析简单的 XML 数据 — xml.etree.ElementTree.parse(), find(), iterfind(), findtext(), .tag, .text, .get(‘xxx’)

从简单的 XML 文档中提取数据。

from urllib.request import urlopen
import xml.etree.ElementTree as ET

# 1. Download the RSS feed and parse it
u = urlopen('http://planet.python.org/rss20.xml')
# print(u.read().decode('utf-8'))    # 查看原始 XML 文档 (与下一行代码冲突？)
doc = ET.parse(u)    # parse() 函数解析整个 XML 文档并返回一个文档对象


# 2. Extract and output tags of interest
for item in doc.iterfind('channel/item'):    # iterfind() 搜索所有在 channel 元素下的 item 元素
    title = item.findtext('title')    # item.findtext() 从已找到的 item 元素位置开始搜索 title 元素
    date = item.findtext('pubDate')
    link = item.findtext('link')
    print(title, date, link, sep='\n')


# 3. ElementTree 中每个元素有一些重要の属性 & 方法, 在解析时非常有用:
print(''*26)
print(doc)
e = doc.find('channel/title')
print(e)
print('tag & text: ', e.tag, ' & ', e.text)
print(e.get('some_attribute'))

有一点要强调的是 xml.etree.ElementTree 并不是 XML 解析的唯一方法。对于更高级的应用程序，可考虑使用 lxml。

6.4 增量式解析大型 XML 文件 — 使用迭代器&生成器进行增量式的数据处理

使用尽可能少的内存从一个超大的 XML 文档中提取数据。

# 1. 任何时候只要遇到 <增量式的数据处理>, 第一时间就应该想到迭代器 & 生成器:
from collections import Counter
from xml.etree.ElementTree import iterparse, parse


def parse_and_remove(filename, path):
    path_parts = path.split('/')    # 拆分 xml 文档的 path 为不同元素节点
    doc = iterparse(filename, ('start', 'end'))
    """ 
    iterparse(source, events=None, parser=None):
        Parses an XML section into an element tree incrementally, and reports what's going on to the user. 
            source is a filename or file object containing XML data. 
            events is a sequence of events to report back. 
                The supported events are the strings "start", "end", "comment", "pi", "start-ns" and "end-ns".
                     ~ 'start'  &   ~ 'end' 
        Returns an iterator providing (event, elem) pairs.
    """
    # Skip the root element
    next(doc)

    tag_stack, elem_stack = [], []
    for event, elem in doc:
        if event == 'start':    # 节点开始
            tag_stack.append(elem.tag)    # 存放节点标签
            elem_stack.append(elem)    # 存放节点元素
        elif event == 'end':    # 节点闭合
            if tag_stack == path_parts:    # 判断解析是否匹配指定路径
                yield elem
                # 从 elem 的父节点中删除 elem (注意此时 elem 已经被 yield)
                elem_stack[-2].remove(elem)    
            try:
                tag_stack.pop()    # 弹出(已闭合的)节点标签
                elem_stack.pop()    # 弹出(已闭合的)节点元素
            except IndexError:
                pass


# Method 1: 读取整个文档到内存中 (速度快, 吃内存)
potholes_by_zip = Counter()    # 创建 Counter 实例
doc = parse('potholes.xml')

for pothole in doc.iterfind('row/row'):
    # pothole 元素中找到 zip 元素的内容, 对其增加 Counter 计数
    potholes_by_zip[pothole.findtext('zip')] += 1    

for zipcode, num in potholes_by_zip.most_common():
    print(zipcode, num)
# Remark: 该脚本唯一的问题是它会先将整个 XML 文件加载到内存中然后解析, 当 XML 庞大时会耗费大量内存。


# Method 2: 迭代式解析 & 删除 (文档树结构从始至终没被完整的创建过, 速度稍慢, 占用少量内存)
potholes_by_zip2 = Counter()
data = parse_and_remove('potholes.xml', 'row/row')

for pothole in data:
    potholes_by_zip2[pothole.findtext('zip')] += 1

for zipcode, num in potholes_by_zip2.most_common():
    print(zipcode, num)
# Remark: 该版本的代码运行时可显著节约内存资源, 但缺点是其运行性能较前一种方法差一些。

potholes.xml 的内容参考下面：

<response>
    <row>
        <row>
            <creation_date>2012-11-18T00:00:00creation_date>
            <status>Completedstatus>
            <completion_date>2012-11-18T00:00:00completion_date>
            <service_request_number>12-01906549service_request_number>
            <type_of_service_request>Pot Hole in Streettype_of_service_request>
            <current_activity>Final Outcomecurrent_activity>
            <most_recent_action>CDOT Street Cut ... Outcomemost_recent_action>
            <street_address>4714 S TALMAN AVEstreet_address>
            <zip>60632zip>
            <x_coordinate>1159494.68618856x_coordinate>
            <y_coordinate>1873313.83503384y_coordinate>
            <ward>14ward>
            <police_district>9police_district>
            <community_area>58community_area>
            <latitude>41.808090232127896latitude>
            <longitude>-87.69053684711305longitude>
            <location latitude="41.808090232127896"
            longitude="-87.69053684711305" />
        row>
        <row>
            <creation_date>2012-11-18T00:00:00creation_date>
            <status>Completedstatus>
            <completion_date>2012-11-18T00:00:00completion_date>
            <service_request_number>12-01906695service_request_number>
            <type_of_service_request>Pot Hole in Streettype_of_service_request>
            <current_activity>Final Outcomecurrent_activity>
            <most_recent_action>CDOT Street Cut ... Outcomemost_recent_action>
            <street_address>3510 W NORTH AVEstreet_address>
            <zip>60647zip>
            <x_coordinate>1152732.14127696x_coordinate>
            <y_coordinate>1910409.38979075y_coordinate>
            <ward>26ward>
            <police_district>14police_district>
            <community_area>23community_area>
            <latitude>41.91002084292946latitude>
            <longitude>-87.71435952353961longitude>
            <location latitude="41.91002084292946"
            longitude="-87.71435952353961" />
        row>
    row>
response>

xml.etree.elementtree 相关内容参考链接：https://docs.python.org/zh-cn/3/library/xml.etree.elementtree.html

6.5 将字典转换为 XML — 使用 Element 类, tostring(), set(), escape(), unescape()

使用 Python 字典存储数据，并将它转换成 XML 格式。

# 1. xml.etree.ElementTree 库通常用来做解析工作, 但它也可以创建 XML 文档:
from xml.etree.ElementTree import Element
from xml.etree.ElementTree import tostring


def dict_2_xml(tag, d):
    """ Turn a simple dict of key/value pairs into XML """
    # 1. 创建 Element 实例
    elem = Element(tag)
    for key, val in d.items():
        # 2. 以 key 为节点名创建 Element 实例
        child = Element(key)
        # 3. 指定该实例的内容为 str(val)
        child.text = str(val)
        # 4. 将 child 添加至 elem 元素的 (子元素的) 内部列表末尾
        elem.append(child)
    return elem


s = {'name': 'GOOG', 'shares': 100, 'price': 490.1}    # Python dict
e = dict_2_xml('stock', s)
print(type(e), e, sep='\t')    # 转换结果为 Element 实例


# 2. 使用 xml.etree.ElementTree.tostring() 函数可将 Element 实例转换为 <字节字符串>:
print(tostring(e))


# 3. 若想给某个元素添加属性值, 可使用 set() 方法:
e.set('_id', '2333')
print(tostring(e))    # 
""" 若想保持元素顺序, 可考虑构造一个 OrderedDict 来代替一个普通字典 """


# 4. 下面是手动构造的做法, 不推荐(why?)!
def dict_2_xml_str(tag, d):
    # 1. 开始节点标签
    parts = ['<{}>'.format(tag)]

    for key, val in d.items():
        # 2. 根据字典构建节点元素
        parts.append('<{0}>{1}'.format(key, val))

    # 3. 闭合节点标签
    parts.append(''.format(tag))
    return ''.join(parts)


# 5. 下面对这个 Python Dict 测试上面两个版本的函数
d = {'name': ''}

# 5.1 String creation
xml = dict_2_xml_str('item', d)
print(xml)    # 

# 5.2 Proper XML creation
xml2 = dict_2_xml('item', d)
print(tostring(xml2))    # <spam>

# 5.3 若需手动转换这些字符, 可使用 xml.sax.saxutils 中的 escape() & unescape() 函数:
from xml.sax.saxutils import escape, unescape

print(escape(''))    # <spam>
print(unescape(escape('')))    #

6.6 解析和修改 XML — doc.getroot(), root.remove(), list(root), root.insert(), doc.write()

如何读取一个 XML 文档，对它做一些修改后再将结果写回 XML 文档？使用 xml.etree.ElementTree 模块可以很容易地处理这些任务，第一步是以通常的方式来解析该文档。

# 下面利用 ElementTree 来读取这个文档并对它做一些修改:
from xml.etree.ElementTree import parse, Element

doc = parse('pred.xml')
root = doc.getroot()    # Returns the root element for this tree.
print(root)


# 1. Remove a few elements
root.remove(root.find('sri'))    # 从 root 中通过 find() 找到 sri 子节点, 然后从“父节点”中删除该元素
root.remove(root.find('cr'))


# 2. Insert a new element after ...
# 2.1 Locate Element 'nm' first
# idx_nm = root.getchildren().index(root.find('nm'))
""" getchildren() is Deprecated, use list(root) instead. """
idx_nm = list(root).index(root.find('nm'))    # index() 返回列表中首个匹配元素的索引位置
print(idx_nm)

# 2.2 Define new Element 'spam' & its content
e = Element('spam')
e.text = 'This is a test.'

# 2.3 Insert Element 'spam' at idx = idx_nm + 1
root.insert(idx_nm + 1, e)    # Inserts subelement at the given position in this element.


# 3. Write back to a file
doc.write('newpred.xml', xml_declaration=True)    # Writes the element tree to a file, as XML.
"""   xml_declaration controls if an XML declaration (即这样的内容 “” ) should be added to the file.   """

Remark：修改一个 XML 文档结构时必须牢记：所有修改都是针对父节点元素，将它 作为一个列表 来处理。例如，若要删除某个元素，通过调用父节点的 remove() 方法从该元素的直接父节点中删除；若要插入 or 增加新元素，同样使用父节点元素的 insert() & append() 方法。另外，还能对元素使用索引 & 切片操作，比如 element[i] or element[i:j]。

6.7 利用命名空间解析 XML 文档 — ???

对这节内容不太理解…

uvw

abc

6.8 与关系型数据库的交互 — ⭐⭐⭐

比较简单的数据库操作，稍后环境弄好了再补上

uvw

abc

6.9 编码&解码十六进制数 — binascii.b2a_hex(), binascii.a2b_hex(), base64.b16encode(), base64.b16decode()

将一个十六进制字符串解码成一个字节字符串 or 将一个字节字符串编码成一个十六进制字符串。

# 1. 简单的解码 or 编码一个十六进制的原始字符串, 可使用 binascii or base64 模块
from binascii import b2a_hex, a2b_hex
from base64 import b16encode, b16decode

s = b'Hello'    # 原始的 byte string

# byte string to hex string (Encode)
h = b2a_hex(s)
hh = b16encode(s)
print(h, hh)

# hex string to byte string (Decode)
b = a2b_hex(h)
bb = b16decode(hh)
print(b, bb)

"""
    上面两种技术的主要区别在于大小写的处理:
        函数 base64.b16decode() & base64.b16encode() 只能操作大写形式的十六进制字母;
        而 binascii 模块中的函数大小写都能处理.
"""

# 另外, 编码函数的输出总是一个“字节字符串”, 若想强制以 Unicode 形式输出, 可采用下述解码步骤:
print(b, '>>>以 Unicode 形式输出>>>', b.decode('ascii'))
print(hh, '>>>以 Unicode 形式输出>>>', hh.decode('ascii'))
print(hh, '>>>以 utf-8 形式输出>>>', hh.decode('utf-8'))

Remark：在解码十六进制数时，函数 b16decode() & a2b_hex() 可接受字节 or unicode 字符串，但 unicode 字符串只允许包含 ASCII 编码的十六进制数。

6.10 编码&解码 Base64 数据 — base64.b64encode(), base64.b64decode()

要使用 Base64 格式解码 or 编码二进制数据，可使用 base64 模块中の函数 b64encode() & b64decode()

from base64 import b64encode, b64decode    # 注意上一节用是 ‘16’

# 0. initial byte data
s = b'hello python world'

# 1. Encode as Base64
a = b64encode(s)
print(a)

# 2. Decode from Base64
b = b64decode(a)
print(b)

Remark：Base64 编码仅用于面向字节的数据，如字节字符串 & 字节数组。此外，编码处理的输出总是一个字节字符串。

# 3. 若想混合使用 Base64 编码的数据 & Unicode 文本, 可使用下述解码步骤:
print(b64encode(b'Aimer'), ' >>> ', b64encode(b'Aimer').decode('ascii'))
print(b64encode(b'Aimer'), ' >>> ', b64encode(b'Aimer').decode('utf-8'))

Page 198 最后的 Remark 不明白。。。

6.11 读写二进制数组数据 — Struct(fmt), struct.pack(), struct.unpack(), struct.unpack_from(), struct.size

可以使用 struct 模块处理二进制数据。下面将一个 Python 元组列表写入一个二进制文件，并使用 struct 将每个元组编码为一个结构体。

from struct import Struct
from collections import namedtuple
import numpy as np

def write_records(records, format, f):
    """ Write a sequence of tuples to a binary file of structures. """
    record_struct = Struct(format)    # 创建 Struct 实例(以声明一个结构体)
    for r in records:
        f.write(record_struct.pack(*r))    # 通过 struct 实例的 pack() 方法将元组数据打包


def read_records(format, f):
    """ 以块的形式增量读取文件 """
    record_struct = Struct(format)
    # iter() 创建一个迭代器, 返回固定大小的数据块, 且该迭代器会不断调用参数中的匿名函数, 直到它返回特殊值 b'' 时, 迭代停止
    chunks = iter(lambda: f.read(record_struct.size), b'')    # read 中的可选参数指定读取的字节数
    return (record_struct.unpack(chunk) for chunk in chunks)    # genExpr


def unpack_records(format, data):
    record_struct = Struct(format)
    """
        下面的 unpack_from() 对于从一个大型二进制数组中提取二进制数据非常有用, 
            因为它不会产生任何临时对象 or 进行内存复制操作。
            你只需要给它一个字节字符串 (或数组) & 一个字节偏移量, 它会从那个位置开始直接解包数据。 
    """
    return (record_struct.unpack_from(data, offset)
            for offset in range(0, len(data), record_struct.size))    # genExpr


if __name__ == '__main__':
    pass
    # 1. 将元组列表写入二进制文件:
    records = [
        (1, 2.3, 4.5),
        (6, 7.8, 9.0),
        (12, 13.4, 56.7)
    ]

    with open('data.b', 'wb') as f:
        write_records(records, ', f)

    print('' * 47)
    # 2. 以块的形式增量读取上述二进制文件:
    with open('data.b', 'rb') as f:
        for rec in read_records(', f):
            print(rec)

    print('' * 47)
    # 3. 将整个二进制文件一次性读取到一个字节字符串中, 然后再分片解析:
    with open('data.b', 'rb') as f:
        data = f.read()
    for rec in unpack_records(', data):
        print(rec)

    print('' * 47)
    """
        Struct 实例有很多属性 & 方法用来操作相应类型的结构.
            size 属性包含了结构的字节数;
            pack() & unpack() 方法被用来打包和解包数据.
    """
    record_struct = Struct(')
    print(record_struct.size)
    print(record_struct.pack(1, 2.0, 3.0))
    print(record_struct.unpack(
        b'\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00@\x00\x00\x00\x00\x00\x00\x08@'
    ))

    print('' * 47)
    # 4. 上面的 read_records() 函数中, iter() 创建一个迭代器, 返回固定大小的数据块;
    # 且该迭代器会不断调用参数中的匿名函数, 直到它返回特殊值 b'' 时, 迭代停止
    f = open('data.b', 'rb')
    chunks = iter(lambda: f.read(20), b'')
    print(chunks)    # 

    for chk in chunks:
        print(chk)

    print('' * 47)
    # 5. 在解包时, 使用 namedtuple 设置属性名:
    Record = namedtuple('Record', ['kind', 'x', 'y'])
    with open('data.b', 'rb') as f:
        records = (Record(*r) for r in read_records(', f))    # genExpr
        for r in records:
            print(r.kind, r.x, r.y)

    print('' * 47)
    # 6. 若程序需处理大量二进制数据, 最好使用 numpy 模块。
    # 你可以将一个二进制数据读取到一个结构化数组中而不是一个元组列表中:
    f = open('data.b', 'rb')
    # np.fromfile() 函数根据文本 or 二进制文件中的数据构造一个数组
    records = np.fromfile(f, dtype=')    
    print(type(records), records, sep='\n')
    print(records[0], records[1], sep='\n')

    # Remark: 不到万不得已没有必要重复造轮子.

6.12 读取嵌套和可变长二进制数据 — ???

太复杂了看不懂0.0

uvw

abc

6.13 数据的累加与统计操作 — Pandas 库的简介

对任何涉及到统计、时间序列及其他相关技术的数据分析问题，都可考虑使用 Pandas 库

没有书中提到的 csv 文件，就不做代码部分笔记了。

Pandas 中文文档：https://www.pypandas.cn/docs/

你可能感兴趣的:(Python,进阶,个人笔记)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地