宅男很神经

【Python】dateutil库

第一章：dateutil

时间，在计算机系统中扮演着核心角色。从日志记录、事件调度到金融交易、科学模拟，无处不在。Python的标准库 datetime 模块提供了处理日期和时间的基本能力。然而，在面对真实世界的复杂性和多样性时，datetime 的功能常常显得捉襟见肘。例如，它难以直接解析各种非标准格式的日期字符串，无法进行灵活的相对时间计算（如“下个月的第三个星期二”），也缺乏对循环事件的强大支持。

正是在这样的背景下，dateutil 库应运而生。dateutil 并非要取代 datetime，而是作为其强大的补充和增强。它构建在 datetime 的基础之上，提供了更强大、更灵活、更智能的日期时间处理能力。它的设计哲学是：将日期时间操作从繁琐的细节中解放出来，让开发者能够更专注于业务逻辑本身。

1.1 `datetime` 模块的局限性回顾

在深入 dateutil 之前，我们有必要简要回顾一下 datetime 模块在某些场景下的不足，这正是 dateutil 存在的价值所在。

日期字符串解析的刚性： datetime.strptime() 函数依赖于精确的格式字符串。这意味着，如果输入的日期字符串格式稍有偏差，或者有多种可能的格式，就需要编写大量的 try-except 块或复杂的正则表达式来匹配，这既笨拙又容易出错。例如，"2023-10-26" 和 "Oct 26, 2023" 需要不同的格式字符串来解析。
相对时间计算的限制： datetime.timedelta 只能处理固定时间间隔的增减，如天、秒、微秒。它无法理解“下个月”、“去年同期”、“下个星期二”这类基于日历逻辑的相对时间。比如，datetime.date(2023, 1, 31) + datetime.timedelta(days=1) 会得到 2023-02-01，但 datetime.date(2023, 1, 31) + timedelta(months=1) 是不存在的，因为 timedelta 不支持月份的概念，而月份的长度是不固定的。
时区处理的复杂性： datetime 模块提供了 tzinfo 抽象基类来处理时区，但实现起来相对复杂，且不内置全球时区数据库（如IANA时区数据库）。手动处理夏令时（DST）的转换尤其困难，容易出错。
循环事件（Recurring Events）支持的缺失： 对于日历应用、任务调度等场景，经常需要生成一系列重复的事件，如“每周一上午9点”、“每月第一个周五”、“每年元旦”。datetime 并没有直接支持这种复杂的循环规则。

1.2 `dateutil` 的诞生与核心价值

dateutil 库正是为了弥补 datetime 模块的这些不足而设计的。它的核心价值在于：

智能的日期字符串解析： dateutil.parser 模块能够自动识别和解析各种常见甚至不常见的日期时间字符串格式，极大地简化了日期解析的复杂度。它甚至可以处理一些模糊的输入，并尝试推断出用户的意图。
强大的相对时间计算： dateutil.relativedelta 类提供了对相对时间的直观表示和计算。它能够处理“年”、“月”这样的不固定长度单位，以及“指定星期几”等更复杂的相对位置，使得日期时间的增减操作变得前所未有的灵活。
全面的时区解决方案： dateutil.tz 模块提供了对IANA时区数据库的良好支持，使得时区对象的创建、时区转换、夏令时处理等变得简单可靠。它能够正确处理跨时区的日期时间操作，避免因时区问题导致的各种错误。
灵活的循环规则生成： dateutil.rrule 模块实现了对 RFC 5545 (iCalendar) 中定义的循环规则（RRULE）的支持。这使得生成复杂的重复事件序列变得轻而易举，是构建日历和调度系统的利器。

dateutil 的目标是成为 Python 中处理日期时间的“瑞士军刀”，让开发者能够以更自然、更高效的方式处理各种日期时间相关的挑战。

1.3 `dateutil` 的安装与基础使用

在开始深入学习 dateutil 各个模块之前，我们首先需要将其安装到我们的Python环境中。

1.3.1 安装 `dateutil`

dateutil 是一个第三方库，可以通过 Python 的包管理工具 pip 进行安装。

# 这是一个在命令行中执行的命令，用于安装python-dateutil库
# pip是Python的包管理工具
# install命令用于安装指定的Python包
# python-dateutil是dateutil库在PyPI上的注册名称
pip install python-dateutil

安装成功后，你就可以在Python代码中导入并使用它了。

1.3.2 快速入门示例

让我们通过几个简单的例子，初步感受一下 dateutil 的强大之处。

示例 1：智能解析日期字符串

from dateutil import parser # 从dateutil库中导入parser模块，用于日期字符串解析

date_str1 = "2023-10-26 14:30:00" # 定义一个常见的日期时间字符串
dt_obj1 = parser.parse(date_str1) # 使用parser.parse()函数解析字符串，它能自动识别格式
print(f"解析字符串 '{
     
     date_str1}': {
     
     dt_obj1}") # 打印解析结果，它是一个datetime对象

date_str2 = "Oct 26, 2023 2:30 PM" # 定义另一个不同格式的日期时间字符串
dt_obj2 = parser.parse(date_str2) # 再次使用parser.parse()进行解析，同样能自动识别
print(f"解析字符串 '{
     
     date_str2}': {
     
     dt_obj2}") # 打印解析结果

date_str3 = "昨天" # 定义一个相对时间描述的字符串（中文）
# 默认情况下，parser.parse()对中文支持有限，或者需要结合特定parserinfo
# 这里仅作概念性演示，实际使用时需要注意语言环境设置
# 对于"昨天"这种自然语言解析，dateutil有其局限性，更偏向于标准或半标准格式
# 如果parser无法识别，会抛出ValueError
# 为了演示parser的灵活性，我们使用一个更通用的英文相对日期
date_str4 = "tomorrow" # 定义一个英文的相对时间描述字符串
from datetime import datetime # 导入datetime模块中的datetime类，用于获取当前时间
now = datetime.now() # 获取当前的日期和时间，作为解析相对时间的基础
# dateutil.parser可以解析一些英文的相对描述，并基于给定的now参数计算
dt_obj4 = parser.parse(date_str4, default=now) # 解析"tomorrow"，并以当前时间作为基准
print(f"解析字符串 '{
     
     date_str4}' (基于当前时间 {
     
     now}): {
     
     dt_obj4}") # 打印解析结果

示例 2：灵活的相对时间计算

from datetime import date # 导入datetime模块中的date类，用于表示日期
from dateutil.relativedelta import relativedelta # 导入dateutil.relativedelta模块中的relativedelta类

today = date.today() # 获取今天的日期
print(f"今天是: {
     
     today}") # 打印今天的日期

# 计算一个月后的日期
next_month = today + relativedelta(months=1) # 使用relativedelta计算一个月后的日期
print(f"一个月后是: {
     
     next_month}") # 打印一个月后的日期，relativedelta会智能处理月份长度

# 计算下个星期五的日期
# relativedelta(weekday=FR(+1)) 表示找到下一个星期五
# FR 是 dateutil.relativedelta 中定义的常量，代表星期五
# (+1) 表示是当前的下一个星期五，而不是本周的星期五（如果今天是星期五，则指下周的星期五）
from dateutil.relativedelta import FR # 从dateutil.relativedelta中导入FR常量，代表星期五

next_friday = today + relativedelta(weekday=FR(+1)) # 计算下个星期五的日期
print(f"下个星期五是: {
     
     next_friday}") # 打印下个星期五的日期

# 计算去年同期（精确到月日）的日期
last_year_same_month_day = today + relativedelta(years=-1) # 计算一年前的日期
print(f"去年同期是: {
     
     last_year_same_month_day}") # 打印去年同期的日期

示例 3：时区转换

from datetime import datetime # 导入datetime模块中的datetime类
from dateutil import tz # 导入dateutil中的tz模块，用于时区处理

# 创建一个不带时区信息的datetime对象（默认是naive datetime）
naive_dt = datetime(2023, 10, 26, 14, 30, 0) # 创建一个没有时区信息的datetime对象
print(f"原始不带时区信息的时间: {
     
     naive_dt}") # 打印原始的datetime对象

# 获取本地时区
local_tz = tz.gettz() # 获取当前系统的本地时区对象
# 将不带时区信息的时间视为本地时间，并赋予时区信息
local_dt = naive_dt.replace(tzinfo=local_tz) # 将本地时区信息附加到datetime对象上
print(f"带本地时区信息的时间: {
     
     local_dt}") # 打印带本地时区信息的datetime对象

# 获取UTC时区
utc_tz = tz.tzutc() # 获取UTC时区对象
# 将本地时间转换为UTC时间
utc_dt = local_dt.astimezone(utc_tz) # 使用astimezone()方法将本地时间转换为UTC时间
print(f"转换为UTC时间: {
     
     utc_dt}") # 打印转换后的UTC时间

# 获取纽约时区 (America/New_York)
ny_tz = tz.gettz("America/New_York") # 获取指定时区（纽约）的对象
# 将UTC时间转换为纽约时间
ny_dt = utc_dt.astimezone(ny_tz) # 将UTC时间转换为纽约时间
print(f"转换为纽约时间: {
     
     ny_dt}") # 打印转换后的纽约时间

通过这几个简单的例子，我们已经能感受到 dateutil 在处理日期时间方面的巨大便利性。接下来，我们将逐一深入探索 dateutil 的各个核心模块，剖析其内部机制，并提供大量详尽的代码示例和真实场景应用。

第二章：核心模块深入解析：`dateutil.parser` - 日期字符串解析的艺术

在数据处理、日志分析、用户输入等场景中，我们经常会遇到需要将各种格式的日期时间字符串转换为可操作的 datetime 对象的需求。datetime 模块的 strptime() 函数虽然可以完成这项任务，但它要求用户提供精确的格式字符串，这在格式不确定或多变时会成为一个巨大的负担。dateutil.parser 模块正是为了解决这一痛点而设计的。它是一个智能的、强大的、容错的日期字符串解析器。

2.1 `parse()` 函数的强大能力

dateutil.parser 模块的核心是 parse() 函数。这个函数能够自动识别并解析大量的日期时间字符串格式，无需我们手动指定格式。

2.1.1 基本用法与自动识别能力

parse() 函数的最基本用法是传入一个日期时间字符串，它会尝试将其解析为一个 datetime.datetime 对象。

from dateutil.parser import parse # 导入parser模块中的parse函数
from datetime import datetime # 导入datetime模块中的datetime类，用于验证解析结果的类型

# 示例1：标准ISO格式
date_str_iso = "2023-10-26T15:00:00" # 定义一个ISO 8601格式的日期时间字符串
dt_iso = parse(date_str_iso) # 使用parse函数解析这个字符串
print(f"'{
     
     date_str_iso}' 解析结果: {
     
     dt_iso}, 类型: {
     
     type(dt_iso)}") # 打印解析结果和其类型

# 示例2：常见的美国格式
date_str_us = "October 26, 2023 3:00 PM" # 定义一个常见的美国日期时间格式字符串
dt_us = parse(date_str_us) # 使用parse函数解析这个字符串
print(f"'{
     
     date_str_us}' 解析结果: {
     
     dt_us}, 类型: {
     
     type(dt_us)}") # 打印解析结果和其类型

# 示例3：欧洲格式（日/月/年）
date_str_eu = "26/10/2023 15:00" # 定义一个常见的欧洲日期时间格式字符串
dt_eu = parse(date_str_eu) # 使用parse函数解析这个字符串
print(f"'{
     
     date_str_eu}' 解析结果: {
     
     dt_eu}, 类型: {
     
     type(dt_eu)}") # 打印解析结果和其类型

# 示例4：只有日期
date_str_date_only = "2023-10-26" # 定义一个只有日期的字符串
dt_date_only = parse(date_str_date_only) # parse函数会为缺失的时间部分填充为00:00:00
print(f"'{
     
     date_str_date_only}' 解析结果: {
     
     dt_date_only}, 类型: {
     
     type(dt_date_only)}") # 打印解析结果和其类型

# 示例5：只有时间
date_str_time_only = "15:30:45" # 定义一个只有时间的字符串
# 当只有时间部分时，parse函数会使用当前日期作为默认日期
dt_time_only = parse(date_str_time_only) # parse函数会使用当前日期作为缺失的日期部分
print(f"'{
     
     date_str_time_only}' 解析结果: {
     
     dt_time_only}, 类型: {
     
     type(dt_time_only)}") # 打印解析结果和其类型
# 验证：dt_time_only的日期部分是否是今天
from datetime import date # 导入datetime模块中的date类
print(f"日期部分是否为今天: {
     
     dt_time_only.date() == date.today()}") # 验证解析结果的日期部分是否等于今天的日期

# 示例6：带有时区缩写（例如EST）
date_str_tz_abbr = "2023-10-26 10:00 AM EST" # 定义一个带有时区缩写（EST）的字符串
dt_tz_abbr = parse(date_str_tz_abbr) # parse函数会尝试解析时区缩写
print(f"'{
     
     date_str_tz_abbr}' 解析结果: {
     
     dt_tz_abbr}, 类型: {
     
     type(dt_tz_abbr)}") # 打印解析结果和其类型
print(f"时区信息: {
     
     dt_tz_abbr.tzinfo}") # 打印解析结果中的时区信息，这里会是UTC-05:00或None，取决于内部映射

# 示例7：带有时区偏移量
date_str_tz_offset = "2023-10-26 15:00:00+08:00" # 定义一个带有时区偏移量（+08:00）的字符串
dt_tz_offset = parse(date_str_tz_offset) # parse函数可以正确解析时区偏移量
print(f"'{
     
     date_str_tz_offset}' 解析结果: {
     
     dt_tz_offset}, 类型: {
     
     type(dt_tz_offset)}") # 打印解析结果和其类型
print(f"时区信息: {
     
     dt_tz_offset.tzinfo}") # 打印解析结果中的时区信息，这里会是一个tzoffset对象

# 示例8：不同分隔符
date_str_slash = "2023/10/26 15-00-00" # 定义一个使用斜杠和短横线作为分隔符的字符串
dt_slash = parse(date_str_slash) # parse函数能够识别多种分隔符
print(f"'{
     
     date_str_slash}' 解析结果: {
     
     dt_slash}, 类型: {
     
     type(dt_slash)}") # 打印解析结果和其类型

从上面的例子可以看出，parse() 函数在大多数情况下都能智能地识别日期时间字符串的格式并正确解析。这大大减少了我们在处理异构日期时间数据时的编程工作量。

2.1.2 `default` 参数：填充缺失信息

当输入的日期字符串不包含完整的日期时间信息时（例如，只提供了时间，或者只提供了月份和日期），parse() 函数会使用一个默认的 datetime 对象来填充缺失的部分。这个默认对象可以通过 default 参数来指定。

如果 default 参数未指定，parse() 会使用 datetime.datetime.now() 的结果作为基准，但其日期部分通常是 datetime.datetime(1990, 1, 1, 0, 0, 0)，并根据解析结果进行调整。更准确地说，如果没有提供 default 参数，parse() 会使用 datetime.datetime(1990, 1, 1) 作为其内部的“基准日期”，然后用解析出的日期/时间成分覆盖或补充这个基准日期。

让我们通过实验来验证 default 参数的行为。

from dateutil.parser import parse # 导入parser模块中的parse函数
from datetime import datetime # 导入datetime模块中的datetime类

# 示例1：只提供时间，不指定default
time_str = "10:30:00" # 定义一个只包含时间的字符串
dt_no_default = parse(time_str) # 不指定default参数进行解析
print(f"'{
     
     time_str}' (无default) 解析结果: {
     
     dt_no_default}") # 打印解析结果
# 观察dt_no_default的年份、月份、日期，通常会是当前日期或1990-01-01

# 示例2：只提供时间，指定default为当前时间
current_time = datetime.now() # 获取当前的日期和时间
print(f"当前时间: {
     
     current_time}") # 打印当前时间
dt_with_current_default = parse(time_str, default=current_time) # 指定当前时间作为default参数进行解析
print(f"'{
     
     time_str}' (default=当前时间) 解析结果: {
     
     dt_with_current_default}") # 打印解析结果
# 观察dt_with_current_default的年份、月份、日期，应该与current_time的日期部分一致

# 示例3：只提供月份和日期，不指定default
month_day_str = "Oct 26" # 定义一个只包含月份和日期的字符串
dt_month_day_no_default = parse(month_day_str) # 不指定default参数进行解析
print(f"'{
     
     month_day_str}' (无default) 解析结果: {
     
     dt_month_day_no_default}") # 打印解析结果
# 观察dt_month_day_no_default的年份，通常会是当前年份或1990年

# 示例4：只提供月份和日期，指定default为特定年份
specific_year_default = datetime(2020, 1, 1) # 定义一个特定年份的datetime对象作为default
print(f"特定年份default: {
     
     specific_year_default}") # 打印这个特定的default
dt_month_day_with_default = parse(month_day_str, default=specific_year_default) # 指定特定年份的default进行解析
print(f"'{
     
     month_day_str}' (default=2020年) 解析结果: {
     
     dt_month_day_with_default}") # 打印解析结果
# 观察dt_month_day_with_default的年份，应该与specific_year_default的年份一致

# 示例5：指定default的完整性影响
# 如果default提供了时区信息，解析结果也可能继承
from dateutil.tz import tzutc # 从dateutil.tz导入tzutc函数，用于获取UTC时区对象
utc_now = datetime.now(tz=tzutc()) # 获取带有UTC时区信息的当前时间
print(f"带UTC时区的当前时间: {
     
     utc_now}") # 打印带时区的当前时间
dt_with_tz_default = parse("11:00", default=utc_now) # 使用带有UTC时区的当前时间作为default
print(f"'11:00' (default=带UTC时区) 解析结果: {
     
     dt_with_tz_default}") # 打印解析结果
print(f"解析结果的时区信息: {
     
     dt_with_tz_default.tzinfo}") # 打印解析结果的时区信息，应该继承了UTC

default 参数在处理不完整的日期时间字符串时非常有用，它允许我们为缺失的年、月、日、时、分、秒甚至时区提供一个上下文，从而确保解析结果符合我们的预期。

2.1.3 `ignoretz` 参数：忽略输入中的时区信息

有时，输入的日期时间字符串可能包含时区信息（如 +08:00 或 PST），但我们希望解析出的 datetime 对象是一个**无感知（naive）**的 datetime 对象，即不带任何时区信息。这时可以使用 ignoretz=True 参数。

from dateutil.parser import parse # 导入parser模块中的parse函数

# 示例1：带时区偏移量的字符串
tz_str = "2023-10-26 16:00:00+08:00" # 定义一个带时区偏移量的字符串
dt_with_tz = parse(tz_str) # 默认解析，会包含时区信息
print(f"'{
     
     tz_str}' (默认解析) 结果: {
     
     dt_with_tz}, 时区: {
     
     dt_with_tz.tzinfo}") # 打印解析结果和时区

dt_ignore_tz = parse(tz_str, ignoretz=True) # 使用ignoretz=True参数，忽略时区信息
print(f"'{
     
     tz_str}' (ignoretz=True) 结果: {
     
     dt_ignore_tz}, 时区: {
     
     dt_ignore_tz.tzinfo}") # 打印解析结果和时区
# 结果会是naive datetime，其tzinfo为None

# 示例2：带有时区缩写的字符串
tz_abbr_str = "2023-10-26 09:00 AM PST" # 定义一个带有时区缩写（PST）的字符串
dt_with_abbr_tz = parse(tz_abbr_str) # 默认解析，会尝试解析时区缩写
print(f"'{
     
     tz_abbr_str}' (默认解析) 结果: {
     
     dt_with_abbr_tz}, 时区: {
     
     dt_with_abbr_tz.tzinfo}") # 打印解析结果和时区
# 注意：对于时区缩写，dateutil的默认行为是尝试查找其对应的UTC偏移量，所以这里可能不是None，而是tzoffset对象

dt_ignore_abbr_tz = parse(tz_abbr_str, ignoretz=True) # 使用ignoretz=True参数，忽略时区缩写
print(f"'{
     
     tz_abbr_str}' (ignoretz=True) 结果: {
     
     dt_ignore_abbr_tz}, 时区: {
     
     dt_ignore_abbr_tz.tzinfo}") # 打印解析结果和时区
# 结果会是naive datetime，其tzinfo为None

ignoretz=True 在你明确知道只需要一个本地化的（无感知的）datetime 对象，而不需要处理复杂的时区转换时非常有用，它可以避免解析结果中附带可能不必要的时区信息。

2.1.4 `fuzzy` 参数：模糊匹配与错误容忍

parse() 函数默认是相当严格的，如果字符串中包含无法识别的字符或部分，它可能会抛出 ValueError。然而，在某些场景下，我们可能希望解析器对一些“噪音”字符具有一定的容忍度，只提取出有效的日期时间部分。这时就可以使用 fuzzy=True 参数。

当 fuzzy=True 时，parse() 函数会尝试跳过字符串中无法解析的子串，只解析能够构成有效日期时间的部分。

from dateutil.parser import parse # 导入parser模块中的parse函数

# 示例1：字符串中包含无关文本
noisy_str1 = "订单创建时间: 2023-10-26 17:00:00，用户ID: 12345" # 包含无关文本的字符串
try:
    dt_strict = parse(noisy_str1) # 默认严格模式解析
except ValueError as e:
    print(f"严格模式解析 '{
     
     noisy_str1}' 失败: {
     
     e}") # 打印错误信息

dt_fuzzy = parse(noisy_str1, fuzzy=True) # 使用fuzzy=True参数进行模糊解析
print(f"模糊模式解析 '{
     
     noisy_str1}' 结果: {
     
     dt_fuzzy}") # 打印解析结果

# 示例2：字符串中包含多个可能的日期时间，模糊解析只会取第一个
noisy_str2 = "启动时间 2023-01-01 10:00:00，结束时间 2023-01-02 11:00:00" # 包含多个日期时间的字符串
dt_fuzzy_multi = parse(noisy_str2, fuzzy=True) # 模糊模式解析
print(f"模糊模式解析 '{
     
     noisy_str2}' 结果: {
     
     dt_fuzzy_multi}") # 打印解析结果，通常是第一个识别到的日期时间

# 示例3：字符顺序混乱（对于完全混乱的，fuzzy也无能为力）
# 例如 "26 Oct 2023" 可以解析，但 "Oct 2023 26" 也能，甚至 "2023 26 Oct" 也可以。
# fuzzy主要处理非日期时间字符的噪音，而不是日期时间元素本身的混乱。
confused_str = "2023 年 10 月 26 日" # 包含中文分隔符的日期字符串
dt_confused = parse(confused_str, fuzzy=True) # 模糊模式解析
print(f"模糊模式解析 '{
     
     confused_str}' 结果: {
     
     dt_confused}") # 打印解析结果
# 对于这种模式，即使是fuzzy=True，也可能需要parserinfo的配合才能正确处理中文词汇。
# dateutil默认对英文和数字的混合格式支持较好。

# 示例4：解析包含未知缩写的情况 (fuzzy不处理语义问题)
unknown_abbr_str = "2023-10-26 15:00:00 PDT" # 包含时区缩写的字符串，PST/PDT可能在不同操作系统/Python环境中有不同识别能力
dt_unknown_abbr_fuzzy = parse(unknown_abbr_str, fuzzy=True) # 模糊模式解析
print(f"模糊模式解析 '{
     
     unknown_abbr_str}' 结果: {
     
     dt_unknown_abbr_fuzzy}") # 打印解析结果
# fuzzy=True在这里的作用主要是忽略PDT前后的潜在非日期时间字符。
# PDT本身的识别能力取决于dateutil内部的时区缩写映射。

fuzzy=True 在处理从日志文件、非结构化文本中提取日期时间时非常有用，因为它能容忍一些不规则的输入。然而，需要注意的是，它只会提取第一个它能成功解析的日期时间串，并且对于日期时间元素本身的混乱或语法错误，它的纠正能力是有限的。

2.1.5 `fuzzy_with_tokens` 参数：获取解析出的日期时间与剩余文本

fuzzy_with_tokens=True 参数是 fuzzy=True 的一个扩展。它不仅会进行模糊解析，还会返回一个元组，其中包含解析出的 datetime 对象以及一个包含剩余未解析字符串（“噪音”）的列表。这在需要进一步处理或分析原始字符串中非日期时间部分的场景中非常有用。

from dateutil.parser import parse # 导入parser模块中的parse函数

# 示例1：包含无关文本的字符串
noisy_str = "用户操作在 2023-10-26 18:30:00 记录，操作类型为 'login'，IP地址 '192.168.1.1'" # 包含无关文本的字符串
dt_obj, remaining_tokens = parse(noisy_str, fuzzy_with_tokens=True) # 使用fuzzy_with_tokens=True进行解析

print(f"原始字符串: '{
     
     noisy_str}'") # 打印原始字符串
print(f"解析出的datetime对象: {
     
     dt_obj}") # 打印解析出的datetime对象
print(f"剩余未解析的文本片段: {
     
     remaining_tokens}") # 打印剩余未解析的文本片段

# 示例2：字符串中只有日期时间
clean_str = "2023/11/01 09:00:00" # 只包含日期时间的字符串
dt_obj_clean, remaining_clean = parse(clean_str, fuzzy_with_tokens=True) # 进行解析

print(f"\n原始字符串: '{
     
     clean_str}'") # 打印原始字符串
print(f"解析出的datetime对象: {
     
     dt_obj_clean}") # 打印解析出的datetime对象
print(f"剩余未解析的文本片段: {
     
     remaining_clean}") # 打印剩余未解析的文本片段，此时应该为空列表或包含空字符串

# 示例3：字符串中包含多处可能解析为日期的部分，但只有第一个被识别
multi_date_str = "开始日期: 2023-01-01, 结束日期: 2023-01-31, 交付日期: 2023-02-15" # 包含多个日期部分的字符串
dt_obj_multi, remaining_multi = parse(multi_date_str, fuzzy_with_tokens=True) # 进行解析

print(f"\n原始字符串: '{
     
     multi_date_str}'") # 打印原始字符串
print(f"解析出的datetime对象 (第一个): {
     
     dt_obj_multi}") # 打印解析出的第一个datetime对象
print(f"剩余未解析的文本片段: {
     
     remaining_multi}") # 打印剩余未解析的文本片段，可以看到后面两个日期也被视为剩余文本

fuzzy_with_tokens=True 返回的 remaining_tokens 列表包含了被 parse() 函数跳过的所有非日期时间字符串片段。这对于日志解析、文本挖掘等需要同时提取结构化（日期时间）和非结构化信息的任务非常有用。

2.2 多种日期格式识别：从简单到复杂

dateutil.parser 的核心能力在于其强大的格式识别引擎。它能够处理各种常见的、不常见的，甚至是一些模糊的日期时间表示。

2.2.1 常见日期时间格式

parse() 函数能够轻松处理以下常见格式：

ISO 8601: YYYY-MM-DDTHH:MM:SS, YYYY-MM-DD HH:MM:SS, YYYY-MM-DD, YYYYMMDD 等。
美国常用格式: MM/DD/YYYY, MM-DD-YYYY, Month Day, Year, Month. Day, Year。
欧洲常用格式: DD/MM/YYYY, DD-MM-YYYY。
带AM/PM的12小时制时间。
各种分隔符: -, /, . 等。
混合格式: 日期和时间部分可以以不同格式组合。

from dateutil.parser import parse # 导入parser模块中的parse函数

print("--- 常见日期时间格式解析 ---")

# ISO 8601变体
print(f"'{
     
     parse('2023-10-26T10:00:00Z')}'") # 解析带Z（UTC）的ISO格式
print(f"'{
     
     parse('2023-10-26 10:00:00.123456')}'") # 解析带微秒的ISO格式

# 美国常用日期格式
print(f"'{
     
     parse('10/26/2023')}'") # 解析MM/DD/YYYY格式
print(f"'{
     
     parse('Oct 26, 2023')}'") # 解析Month Day, Year格式
print(f"'{
     
     parse('October 26th, 2023')}'") # 解析带序数词的格式（例如th, st, nd, rd）

# 欧洲常用日期格式
print(f"'{
     
     parse('26/10/2023')}'") # 解析DD/MM/YYYY格式
print(f"'{
     
     parse('26-Oct-2023')}'") # 解析DD-Mon-YYYY格式

# 12小时制时间
print(f"'{
     
     parse('2023-10-26 3:00 PM')}'") # 解析带PM的12小时制时间
print(f"'{
     
     parse('2023-10-26 9 AM')}'") # 解析带AM的12小时制时间

# 只有日期或只有时间
from datetime import datetime # 导入datetime模块中的datetime类
current_dt = datetime.now() # 获取当前日期时间
print(f"'{
     
     parse('15:30:00', default=current_dt)}'") # 解析只有时间，并使用当前日期填充
print(f"'{
     
     parse('2023-10-26', default=current_dt)}'") # 解析只有日期，并使用default的时间填充（默认为00:00:00）

# 混合分隔符
print(f"'{
     
     parse('2023.10.26 15,30,00')}'") # 解析带点和逗号的日期时间

2.2.2 相对日期描述（英文）

parse() 还能识别一些英文的相对日期描述，例如 "today", "yesterday", "tomorrow", "now" 等。

from dateutil.parser import parse # 导入parser模块中的parse函数
from datetime import datetime # 导入datetime模块中的datetime类
from dateutil.relativedelta import relativedelta # 导入relativedelta，用于验证相对日期的计算

print("\n--- 相对日期描述解析 (英文) ---")

today_dt = datetime.now() # 获取当前日期时间
print(f"当前时间 (基准): {
     
     today_dt}") # 打印基准时间

# "today"
parsed_today = parse("today", default=today_dt) # 解析"today"，以当前时间为基准
print(f"解析 'today': {
     
     parsed_today}") # 打印解析结果，应该和today_dt的日期部分一致

# "yesterday"
parsed_yesterday = parse("yesterday", default=today_dt) # 解析"yesterday"，以当前时间为基准
expected_yesterday = today_dt - relativedelta(days=1) # 使用relativedelta计算昨天
print(f"解析 'yesterday': {
     
     parsed_yesterday}, 期望: {
     
     expected_yesterday}") # 打印解析结果和期望结果

# "tomorrow"
parsed_tomorrow = parse("tomorrow", default=today_dt) # 解析"tomorrow"，以当前时间为基准
expected_tomorrow = today_dt + relativedelta(days=1) # 使用relativedelta计算明天
print(f"解析 'tomorrow': {
     
     parsed_tomorrow}, 期望: {
     
     expected_tomorrow}") # 打印解析结果和期望结果

# "now"
parsed_now = parse("now") # 解析"now"，不指定default时会以当前调用parse的时刻为基准
print(f"解析 'now': {
     
     parsed_now}") # 打印解析结果，非常接近当前时间

# "next monday"
parsed_next_monday = parse("next monday", default=today_dt) # 解析"next monday"，以当前时间为基准
print(f"解析 'next monday': {
     
     parsed_next_monday}") # 打印解析结果
# 验证：计算下一个星期一
from dateutil.relativedelta import MO # 导入代表星期一的MO常量
# 如果今天是星期一，relativedelta(weekday=MO(+1))会是下周一。
# parse("next monday")的逻辑通常是寻找下一个出现的星期一（包括今天如果是星期一的话，但通常是指从明天开始算起第一个）
# 更精确的relativedelta计算可能需要判断当前日期是星期几
# 例如：如果今天是周五，next monday是三天后。如果今天是周一，next monday是七天后。
# parse的next monday通常是从当前日期开始，向前找到最近的下一个周一。

对于相对日期描述，parse() 函数通常会结合 default 参数来确定基准时间。如果不提供 default，它会使用一个内部的默认基准，通常是程序运行时的当前日期时间。

2.2.3 模糊解析的边界与限制

尽管 fuzzy=True 提供了容错能力，但它并不是万能的。它主要处理非日期时间字符的干扰，而不是日期时间结构本身的错误或歧义。

日期时间元素的顺序歧义： 例如，"01/02/2023" 在美国通常是MM/DD/YYYY，在欧洲是DD/MM/YYYY。parse() 默认会尝试使用启发式规则（如尝试美式优先），或者通过 dayfirst/yearfirst 参数进行强制。fuzzy=True 在这种情况下不会改变解析的顺序逻辑，它只关心能否成功从字符串中提取出日期时间部分。
不完整的、无法推断的信息： 如果字符串缺失关键信息且 default 也无法提供有效上下文，parse() 仍会失败。例如，只给出 "October" 而没有年份或日期，将无法解析。
完全不符合模式的“噪音”： 过于混乱或格式扭曲的字符串，即使 fuzzy=True 也可能无法成功解析。
语言支持： parse() 默认对英文日期时间表达支持最好。对于其他语言（如中文的“昨天”、“明天”、“十月二十六日”），直接使用 parse() 可能无法识别，除非通过 parserinfo 参数提供相应的语言规则。我们将在后续章节详细讨论 parserinfo。

2.3 `dayfirst`, `yearfirst` 参数：解决日期顺序歧义

在国际化的应用中，日期格式的顺序是一个常见的问题。例如，"01/02/2023" 可能意味着2023年1月2日（MM/DD/YYYY）或2023年2月1日（DD/MM/YYYY）。dateutil.parser.parse() 提供了 dayfirst 和 yearfirst 参数来解决这种歧义。

dayfirst=True: 尝试将日期字符串中的第一组数字解析为天（日）。
yearfirst=True: 尝试将日期字符串中的第一组数字解析为年。

这些参数在遇到歧义时会优先考虑指定的顺序。如果不存在歧义（例如，字符串明确是ISO 8601格式），则这些参数的影响较小。

from dateutil.parser import parse # 导入parser模块中的parse函数

# 示例1：歧义日期字符串 "01/02/2023"
ambiguous_date_str = "01/02/2023" # 这是一个有歧义的日期字符串，可能是1月2日，也可能是2月1日

print(f"解析字符串: '{
     
     ambiguous_date_str}'") # 打印待解析的字符串

# 默认解析行为 (通常是MM/DD优先，但可能因系统或dateutil版本而异)
dt_default = parse(ambiguous_date_str) # 默认解析，取决于dateutil内部的启发式规则
print(f"默认解析 (通常MM/DD优先): {
     
     dt_default} (年份: {
     
     dt_default.year}, 月份: {
     
     dt_default.month}, 日期: {
     
     dt_default.day})") # 打印解析结果

# 强制 dayfirst=True (DD/MM/YYYY)
dt_dayfirst = parse(ambiguous_date_str, dayfirst=True) # 强制以“日”作为第一个数字解析
print(f"dayfirst=True (DD/MM优先): {
     
     dt_dayfirst} (年份: {
     
     dt_dayfirst.year}, 月份: {
     
     dt_dayfirst.month}, 日期: {
     
     dt_dayfirst.day})") # 打印解析结果

# 强制 yearfirst=True (YYYY/MM/DD 或 YYYY/DD/MM，取决于dayfirst)
# 如果yearfirst=True，那么歧义就变成了是YYYY/MM/DD还是YYYY/DD/MM。
# 通常会与dayfirst结合使用，或者单独处理。
# 例如 "2023/01/02"
ambiguous_year_str = "2023/01/02" # 这是一个以年份开头的日期字符串，但月份和日期仍有歧义（1月2日或2月1日）
dt_yearfirst_default = parse(ambiguous_year_str, yearfirst=True) # 强制以“年”作为第一个数字解析，然后默认MM/DD
print(f"yearfirst=True (默认MM/DD): {
     
     dt_yearfirst_default} (年份: {
     
     dt_yearfirst_default.year}, 月份: {
     
     dt_yearfirst_default.month}, 日期: {
     
     dt_yearfirst_default.day})") # 打印解析结果

dt_yearfirst_dayfirst = parse(ambiguous_year_str, yearfirst=True, dayfirst=True) # 强制以“年”作为第一个数字解析，然后强制以“日”作为第一个数字解析（YYYY/DD/MM）
print(f"yearfirst=True, dayfirst=True (YYYY/DD/MM): {
     
     dt_yearfirst_dayfirst} (年份: {
     
     dt_yearfirst_dayfirst.year}, 月份: {
     
     dt_yearfirst_dayfirst.month}, 日期: {
     
     dt_yearfirst_dayfirst.day})") # 打印解析结果

# 示例2：明确的日期字符串，参数不会改变解析结果
clear_date_str = "2023-10-26" # 一个明确的日期字符串
dt_clear_default = parse(clear_date_str) # 默认解析
print(f"\n明确日期字符串 '{
     
     clear_date_str}' 默认解析: {
     
     dt_clear_default}") # 打印解析结果
dt_clear_dayfirst = parse(clear_date_str, dayfirst=True) # 强制dayfirst=True
print(f"明确日期字符串 '{
     
     clear_date_str}' dayfirst=True 解析: {
     
     dt_clear_dayfirst}") # 打印解析结果
# 结果应该相同，因为2023-10-26没有歧义。

重要提示：

dayfirst 和 yearfirst 参数主要用于解决数字分隔符日期字符串中的顺序歧义。
它们是提示性参数，并非强制性的。如果 parse() 函数能够明确识别出一种格式（例如，“Oct 26, 2023”），则这些参数可能不会产生影响。
在实际应用中，如果可能，最好让数据源提供统一且明确的日期格式，或者使用诸如ISO 8601这类无歧义的国际标准。

2.4 时区信息处理：`tzinfos` 参数与时区推断

处理日期时间时，时区是一个非常复杂的概念。parse() 函数在处理带有时区信息的字符串时，也提供了强大的支持。它能够识别常见的时区缩写（如 EST, PST, GMT, UTC 等）和标准的UTC偏移量（如 +0800, -05:00）。

然而，时区缩写往往存在歧义（例如 CST 可能是中国标准时间、美国中部时间或古巴标准时间）。为了解决这种歧义并提供更精确的时区对象，parse() 函数提供了 tzinfos 参数。

2.4.1 自动识别时区缩写与偏移量

当字符串中包含明确的UTC偏移量或 dateutil 内部已知的时区缩写时，parse() 会自动将其解析为带有 dateutil.tz.tzoffset 或其他 tzinfo 对象的 datetime。

from dateutil.parser import parse # 导入parser模块中的parse函数
from dateutil.tz import tzutc # 导入tzutc函数，用于获取UTC时区对象
from datetime import timezone, timedelta # 导入datetime模块中的timezone和timedelta，用于比较时区

print("--- 自动识别时区信息 ---")

# 带UTC偏移量的字符串
dt_offset_str = "2023-10-26 10:00:00+0800" # 带+0800偏移量的字符串
dt_offset = parse(dt_offset_str) # 解析字符串
print(f"'{
     
     dt_offset_str}' 解析结果: {
     
     dt_offset}") # 打印解析结果
print(f"时区信息类型: {
     
     type(dt_offset.tzinfo)}") # 打印时区信息的类型，通常是tzoffset
print(f"UTC偏移量: {
     
     dt_offset.tzinfo.utcoffset(dt_offset)}") # 打印UTC偏移量

# 带Z（UTC）的ISO字符串
dt_iso_z_str = "2023-10-26T10:00:00Z" # 带Z（UTC）的ISO字符串
dt_iso_z = parse(dt_iso_z_str) # 解析字符串
print(f"'{
     
     dt_iso_z_str}' 解析结果: {
     
     dt_iso_z}") # 打印解析结果
print(f"时区信息类型: {
     
     type(dt_iso_z.tzinfo)}") # 打印时区信息的类型，通常是tzutc

# 带时区缩写的字符串（dateutil有内置映射）
dt_est_str = "2023-10-26 10:00:00 EST" # 带EST时区缩写的字符串
dt_est = parse(dt_est_str) # 解析字符串
print(f"'{
     
     dt_est_str}' 解析结果: {
     
     dt_est}") # 打印解析结果
print(f"时区信息类型: {
     
     type(dt_est.tzinfo)}") # 打印时区信息的类型，可能是tzoffset

# 带PST缩写的字符串
dt_pst_str = "2023-10-26 10:00:00 PST" # 带PST时区缩写的字符串
dt_pst = parse(dt_pst_str) # 解析字符串
print(f"'{
     
     dt_pst_str}' 解析结果: {
     
     dt_pst}") # 打印解析结果
print(f"时区信息类型: {
     
     type(dt_pst.tzinfo)}") # 打印时区信息的类型

2.4.2 `tzinfos` 参数：提供自定义时区映射

当字符串中的时区缩写不明确，或者我们希望将其映射到特定的 dateutil.tz 对象时，tzinfos 参数就变得非常有用。tzinfos 参数可以是一个字典，将时区缩写字符串映射到 tzinfo 对象或整数（UTC偏移量）。

字典映射： {"时区缩写": tzinfo对象}
函数映射： tzinfos 也可以是一个可调用对象（函数），它接收一个时区缩写字符串作为参数，并返回一个 tzinfo 对象或 None。

from dateutil.parser import parse # 导入parser模块中的parse函数
from dateutil import tz # 导入dateutil.tz模块

print("\n--- 使用 tzinfos 参数自定义时区映射 ---")

# 场景1：CST歧义问题。CST可能是Central Standard Time (UTC-6), China Standard Time (UTC+8), Cuba Standard Time (UTC-5)。
# 假设我们知道CST在这里特指中国标准时间。
china_tz = tz.gettz("Asia/Shanghai") # 获取上海时区（中国标准时间）
us_central_tz = tz.gettz("America/Chicago") # 获取美国中部时区

# 定义一个tzinfos字典，将CST映射到中国标准时间
custom_tzinfos_cst = {
   
   "CST": china_tz} # 创建一个字典，将"CST"映射到中国时区对象

dt_cst_china_str = "2023-10-26 10:00:00 CST" # 包含CST的字符串
dt_cst_china = parse(dt_cst_china_str, tzinfos=custom_tzinfos_cst) # 使用自定义tzinfos解析
print(f"'{
     
     dt_cst_china_str}' (映射CST到中国时区) 解析结果: {
     
     dt_cst_china}") # 打印解析结果
print(f"时区信息: {
     
     dt_cst_china.tzinfo}") # 打印时区信息

# 如果不提供tzinfos，或者提供不同的映射
dt_cst_default = parse(dt_cst_china_str) # 不提供tzinfos进行默认解析
print(f"'{
     
     dt_cst_china_str}' (默认解析) 结果: {
     
     dt_cst_default}") # 打印解析结果
print(f"时区信息 (默认): {
     
     dt_cst_default.tzinfo}") # 打印时区信息，可能解析为其他CST或None

# 定义一个tzinfos字典，将CST映射到美国中部时间
custom_tzinfos_cst_us = {
   
   "CST": us_central_tz} # 创建一个字典，将"CST"映射到美国中部时区对象
dt_cst_us = parse(dt_cst_china_str, tzinfos=custom_tzinfos_cst_us) # 使用映射到美国中部的tzinfos解析
print(f"'{
     
     dt_cst_china_str}' (映射CST到美国中部时区) 结果: {
     
     dt_cst_us}") # 打印解析结果
print(f"时区信息: {
     
     dt_cst_us.tzinfo}") # 打印时区信息

# 场景2：使用函数作为tzinfos
# 假设我们有一些自定义的时区缩写，例如"MYTZ"代表UTC+9。
def custom_tz_resolver(tz_abbr): # 定义一个函数，接收时区缩写作为参数
    if tz_abbr == "MYTZ": # 如果缩写是"MYTZ"
        return tz.tzoffset("MYTZ", 9 * 3600) # 返回一个自定义的tzoffset对象，代表+9小时偏移
    return None # 其他缩写返回None，让parser尝试默认处理

dt_mytz_str = "2023-10-26 10:00:00 MYTZ" # 包含自定义时区缩写的字符串
dt_mytz = parse(dt_mytz_str, tzinfos=custom_tz_resolver) # 使用自定义解析函数
print(f"'{
     
     dt_mytz_str}' (使用函数映射MYTZ) 解析结果: {
     
     dt_mytz}") # 打印解析结果
print(f"时区信息: {
     
     dt_mytz.tzinfo}") # 打印时区信息

# 场景3：混合使用缩写和偏移量
# tzinfos 也可以包含整数作为偏移量 (秒)
tzinfos_mixed = {
   
   
    "CST": china_tz,
    "MYOFFSET": 3 * 3600 # MYOFFSET 映射到 +3小时偏移
}
dt_mixed_str1 = "2023-10-26 10:00:00 CST" # 包含CST的字符串
dt_mixed_str2 = "2023-10-26 11:00:00 MYOFFSET" # 包含MYOFFSET的字符串

dt_mixed1 = parse(dt_mixed_str1, tzinfos=tzinfos_mixed) # 使用混合tzinfos解析CST
dt_mixed2 = parse(dt_mixed_str2, tzinfos=tzinfos_mixed) # 使用混合tzinfos解析MYOFFSET

print(f"'{
     
     dt_mixed_str1}' (混合tzinfos) 解析结果: {
     
     dt_mixed1}, 时区: {
     
     dt_mixed1.tzinfo}") # 打印解析结果和时区
print(f"'{
     
     dt_mixed_str2}' (混合tzinfos) 解析结果: {
     
     dt_mixed2}, 时区: {
     
     dt_mixed2.tzinfo}") # 打印解析结果和时区

tzinfos 参数的灵活性使得 parse() 函数能够处理各种复杂的时区缩写映射，确保解析出的 datetime 对象具有正确的时区信息，这在跨区域数据处理和国际化应用中至关重要。

2.5 `parserinfo` 参数：深度定制化解析规则与本地化

dateutil.parser 的强大之处在于其内部维护了一套复杂的解析规则和词汇表。这些规则和词汇表可以通过 parserinfo 参数进行深度定制。parserinfo 参数接受一个 parser.parserinfo 类的实例，该实例允许你修改解析器识别月份名称、星期名称、相对日期词汇（如"today"）等的能力，甚至可以指定默认的日期顺序。

这对于处理非英文或特定领域的日期时间字符串尤为重要。

2.5.1 `parser.parserinfo` 类的结构

parser.parserinfo 类包含了一系列属性，这些属性定义了 parse() 函数如何识别和解释日期时间字符串中的各种元素。

一些重要的属性包括：

__init__(self, **kwargs): 构造函数，可以通过关键字参数设置属性。
_params_dict: 这是一个字典，包含了所有可配置的解析参数。
JUMP: 一个元组，定义了解析时需要跳过的单词（例如 “at”, “on”, “the”）。
AMPM: 一个元组，定义了上午/下午的表示（例如 “AM”, “PM”）。
UTCZONE: 一个元组，定义了UTC时区的表示（例如 “UTC”, “GMT”, “Z”）。
TZOFFSET: 一个字典，映射时区缩写到UTC偏移量。
MONTHS: 一个列表的列表，定义了月份的名称和缩写。例如 [['Jan', 'January'], ...]。
WEEKS: 一个列表的列表，定义了星期的名称和缩写。例如 [['Mon', 'Monday'], ...]。
DAYS: 一个元组，定义了相对日期的表示（例如 “today”, “tomorrow”）。
PERTAIN: 一个元组，定义了“前一个/后一个”的表示（例如 “last”, “next”）。
DATESKIP: 一个元组，定义了日期分隔符（例如 “,”, “at”, “on”, “and”, “ad”）。

通过创建 parser.parserinfo 的实例并修改其属性，我们可以实现高度定制化的解析行为。

2.5.2 定制月份和星期的名称（国际化）

如果你需要解析包含非英文月份或星期名称的日期字符串，你可以通过修改 MONTHS 和 WEEKS 属性来实现。

from dateutil.parser import parse, parserinfo # 导入parse函数和parserinfo类
from datetime import datetime # 导入datetime模块中的datetime类

print("\n--- 定制月份和星期的名称 (中文示例) ---")

# 原始的parserinfo实例
default_info = parserinfo() # 创建默认的parserinfo实例
# print(f"默认月份名称: {default_info.MONTHS}") # 默认包含英文月份

# 创建一个中文月份名称的parserinfo
# 注意：这只是一个简化的例子，真正的中文日期解析可能需要更复杂的规则
# 例如，“十月”可以直接解析，但“一月”到“九月”可能需要特别处理。
# 并且，中文日期通常没有缩写形式。
chinese_months = [
    ['一月', '一月'], ['二月', '二月'], ['三月', '三月'], ['四月', '四月'],
    ['五月', '五月'], ['六月', '六月'], ['七月', '七月'], ['八月', '八月'],
    ['九月', '九月'], ['十月', '十月'], ['十一月', '十一月'], ['十二月', '十二月']
]
chinese_weeks = [
    ['周一', '星期一'], ['周二', '星期二'], ['周三', '星期三'], ['周四', '星期四'],
    ['周五', '星期五'], ['周六', '星期六'], ['周日', '星期日']
]

# 实例化一个新的parserinfo对象，并传入自定义的MONTHS和WEEKS
# 这里需要继承parserinfo并覆盖其属性，因为直接修改实例属性可能不会被parse函数识别。
# 或者更简单的方式是，通过修改内部的_params_dict来实现
# 实际操作中，可能需要通过parserinfo的构造函数传入，或创建一个子类。

# 尝试通过构造函数传入，但通常这不是直接传入列表的方式，而是通过子类或修改_params_dict
# 或者，最直接的方式是创建一个新的ParserInfo子类，并覆盖这些属性
class ChineseParserInfo(parserinfo): # 定义一个继承自parserinfo的类
    MONTHS = chinese_months # 覆盖MONTHS属性为中文月份
    WEEKS = chinese_weeks # 覆盖WEEKS属性为中文星期

chinese_info = ChineseParserInfo() # 实例化我们自定义的中文ParserInfo

# 测试中文日期字符串解析
# 注意：dateutil的parser是基于英文模式设计的，直接解析中文“年”、“月”、“日”等分隔符可能需要更复杂的正则匹配或预处理。
# 以下示例仅演示parserinfo在识别自定义词汇方面的能力，并不代表它能完整解析任意中文日期。
chinese_date_str1 = "2023年十月26日" # 包含中文“年”、“月”、“日”的日期字符串
chinese_date_str2 = "2023年10月26日 星期四" # 包含中文“年”、“月”、“日”和“星期”的日期字符串

try:
    # 直接使用parse解析中文日期，通常会失败，因为'年','月','日'等不在JUMP或DATESKIP中
    dt_fail = parse(chinese_date_str1) # 尝试默认解析中文日期
except ValueError as e:
    print(f"默认解析中文日期 '{
     
     chinese_date_str1}' 失败: {
     
     e}") # 打印错误信息

# 要让parse函数识别中文日期，需要将'年','月','日'等添加到parserinfo的DATESKIP中
class EnhancedChineseParserInfo(parserinfo): # 再次定义一个增强版的中文ParserInfo类
    MONTHS = chinese_months # 覆盖MONTHS属性
    WEEKS = chinese_weeks # 覆盖WEEKS属性
    # 添加中文日期分隔符到DATESKIP中
    # 注意：这里的JUMP和DATESKIP都是元组，需要先转换为列表再添加元素，再转回元组
    JUMP = parserinfo.JUMP + ('年', '月', '日', '号', '点', '时', '分', '秒', '星期', '周') # 添加中文分隔符到JUMP中
    DATESKIP = parserinfo.DATESKIP + ('年', '月', '日', '号') # 添加中文日期分隔符到DATESKIP中

enhanced_chinese_info = EnhancedChineseParserInfo() # 实例化增强版的中文ParserInfo

# 使用自定义的parserinfo解析中文日期
# 这仍然依赖于parse函数能否识别数字和这些新增的词汇的模式
# 例如 "2023年10月26日" 可能会被识别为 YYYY MONTH DD，但需要词汇表支持
chinese_date_str_with_month_name = "2023年十月26日" # 包含中文月份名称的日期字符串
try:
    # 尽管我们设置了MONTHS，但parse函数通常期望日期数字和词汇以特定顺序出现。
    # 这里可能仍无法直接解析，因为"十月"在数字"26"之前，且没有像"Oct 26"那样的标准模式。
    dt_parsed_chinese = parse(chinese_date_str_with_month_name, parserinfo=enhanced_chinese_info) # 使用增强的中文parserinfo解析
    print(f"'{
     
     chinese_date_str_with_month_name}' (自定义中文parserinfo) 解析结果: {
     
     dt_parsed_chinese}") # 打印解析结果
except ValueError as e:
    print(f"'{
     
     chinese_date_str_with_month_name}' (自定义中文parserinfo) 解析失败: {
     
     e}") # 打印错误信息

# 对于 "2023年10月26日 星期四"
# 通常，更可靠的方法是先用正则表达式提取出数字和英文月份/星期，再交给parse。
# 或者，对于纯数字的中文日期，如 "2023年10月26日"，parse可以通过fuzzy=True和default参数辅助。

# 示例：解析类似 "26 星期四" 这样的结构
# 如果输入是 "26 星期四"，并结合当前月份和年份
from datetime import date # 导入datetime模块中的date类
today = date.today() # 获取今天的日期
current_year = today.year # 获取当前年份
current_month = today.month # 获取当前月份

# 尝试解析 "26 星期四"，并使用当前年月作为default
# parse函数在解析这种只有日期和星期，没有月份年份的字符串时，
# 会尝试结合default的月份年份，并基于星期四来调整日期。
# 但对于"星期四"这种中文词汇，除非parserinfo的WEEKS和JUMP都配置正确，否则仍难识别。
# 让我们尝试一个更简单的，只修改JUMP的例子
class SimpleChineseParserInfo(parserinfo): # 定义一个简单的中文ParserInfo类
    JUMP = parserinfo.JUMP + ('年', '月', '日') # 只添加中文分隔符到JUMP中

simple_chinese_info = SimpleChineseParserInfo() # 实例化简单的中文ParserInfo
try:
    dt_simple_chinese = parse("2023年10月26日", parserinfo=simple_chinese_info) # 使用简单的中文parserinfo解析
    print(f"'2023年10月26日' (简单中文parserinfo) 解析结果: {
     
     dt_simple_chinese}") # 打印解析结果
except ValueError as e:
    print(f"'2023年10月26日' (简单中文parserinfo) 解析失败: {
     
     e}") # 打印错误信息

# 上述示例显示，虽然可以通过parserinfo定制词汇，但对于复杂的中文日期字符串，
# 仅仅修改MONTHS和WEEKS可能不足以让parse函数完全理解其结构。
# 通常需要配合更精细的文本预处理，或者选择针对中文日期解析的专门库。
# `dateutil.parser` 默认更侧重于西方日期格式。

重要提示： 尽管 parserinfo 提供了定制能力，但 dateutil.parser 的核心解析逻辑仍然是基于西式日期时间模式（数字和英文缩写）设计的。对于高度非标准或强依赖于特定语言文化（如中文的“年”、“月”、“日”等字作为分隔符，或完全不同顺序的表达）的日期字符串，parserinfo 的作用是有限的。在这种情况下，预处理字符串（例如，使用正则表达式提取数字并重新组合），或者使用其他专门的国际化日期时间解析库，可能是更有效的解决方案。

2.5.3 调整默认日期顺序（`dayfirst` 和 `yearfirst` 的内部实现）

实际上，dayfirst 和 yearfirst 参数在 parse() 函数内部也是通过修改 parserinfo 的行为来实现的。你可以通过 parserinfo 实例来更细粒度地控制这种行为，尽管直接使用 dayfirst/yearfirst 参数更常见。

parserinfo 内部有一个 _parser_params 字典，其中包含了 dayfirst 和 yearfirst 等布尔值。

from dateutil.parser import parse, parserinfo # 导入parse函数和parserinfo类

print("\n--- 通过 parserinfo 调整默认日期顺序 ---")

# 创建一个默认的parserinfo实例
info_default = parserinfo() # 创建默认的parserinfo实例
print(f"默认parserinfo的dayfirst: {
     
     info_default.dayfirst}, yearfirst: {
     
     info_default.yearfirst}") # 打印默认的dayfirst和yearfirst属性值

# 创建一个强制dayfirst的parserinfo实例
class MyDayFirstParserInfo(parserinfo): # 定义一个继承自parserinfo的类
    def __init__(self, **kwargs): # 构造函数
        super().__init__(**kwargs) # 调用父类构造函数
        self.dayfirst = True # 将dayfirst属性设置为True
        # 你也可以在这里设置其他参数，例如：
        # self.yearfirst = False

my_dayfirst_info = MyDayFirstParserInfo() # 实例化MyDayFirstParserInfo

ambiguous_str = "01/02/2023" # 有歧义的日期字符串

# 使用我们自定义的dayfirst parserinfo来解析
dt_custom_dayfirst = parse(ambiguous_str, parserinfo=my_dayfirst_info) # 使用自定义parserinfo解析
print(f"'{
     
     ambiguous_str}' (自定义dayfirst=True) 解析结果: {
     
     dt_custom_dayfirst}") # 打印解析结果
print(f"年份: {
     
     dt_custom_dayfirst.year}, 月份: {
     
     dt_custom_dayfirst.month}, 日期: {
     
     dt_custom_dayfirst.day}") # 打印解析结果的年月日

# 对比直接使用dayfirst参数
dt_param_dayfirst = parse(ambiguous_str, dayfirst=True) # 直接使用dayfirst参数解析
print(f"'{
     
     ambiguous_str}' (直接dayfirst=True参数) 解析结果: {
     
     dt_param_dayfirst}") # 打印解析结果
print(f"年份: {
     
     dt_param_dayfirst.year}, 月份: {
     
     dt_param_dayfirst.month}, 日期: {
     
     dt_param_dayfirst.day}") # 打印解析结果的年月日

# 结果应该是一致的，因为parserinfo是底层机制，而dayfirst参数是便捷接口。

# 创建一个强制yearfirst的parserinfo实例
class MyYearFirstParserInfo(parserinfo): # 定义一个继承自parserinfo的类
    def __init__(self, **kwargs): # 构造函数
        super().__init__(**kwargs) # 调用父类构造函数
        self.yearfirst = True # 将yearfirst属性设置为True

my_yearfirst_info = MyYearFirstParserInfo() # 实例化MyYearFirstParserInfo

ambiguous_year_str = "23/01/02" # 包含年份缩写和歧义的日期字符串（可能是2023年1月2日或2001年2月23日等）
# 注意：解析两位数年份时，dateutil有其启发式规则（通常是当前世纪）。

dt_custom_yearfirst = parse(ambiguous_year_str, parserinfo=my_yearfirst_info) # 使用自定义yearfirst parserinfo解析
print(f"'{
     
     ambiguous_year_str}' (自定义yearfirst=True) 解析结果: {
     
     dt_custom_yearfirst}") # 打印解析结果
print(f"年份: {
     
     dt_custom_yearfirst.year}, 月份: {
     
     dt_custom_yearfirst.month}, 日期: {
     
     dt_custom_yearfirst.day}") # 打印解析结果的年月日

dt_param_yearfirst = parse(ambiguous_year_str, yearfirst=True) # 直接使用yearfirst参数解析
print(f"'{
     
     ambiguous_year_str}' (直接yearfirst=True参数) 解析结果: {
     
     dt_param_yearfirst}") # 打印解析结果
print(f"年份: {
     
     dt_param_yearfirst.year}, 月份: {
     
     dt_param_yearfirst.month}, 日期: {
     
     dt_param_yearfirst.day}") # 打印解析结果的年月日

通过 parserinfo 进行定制化通常用于更复杂的场景，例如需要同时修改多个解析参数，或者需要为特定的应用定义一套固定的解析规则。在大多数情况下，直接使用 parse() 函数提供的关键字参数（如 dayfirst, yearfirst, default, fuzzy 等）就足够了。

2.6 性能考量与优化

尽管 dateutil.parser.parse() 功能强大且智能，但这种智能性也伴随着一定的性能开销。因为它需要尝试多种模式和启发式规则来识别日期时间字符串。对于需要解析大量日期时间字符串的场景（如处理大型日志文件、导入大量数据），性能优化变得重要。

2.6.1 性能瓶颈分析

parse() 函数的性能瓶颈主要在于：

模式匹配的尝试： 它会尝试多种内置的日期时间模式，这涉及到字符串的遍历、切分、类型转换和验证。
正则表达式的开销： 内部可能使用了正则表达式进行模式匹配。
模糊解析的额外开销： 当 fuzzy=True 时，解析器会做更多的工作来跳过无关字符，这会增加计算量。
时区查找： 解析时区缩写时，需要查询内部的时区映射表，这也有一定的开销。

2.6.2 优化策略

针对上述瓶颈，我们可以采取以下优化策略：

避免不必要的智能解析： 如果你已经知道日期字符串的精确格式，优先使用 datetime.datetime.strptime()。strptime() 虽然需要手动指定格式，但它跳过了 parse() 的智能识别过程，因此效率更高。

from datetime import datetime # 导入datetime模块中的datetime类
from dateutil.parser import parse # 导入parser模块中的parse函数
import timeit # 导入timeit模块，用于测量代码执行时间

date_str = "2023-10-26 10:30:45.123456" # 待解析的日期字符串
format_str = "%Y-%m-%d %H:%M:%S.%f" # 对应的精确格式字符串

# 使用strptime
strptime_time = timeit.timeit("datetime.strptime(date_str, format_str)",
                              globals=globals(), number=10000) # 测量strptime执行10000次的时间
print(f"strptime 解析10000次耗时: {
       
       strptime_time:.6f} 秒") # 打印耗时

# 使用parse
parse_time = timeit.timeit("parse(date_str)",
                            globals=globals(), number=10000) # 测量parse执行10000次的时间
print(f"parse 解析10000次耗时: {
       
       parse_time:.6f} 秒") # 打印耗时

# 结果通常会显示strptime显著快于parse

减少 parse() 的工作量：
- 预处理字符串： 如果输入字符串中包含大量噪音，可以尝试在调用 parse() 之前使用正则表达式或其他字符串操作清理掉无关字符，使其更接近标准格式。
- 避免 fuzzy=True： 除非绝对必要，否则尽量避免使用 fuzzy=True，因为它会增加额外的处理逻辑。
- 限制 tzinfos 的复杂性： 如果 tzinfos 参数传入一个函数，确保该函数是高效的。

缓存解析器实例（针对 parser.parser 类）： 如果在循环中反复解析日期字符串，并且你创建了自定义的 parserinfo 实例，可以考虑复用 parser.parser 实例，而不是每次都创建一个新的。然而，dateutil.parser.parse 函数本身是模块级别的便捷函数，内部已经做了优化，通常无需手动管理 parser.parser 实例。这种优化更多是针对非常特定的高级用法。

# 示例：(这更多是概念性展示，parse函数本身已经高度优化)
from dateutil.parser import parser # 导入parser类，注意是小写的parser，不是模块
from dateutil.parser import parserinfo # 导入parserinfo类
from datetime import datetime # 导入datetime模块中的datetime类
import timeit # 导入timeit模块

# 定义一个自定义的parserinfo，例如为了演示复用
class CustomParserInfo(parserinfo): # 定义一个继承自parserinfo的类
    JUMP = parserinfo.JUMP + ('特殊字', ) # 添加一个特殊的跳过词

custom_info = CustomParserInfo() # 实例化自定义parserinfo

# 场景1：每次都调用模块级的parse函数（这是最常见和推荐的方式）
def parse_with_module_func(s): # 定义一个使用模块级parse函数的函数
    return parse(s, parserinfo=custom_info) # 调用parse函数，传入自定义parserinfo

# 场景2：创建并复用一个parser实例
# 实际上，parse函数内部会管理parser实例，这里只是为了演示parser类本身
my_parser = parser(custom_info) # 实例化一个parser类，传入自定义parserinfo

def parse_with_instance(s): # 定义一个使用parser实例的函数
    return my_parser.parse(s) # 调用parser实例的parse方法

test_date_str = "2023-10-26 10:00:00 特殊字" # 包含特殊字的日期字符串

time_module_func = timeit.timeit("parse_with_module_func(test_date_str)", globals=globals(), number=10000) # 测量模块级函数执行时间
time_instance = timeit.timeit("parse_with_instance(test_date_str)", globals=globals(), number=10000) # 测量实例方法执行时间

print(f"\n模块级parse函数 (含自定义info) 10000次耗时: {
       
       time_module_func:.6f} 秒") # 打印耗时
print(f"复用parser实例 (含自定义info) 10000次耗时: {
       
       time_instance:.6f} 秒") # 打印耗时
# 在许多情况下，两者的性能差异可能不显著，因为模块级函数已经很优化。
# 这种优化更适用于需要更底层控制的场景。

使用专门的时间序列库： 对于大数据量的时间序列处理，Pandas 等库通常提供了高度优化的日期时间解析功能，它们底层可能使用了C语言或其他高性能实现。

总结来说，dateutil.parser.parse() 是一个非常方便和强大的工具，但在性能敏感的场景下，了解其工作原理并选择合适的优化策略（特别是优先使用 strptime() 当格式已知时）至关重要。

2.7 内部机制剖析：`parser` 如何识别模式

要深入理解 dateutil.parser.parse() 函数的智能之处，我们需要对其内部的解析机制有一个大致的了解。虽然 dateutil 源代码复杂且不断演进，但其核心思想和流程是相对稳定的。

parse() 函数的解析过程可以概括为以下几个主要步骤：

分词（Tokenization）：
- 首先，输入的日期时间字符串会被分解成一系列“词法单元”（tokens）。这些词法单元可以是数字、月份名称、星期名称、时区缩写、标点符号、特殊关键字（如“AM”、“PM”、“today”等）以及其他被认为是分隔符或“噪音”的字符。
- parserinfo 中定义的 JUMP 和 DATESKIP 等属性在这里发挥作用，它们帮助解析器识别哪些字符是可以跳过的，哪些是重要的分隔符。
例如，"Oct 26, 2023 3:00 PM" 可能会被分解为："Oct", "26", ",", "2023", "3", ":", "00", "PM"。
模式匹配与启发式规则：
- 解析器会尝试将这些词法单元组合成已知的日期时间模式。dateutil 内部维护了一个庞大的预定义模式库。
- 这些模式涵盖了ISO 8601、RFC 2822（电子邮件日期）、通用美式/欧式日期、以及各种只包含日期或时间的部分等。
- 解析器会遍历这些模式，尝试找到第一个能够完全匹配当前词法单元序列的模式。
- 贪婪匹配与回溯： 解析器会尝试尽可能多地匹配词法单元以形成一个完整的日期时间组件（例如，它会尝试将连续的数字组合成年份、月份或日期）。如果某个模式尝试失败，它会回溯并尝试其他模式。
- 歧义解决： 对于像 "01/02/2023" 这样的歧义（MM/DD vs DD/MM），解析器会根据内部的启发式规则（通常偏向美式MM/DD），或者根据 dayfirst/yearfirst 参数的指示来优先选择。
- 相对日期处理： 如果遇到 “today”, “tomorrow” 等关键字，解析器会根据 default 参数提供的基准日期时间，计算出相应的具体日期。
组件提取与验证：
- 一旦匹配到一个模式，解析器就会从词法单元中提取出年份、月份、日期、小时、分钟、秒、微秒等各个日期时间组件。
- 它会进行一些基本的合法性验证，例如月份是否在1-12之间，日期是否在有效范围内（考虑闰年）。如果组件不合法，则当前模式匹配失败，会尝试下一个模式或抛出 ValueError。
时区信息处理：
- 如果字符串中包含时区信息（偏移量或缩写），解析器会尝试将其转换为 dateutil.tz 模块中的 tzinfo 对象。
- tzinfos 参数在这里发挥作用，它提供了自定义时区缩写到 tzinfo 对象的映射，优先级高于内置映射。
datetime 对象构建：
- 所有成功的组件被提取并验证后，解析器会使用这些组件以及 default 参数中提供的缺失信息（如果适用），来构造一个最终的 datetime.datetime 对象。
- 如果解析成功，返回 datetime 对象；如果所有模式都尝试失败，或者遇到不可恢复的错误，则抛出 ValueError。

图示解析流程（文本描述替代图片）：

[输入字符串]
       |
       V
[分词器 (Tokenizer)] --- 依赖 parserinfo (JUMP, DATESKIP, MONTHS, WEEKS...)
       |
       V
[词法单元序列 (Tokens)]
       |
       V
[模式匹配引擎 (Pattern Matching Engine)] --- 遍历内置模式库，应用启发式规则
       |                          |
       |                          V
       |                    [根据 dayfirst/yearfirst, 解决歧义]
       |                          |
       |                          V
       |                    [根据 default 参数，填充缺失组件]
       |                          |
       |                          V
       |                    [识别并解析时区信息 (tzinfos)]
       |                          |
       V                          V
[成功匹配到模式?] --(是)--> [提取并验证日期时间组件]
       |                          |
       (否)                     V
       |                    [构建 datetime 对象]
       V                          |
[抛出 ValueError] <---(失败)-- [返回 datetime 对象]

（说明：上述图示为文本描述的流程图，代表了 dateutil.parser.parse 函数的内部处理逻辑。箭头表示数据流向或控制流。）

理解这些内部机制有助于我们更好地利用 parse() 函数，并在遇到解析失败或意外结果时进行调试。它也解释了为什么 parse() 在某些情况下比 strptime() 慢，因为它付出了额外的计算开销来猜测和验证格式。

2.8 `isoparse()` 函数：专为ISO 8601格式优化

除了通用的 parse() 函数，dateutil.parser 还提供了一个专门用于解析 ISO 8601 格式日期时间的函数 isoparse()。

ISO 8601 是一个国际标准，用于日期和时间的书面表示。它的格式是明确且无歧义的，例如 YYYY-MM-DDTHH:MM:SS.ffffffZ 或 YYYY-MM-DDTHH:MM:SS+HH:MM。

由于 isoparse() 不需要像 parse() 那样尝试多种不同的日期时间模式，它专注于ISO 8601标准格式，因此在解析ISO 8601字符串时通常比 parse() 更快，且更严格。如果输入的字符串不是有效的ISO 8601格式，isoparse() 会抛出 ValueError。

from dateutil.parser import parse, isoparse # 导入parse和isoparse函数
import timeit # 导入timeit模块

print("\n--- isoparse() 函数：ISO 8601 格式解析 ---")

iso_str_valid = "2023-10-26T14:30:00Z" # 有效的ISO 8601字符串
iso_str_invalid = "October 26, 2023 2:30 PM" # 无效的ISO 8601字符串（但parse可以解析）

# 使用isoparse解析有效ISO字符串
dt_iso_valid = isoparse(iso_str_valid) # 使用isoparse解析有效ISO字符串
print(f"'{
     
     iso_str_valid}' 使用 isoparse 解析: {
     
     dt_iso_valid}") # 打印解析结果
print(f"时区信息: {
     
     dt_iso_valid.tzinfo}") # 打印时区信息

# 尝试使用isoparse解析无效ISO字符串
try:
    isoparse(iso_str_invalid) # 尝试用isoparse解析无效ISO字符串
except ValueError as e:
    print(f"'{
     
     iso_str_invalid}' 使用 isoparse 解析失败 (预期): {
     
     e}") # 打印预期错误信息

# 对比parse解析同一个无效ISO字符串
dt_parse_invalid = parse(iso_str_invalid) # 使用parse解析无效ISO字符串
print(f"'{
     
     iso_str_invalid}' 使用 parse 解析: {
     
     dt_parse_invalid}") # 打印解析结果
# parse能够解析，因为它更通用。

# 性能对比 (针对ISO 8601字符串)
number_of_runs = 100000 # 设置运行次数
iso_parse_time = timeit.timeit("isoparse(iso_str_valid)",
                               globals=globals(), number=number_of_runs) # 测量isoparse执行时间
parse_time_for_iso = timeit.timeit("parse(iso_str_valid)",
                                   globals=globals(), number=number_of_runs) # 测量parse执行时间

print(f"\n解析 '{
     
     iso_str_valid}' {
     
     number_of_runs}次:") # 打印测试字符串和运行次数
print(f"isoparse 耗时: {
     
     iso_parse_time:.6f} 秒") # 打印isoparse耗时
print(f"parse 耗时: {
     
     parse_time_for_iso:.6f} 秒") # 打印parse耗时
# 通常，isoparse会比parse更快，因为它有更少的通用性开销。

当你知道输入字符串严格符合ISO 8601标准时，isoparse() 是一个更好的选择，因为它既提供了性能优势，又提供了更严格的验证。在从API、数据库或其他遵循ISO 8601标准的源获取日期时间数据时，isoparse() 是首选工具。

第三章：核心模块深入解析：`dateutil.relativedelta` - 灵活的时间间隔计算艺术

在处理日期和时间时，我们经常需要进行“相对”的计算：例如，“三个月后”、“下个周五”、“去年同期”等。Python 标准库中的 datetime.timedelta 类提供了处理固定时间间隔（如天、秒、微秒）的能力，但它无法理解“月”或“年”这种长度不固定的时间单位，也无法处理基于日历规则（如“下个星期二”）的相对移动。

dateutil.relativedelta 类正是为了弥补 timedelta 的这些局限性而设计的。它提供了对年、月、星期等不固定长度时间单位的直观表示和计算，以及更复杂的日历逻辑，使得日期时间的增减操作变得异常灵活和强大。

3.1 `datetime.timedelta` 的局限性与 `relativedelta` 的诞生

让我们先通过一个简单的例子，回顾 timedelta 的局限性，从而理解 relativedelta 存在的必要性。

from datetime import datetime, timedelta, date # 导入datetime模块中的datetime、timedelta和date类

print("--- datetime.timedelta 的局限性 ---")

# 示例1：timedelta 处理固定天数
today = date(2023, 10, 26) # 定义一个日期对象，代表2023年10月26日
tomorrow = today + timedelta(days=1) # 使用timedelta增加一天
print(f"今天: {
     
     today}, 明天: {
     
     tomorrow}") # 打印今天和明天的日期

# 示例2：timedelta 无法直接处理月份
# 假设我们想计算“一个月后”的日期
jan_31 = date(2023, 1, 31) # 定义一个日期对象，代表2023年1月31日
# month_later_attempt = jan_31 + timedelta(months=1) # 这一行代码会报错，因为timedelta不支持'months'参数
# print(f"2023年1月31日 + 1个月 (尝试失败): {month_later_attempt}")
print(f"尝试使用 timedelta(months=1) 会引发 TypeError，因为 'months' 是一个无效的关键字参数。") # 提示timedelta不支持月份

# 示例3：timedelta 无法智能处理跨年和跨月的天数
# 2023年2月有多少天？28天。
feb_start = date(2023, 2, 1) # 定义2023年2月1日
feb_end_plus_one = feb_start + timedelta(days=28) # 增加28天，到达3月1日
print(f"2023年2月1日 + 28天: {
     
     feb_end_plus_one}") # 打印结果：2023-03-01

# 2024年是闰年，2月有29天。
feb_start_leap = date(2024, 2, 1) # 定义2024年2月1日
feb_end_plus_one_leap = feb_start_leap + timedelta(days=28) # 增加28天，到达2月29日
print(f"2024年2月1日 + 28天: {
     
     feb_end_plus_one_leap}") # 打印结果：2024-02-29
# 如果我们想说“一个月后”，timedelta需要我们手动计算每个月的天数，这很不方便。

# 示例4：timedelta 无法处理“下个星期二”这种日历规则
# next_tuesday_attempt = today + timedelta(weekday=TUESDAY) # 同样会报错，timedelta不支持这种日历规则
print(f"尝试使用 timedelta(weekday=TUESDAY) 会引发 TypeError。") # 提示timedelta不支持星期几

从上述例子中，我们可以清晰地看到 datetime.timedelta 的局限性：它只能处理固定的时间增量（如秒、微秒、天），而对于那些长度不固定（如月、年，考虑闰年）或基于特定日历规则（如“下个星期二”）的相对时间计算，它就力不从心了。

dateutil.relativedelta 正是为了解决这些问题而诞生的。它提供了一个更加语义化和智能的方式来表达和计算日期时间间隔。

3.2 `relativedelta` 的基本实例化与应用

relativedelta 类在 dateutil.relativedelta 模块中。它的构造函数接受多个关键字参数，每个参数代表一个日期时间单位的相对变化量。

3.2.1 引入 `relativedelta`

首先，我们需要从 dateutil.relativedelta 模块中导入 relativedelta 类。

from dateutil.relativedelta import relativedelta # 从dateutil.relativedelta模块导入relativedelta类
from datetime import datetime, date # 导入datetime模块中的datetime和date类

3.2.2 核心参数：`years`, `months`, `days`, `weeks`, `hours`, `minutes`, `seconds`, `microseconds`

relativedelta 构造函数可以接受与 timedelta 类似的时间单位参数，但它的处理方式更加智能，尤其是在处理 years 和 months 时。

from datetime import datetime, date # 导入datetime模块中的datetime和date类
from dateutil.relativedelta import relativedelta # 导入dateutil.relativedelta模块中的relativedelta类

print("--- relativedelta 的基本用法 ---")

# 定义一个基准日期时间
base_dt = datetime(2023, 10, 26, 14, 30, 0) # 定义一个datetime对象作为基准时间点
base_date = date(2023, 10, 26) # 定义一个date对象作为基准日期点

print(f"基准日期时间: {
     
     base_dt}") # 打印基准日期时间
print(f"基准日期: {
     
     base_date}") # 打印基准日期

# 示例1：增加年份
rd_years = relativedelta(years=1) # 创建一个relativedelta对象，表示增加1年
dt_one_year_later = base_dt + rd_years # 将基准datetime对象与relativedelta对象相加
print(f"一年后: {
     
     dt_one_year_later}") # 打印一年后的日期时间

# 示例2：增加月份
rd_months = relativedelta(months=3) # 创建一个relativedelta对象，表示增加3个月
dt_three_months_later = base_dt + rd_months # 将基准datetime对象与relativedelta对象相加
print(f"三个月后: {
     
     dt_three_months_later}

你可能感兴趣的:(python,开发语言)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
PDF转Markdown - Python 实现方案与代码 Eiceblue Python Python PDF pdf python 开发语言 vscode
PDF作为广泛使用的文档格式，转换为轻量级标记语言Markdown后，可无缝集成到技术文档、博客平台和版本控制系统中，提高内容的可编辑性和可访问性。本文将详细介绍如何使用国产Spire.PDFforPython库将PDF文档转换为Markdown格式。技术优势：精准保留原始文档结构（段落/列表/表格）完整提取文本和图像内容无需Adobe依赖的纯Python实现支持Linux/Windows/mac
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
数据可视化：数据世界的直观呈现卢政权1 信息可视化数据分析数据挖掘
在当今数字化浪潮中，数据呈爆炸式增长。数据可视化作为一种强大的技术手段，能够将复杂的数据转化为直观的图形、图表等形式，让数据背后的信息一目了然。无论是在商业决策、科学研究还是日常数据分析中，数据可视化都发挥着极为重要的作用。它帮助我们快速理解数据的分布、趋势、关联等特征，从而为进一步的分析和行动提供有力支持。接下来，我们将深入探讨数据可视化的奥秘，并通过代码示例展示其实际应用。一、Python数据
Python 程序设计讲义（25）：循环结构——嵌套循环
Python程序设计讲义（25）：循环结构——嵌套循环目录Python程序设计讲义（25）：循环结构——嵌套循环一、嵌套循环的执行流程二、嵌套循环对应的几种情况1、内循环和外循环互不影响2、外循环迭代影响内循环的条件3、外循环迭代影响内循环的循环体嵌套循环是指在一个循环体中嵌套另一个循环。while循环中可以嵌入另一个while循环或for循环。反之，也可以在for循环中嵌入另一个for循环或wh
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
一个开源AI牛马神器 | AiPy，平替Manus，装完直接上手写Python！ Agent加载失败人工智能 python 开源算法 AI编程
还记得三个月前那个在闲鱼被炒到万元邀请码的Manus吗？现在你点官网，直接提示「所在地区不可用」了它走了，但更香的国产开源项目出现了：AiPy（爱派）。主打一个极致简化的AIAgent理念：别搞什么插件市场、Agent路由，直接给AI一个Python解释器，让它用自然语言写代码干活。听起来狠活？实际体验更狠：•完全本地化，界面傻瓜式操作，支持自然语言生成&执行Python任务；•数据清洗、文档总结
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
2025.07 Java入门笔记01 殷浩焕笔记
一、熟悉IDEA和Java语法（一）LiuCourseJavaOOP1.一直在用C++开发，python也用了些，Java是真的不熟，用什么IDE还是问的同事；2.一开始安装了jdk-23，拿VSCode当编辑器，在cmd窗口编译运行，也能玩；但是想正儿八经搞项目开发，还是需要IDE；3.安装了IDEA社区版：（1）IDE通常自带对应编程语言的安装包，例如IDEA自带jbr-21（和jdk是不同的
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
Python STL概念学习与代码实践体制教科书
本文还有配套的精品资源，点击获取简介：通过”py_stl_learning”项目，学习者可以使用Python实现和理解C++STL的概念，包括数据结构、算法、容器适配器、模板和泛型容器等。Python中的列表、集合、字典等数据结构与STL中的vector、set、map等类似，而Python的itertools和functools模块提供了STL风格的算法功能。Python通过其面向对象的特性以及
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

【Python】dateutil库

第一章：dateutil

1.1 datetime 模块的局限性回顾

1.2 dateutil 的诞生与核心价值

1.3 dateutil 的安装与基础使用

1.3.1 安装 dateutil

1.3.2 快速入门示例

第二章：核心模块深入解析：dateutil.parser - 日期字符串解析的艺术

2.1 parse() 函数的强大能力

2.1.1 基本用法与自动识别能力

2.1.2 default 参数：填充缺失信息

2.1.3 ignoretz 参数：忽略输入中的时区信息

2.1.4 fuzzy 参数：模糊匹配与错误容忍

2.1.5 fuzzy_with_tokens 参数：获取解析出的日期时间与剩余文本