李智 - 重庆

Python3 正则表达式：文本处理的魔法工具

内容简介

本系列文章是为 Python3 学习者精心设计的一套全面、实用的学习指南，旨在帮助读者从基础入门到项目实战，全面提升编程能力。文章结构由 5 个版块组成，内容层层递进，逻辑清晰。

基础速通：n 个浓缩提炼的核心知识点，夯实编程基础；
经典范例：10 个贴近实际的应用场景，深入理解 Python3 的编程技巧和应用方法；
避坑宝典：10 个典型错误解析，提供解决方案，帮助读者避免常见的编程陷阱；
水平考试：10 道测试题目，检验学习成果，附有标准答案，以便自我评估；
实战案例：3 个迷你项目开发，带领读者从需求分析到代码实现，掌握项目开发的完整流程。

无论你是 Python3 初学者，还是希望提升实战能力的开发者，本系列文章都能为你提供清晰的学习路径和实用的编程技巧，助你快速成长为 Python3 编程高手。

阅读建议

初学者：建议从 “基础速通” 开始，系统学习 Python3 的基础知识，然后通过 “经典范例” 和 “避坑宝典” 加深理解，最后通过 “水平考试” 和 “实战案例” 巩固所学内容；
有经验的开发者：可以直接跳转到 “经典范例” 和 “避坑宝典”，快速掌握 Python3 的高级应用技巧和常见错误处理方法，然后通过 “实战案例” 提升项目开发能力；
选择性学习：如果读者对某个特定主题感兴趣，可以直接选择相应版块学习。各版块内容既相互独立又逻辑关联，方便读者根据自身需求灵活选择；
测试与巩固：完成每个版块的学习后，建议通过 “水平考试” 检验学习效果，并通过 “实战案例” 将理论知识转化为实际技能；
项目实战优先：如果你更倾向于实战学习，可以直接从 “实战案例” 入手，边做边学，遇到问题再回溯相关知识点。

一、基础速通

正则表达式（Regular Expression，简称 regex 或 regexp）是一种强大的工具，用于匹配和处理文本。Python 通过 re 模块提供了对正则表达式的支持。正则表达式可以用于搜索、替换、分割和验证字符串。

1. 基本概念

模式（Pattern）：正则表达式的核心是模式，它定义了你要匹配的文本规则。
元字符（Metacharacters）：在正则表达式中具有特殊意义的字符，如 ., *, +, ?, ^, $, \, |, {, }, [, ], (, ) 等。
普通字符：除了元字符之外的字符，如字母、数字等。

2. 常用元字符

.：匹配除换行符以外的任意单个字符。
^：匹配字符串的开头。
$：匹配字符串的结尾。
*：匹配前面的字符零次或多次。
+：匹配前面的字符一次或多次。
?：匹配前面的字符零次或一次。
{n}：匹配前面的字符恰好 n 次。
{n,}：匹配前面的字符至少 n 次。
{n,m}：匹配前面的字符至少 n 次，至多 m 次。
\：转义字符，用于匹配元字符本身。
|：或操作符，匹配左边或右边的表达式。
[]：字符集，匹配其中的任意一个字符。
()：分组，将多个字符作为一个整体进行匹配。

3. 常用字符集

\d：匹配任意数字，等价于 [0-9]。
\D：匹配任意非数字字符，等价于 [^0-9]。
\w：匹配任意字母、数字或下划线，等价于 [a-zA-Z0-9_]。
\W：匹配任意非字母、数字或下划线的字符，等价于 [^a-zA-Z0-9_]。
\s：匹配任意空白字符，包括空格、制表符、换行符等。
\S：匹配任意非空白字符。

4. `re` 模块常用函数

re.match(pattern, string)：从字符串的起始位置匹配正则表达式，如果匹配成功返回匹配对象，否则返回 None。
re.search(pattern, string)：在字符串中搜索匹配正则表达式的第一个位置，如果匹配成功返回匹配对象，否则返回 None。
re.findall(pattern, string)：返回字符串中所有匹配正则表达式的子串，返回一个列表。
re.finditer(pattern, string)：返回一个迭代器，包含所有匹配正则表达式的子串。
re.sub(pattern, repl, string)：将字符串中匹配正则表达式的部分替换为 repl。
re.split(pattern, string)：根据正则表达式匹配的子串将字符串分割，返回一个列表。

5. 示例

5.1 匹配数字

import re

text = "The price is 123.45 dollars."
pattern = r'\d+\.\d+'
match = re.search(pattern, text)
if match:
    print("Found:", match.group())

5.2 替换字符串

import re

text = "Hello, world!"
pattern = r'world'
repl = 'Python'
new_text = re.sub(pattern, repl, text)
print(new_text)  # 输出: Hello, Python!

5.3 分割字符串

import re

text = "apple,banana,cherry"
pattern = r','
result = re.split(pattern, text)
print(result)  # 输出: ['apple', 'banana', 'cherry']

5.4 查找所有匹配

import re

text = "The rain in Spain falls mainly in the plain."
pattern = r'\bin\b'
matches = re.findall(pattern, text)
print(matches)  # 输出: ['in', 'in', 'in']

6. 分组和捕获

分组使用 () 来定义，可以捕获匹配的子串。

import re

text = "John Doe, Jane Doe"
pattern = r'(\w+) (\w+)'
matches = re.findall(pattern, text)
for first_name, last_name in matches:
    print(f"First: {first_name}, Last: {last_name}")

7. 非贪婪匹配

默认情况下，* 和 + 是贪婪的，会尽可能多地匹配字符。可以在它们后面加上 ? 来使其变为非贪婪匹配。

import re

text = "Title"
pattern = r'<.*?>'
matches = re.findall(pattern, text)
print(matches)  # 输出: ['', '', '', '', '', '']

8. 编译正则表达式

如果需要多次使用同一个正则表达式，可以将其编译为正则表达式对象，以提高效率。

import re

pattern = re.compile(r'\d+')
text = "There are 3 apples and 5 oranges."
matches = pattern.findall(text)
print(matches)  # 输出: ['3', '5']

9. 标志（Flags）

re 模块提供了一些标志来修改正则表达式的行为，如忽略大小写、多行匹配等。

re.IGNORECASE 或 re.I：忽略大小写。
re.MULTILINE 或 re.M：多行模式，^ 和 $ 匹配每行的开头和结尾。
re.DOTALL 或 re.S：使 . 匹配包括换行符在内的所有字符。

import re

text = "Hello\nWorld"
pattern = r'^world'
match = re.search(pattern, text, re.IGNORECASE | re.MULTILINE)
if match:
    print("Found:", match.group())

小结

正则表达式是处理文本的强大工具，Python 的 re 模块提供了丰富的功能来支持正则表达式的使用。通过掌握正则表达式的基本语法和 re 模块的常用函数，你可以高效地处理各种文本匹配和替换任务。

二、经典范例

以下是 10 个经典的正则表达式应用实例，每个实例都包含正则表达式的解释、测试代码以及执行结果的注释说明。

1. 匹配邮箱地址

正则表达式: r'^[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+$'

解释：匹配常见的邮箱地址格式。
^ 和 $ 表示字符串的开始和结束。
[a-zA-Z0-9_.+-]+ 匹配用户名部分。
@ 匹配邮箱中的 @ 符号。
[a-zA-Z0-9-]+ 匹配域名部分。
\. 匹配域名中的点 .。
[a-zA-Z0-9-.]+ 匹配顶级域名部分。

import re

pattern = r'^[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+$'
emails = ["[email protected]", "[email protected]", "invalid-email@com"]
for email in emails:
    if re.match(pattern, email):
        print(f"Valid: {email}")
    else:
        print(f"Invalid: {email}")

# 执行结果:
# Valid: [email protected]
# Valid: [email protected]
# Invalid: invalid-email@com

2. 匹配手机号码

正则表达式: r'^1[3-9]\d{9}$'

解释：匹配中国大陆的手机号码。
1 表示手机号码的第一位。
[3-9] 表示第二位可以是 3 到 9 之间的数字。
\d{9} 表示后面跟着 9 位数字。

import re

pattern = r'^1[3-9]\d{9}$'
phones = ["13800138000", "12345678901", "19912345678"]
for phone in phones:
    if re.match(pattern, phone):
        print(f"Valid: {phone}")
    else:
        print(f"Invalid: {phone}")

# 执行结果:
# Valid: 13800138000
# Invalid: 12345678901
# Valid: 19912345678

3. 匹配 URL

正则表达式: r'https?://(?:www\.)?\S+'

解释：匹配 HTTP 或 HTTPS 协议的 URL。
https? 匹配 http 或 https。
:// 匹配 URL 中的协议分隔符。
(?:www\.)? 匹配可选的 www.。
\S+ 匹配 URL 的其余部分。

import re

pattern = r'https?://(?:www\.)?\S+'
urls = ["https://www.example.com", "http://example.com", "ftp://example.com"]
for url in urls:
    if re.match(pattern, url):
        print(f"Valid: {url}")
    else:
        print(f"Invalid: {url}")

# 执行结果:
# Valid: https://www.example.com
# Valid: http://example.com
# Invalid: ftp://example.com

4. 匹配日期（YYYY-MM-DD）

正则表达式: r'^\d{4}-[01]?[0-2]-[0123]?[0-9]$'

解释：匹配 YYYY-MM-DD 格式的日期。
\d{4} 匹配 4 位年份。
- 匹配日期分隔符。
[01]?[0-2] 匹配 2 位月份。
[0123]?[0-9] 匹配 2 位日期。

import re

pattern = r'^\d{4}-[01]?[0-2]-[0123]?[0-9]$'
dates = ["2023-10-05", "2023/10/05", "2023-13-01"]
for date in dates:
    if re.match(pattern, date):
        print(f"Valid: {date}")
    else:
        print(f"Invalid: {date}")

# 执行结果:
# Valid: 2023-10-05
# Invalid: 2023/10/05
# Invalid: 2023-13-01

5. 匹配 IP 地址

正则表达式: r'^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$'

解释：匹配 IPv4 地址。
\d{1,3} 匹配 1 到 3 位数字。
\. 匹配 IP 地址中的点 .。

import re

pattern = r'^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$'
ips = ["192.168.1.1", "256.256.256,256", "127.0.0.1"]
for ip in ips:
    if re.match(pattern, ip):
        print(f"Valid: {ip}")
    else:
        print(f"Invalid: {ip}")

# 执行结果:
# Valid: 192.168.1.1
# Invalid: 256.256.256.256
# Valid: 127.0.0.1

6. 匹配 HTML 标签

正则表达式: r'<(\w+)[^>]*>(.*?)'

解释：匹配 HTML 标签及其内容。
<(\w+) 匹配标签名。
[^>]* 匹配标签内的属性。
>(.*?) 匹配标签内容。
匹配对应的闭合标签。

import re

pattern = r'<(\w+)[^>]*>(.*?)'
html = "Hello World
"
match = re.search(pattern, html)
if match:
    print(f"Tag: {match.group(1)}, Content: {match.group(2)}")

# 执行结果:
# Tag: div, Content: Hello World

7. 匹配中文字符

正则表达式: r'[\u4e00-\u9fff]+'

解释：匹配中文字符。
[\u4e00-\u9fff] 是中文字符的 Unicode 范围。

import re

pattern = r'[\u4e00-\u9fff]+'
text = "Hello 世界"
matches = re.findall(pattern, text)
print(matches)  # 执行结果: ['世界']

8. 匹配密码强度

正则表达式: r'^(?=.*[A-Z])(?=.*[a-z])(?=.*\d)(?=.*[\W_]).{8,}$'

解释：匹配强密码（至少 8 位，包含大小写字母、数字和特殊字符）。
(?=.*[A-Z]) 确保至少有一个大写字母。
(?=.*[a-z]) 确保至少有一个小写字母。
(?=.*\d) 确保至少有一个数字。
(?=.*[\W_]) 确保至少有一个特殊字符。
.{8,} 确保密码长度至少为 8。

import re

pattern = r'^(?=.*[A-Z])(?=.*[a-z])(?=.*\d)(?=.*[\W_]).{8,}$'
passwords = ["Password123!", "weakpass", "StrongPass1"]
for pwd in passwords:
    if re.match(pattern, pwd):
        print(f"Strong: {pwd}")
    else:
        print(f"Weak: {pwd}")

# 执行结果:
# Strong: Password123!
# Weak: weakpass
# Strong: StrongPass1

9. 匹配十六进制颜色值

正则表达式: r'^#([A-Fa-f0-9]{6}|[A-Fa-f0-9]{3})$'

解释：匹配十六进制颜色值（如 #FFFFFF 或 #FFF）。
# 匹配颜色值开头的 #。
[A-Fa-f0-9]{6} 匹配 6 位十六进制值。
[A-Fa-f0-9]{3} 匹配 3 位十六进制值。

import re

pattern = r'^#([A-Fa-f0-9]{6}|[A-Fa-f0-9]{3})$'
colors = ["#FFFFFF", "#FFF", "#123456", "#GHIJKL"]
for color in colors:
    if re.match(pattern, color):
        print(f"Valid: {color}")
    else:
        print(f"Invalid: {color}")

# 执行结果:
# Valid: #FFFFFF
# Valid: #FFF
# Valid: #123456
# Invalid: #GHIJKL

10. 匹配文件名和扩展名

正则表达式: r'^(\w+)\.(\w+)$'

解释：匹配文件名和扩展名。
(\w+) 匹配文件名。
\. 匹配点 .。
(\w+) 匹配扩展名。

import re

pattern = r'^(\w+)\.(\w+)$'
filename = "example.txt"
match = re.match(pattern, filename)
if match:
    print(f"Filename: {match.group(1)}, Extension: {match.group(2)}")

# 执行结果:
# Filename: example, Extension: txt

三、避坑宝典

在使用正则表达式时，初学者和中级用户经常会遇到一些常见错误。以下是 10 种常见的正则表达式错误、原因分析以及纠错方法。

1. 忘记转义特殊字符

错误：直接使用 .、*、+ 等元字符而未转义。

import re
pattern = r'example.com'
text = "example-com"
match = re.search(pattern, text)  # 无法匹配

原因：. 是元字符，匹配任意字符，而不是字面的点 .。
纠错：使用 \. 转义。

pattern = r'example\.com'

2. 贪婪匹配导致意外结果

错误：使用 .* 或 .+ 时匹配过多内容。

import re
pattern = r'<.*>'
text = "Hello
World
"
match = re.search(pattern, text)  # 匹配整个字符串

原因：* 和 + 是贪婪的，会尽可能多地匹配字符。
纠错：使用非贪婪匹配 .*? 或 .+?。

pattern = r'<.*?>'

3. 忽略多行模式

错误：在多行文本中使用 ^ 或 $ 时，未启用多行模式。

import re
pattern = r'^Hello'
text = "Line1\nHello\nLine2"
match = re.search(pattern, text)  # 无法匹配

原因：默认情况下，^ 和 $ 只匹配字符串的开头和结尾。
纠错：使用 re.MULTILINE 标志。

match = re.search(pattern, text, re.MULTILINE)

4. 字符集未正确使用

错误：在字符集中未正确使用 -。

import re
pattern = r'[A-Z]'
text = "abc123"
match = re.search(pattern, text)  # 无法匹配小写字母

原因：[A-Z] 只匹配大写字母。
纠错：使用 [A-Za-z] 匹配所有字母。

pattern = r'[A-Za-z]'

5. 分组捕获错误

错误：未正确使用分组捕获。

import re
pattern = r'(\d{2})-(\d{2})-(\d{4})'
text = "12-31-2023"
match = re.search(pattern, text)
if match:
    print(match.group(1))  # 输出 12

原因：分组索引从 1 开始，group(0) 是整个匹配内容。
纠错：确保使用正确的分组索引。

if match:
    print(match.group(1), match.group(2), match.group(3))  # 输出 12 31 2023

6. 忽略大小写

错误：未忽略大小写导致匹配失败。

import re
pattern = r'hello'
text = "Hello World"
match = re.search(pattern, text)  # 无法匹配

原因：默认情况下，正则表达式区分大小写。
纠错：使用 re.IGNORECASE 标志。

match = re.search(pattern, text, re.IGNORECASE)

7. 量词使用错误

错误：量词使用不当导致匹配失败。

import re
pattern = r'\d{3,5}'
text = "123"
match = re.search(pattern, text)  # 匹配成功，但可能不符合预期

原因：{3,5} 表示匹配 3 到 5 个数字，但可能匹配过多。
纠错：根据需求调整量词。

pattern = r'\d{3}'  # 只匹配 3 个数字

8. 未正确处理边界

错误：未使用单词边界 \b。

import re
pattern = r'cat'
text = "category"
match = re.search(pattern, text)  # 匹配成功，但可能不符合预期

原因：cat 会匹配 category 中的 cat。
纠错：使用 \b 确保匹配完整单词。

pattern = r'\bcat\b'

9. 忽略空白字符

错误：未正确处理空白字符。

import re
pattern = r'hello world'
text = "hello   world"
match = re.search(pattern, text)  # 无法匹配

原因：正则表达式中的空格是字面匹配。
纠错：使用 \s+ 匹配空白字符。

pattern = r'hello\s+world'

10. 未正确处理换行符

错误：未正确处理多行文本中的换行符。

import re
pattern = r'^Hello'
text = "Line1\nHello\nLine2"
match = re.search(pattern, text)  # 无法匹配

原因：不能正确处理换行符。
纠错：使用 re.MULTILINE 标志。

match = re.search(pattern, text, re.MULTILINE)

小结

正则表达式虽然强大，但在使用时容易犯一些常见错误。通过理解这些错误的原因并掌握纠错方法，可以更高效地使用正则表达式处理文本。

四、水平考试

这是一份关于“正则表达式”的测试试卷。包含：选择题：15 道、填空题：10 道和 编程题：5 道，总分 100 分。每道题后附有答案和解析。

选择题（每题 2 分，共 30 分）

以下哪个正则表达式可以匹配任意数字？
- A. \d
- B. \D
- C. \w
- D. \s
  答案：A
  解析：\d 匹配任意数字，\D 匹配非数字，\w 匹配字母、数字或下划线，\s 匹配空白字符。
以下哪个正则表达式可以匹配一个或多个字母？
- A. [a-z]
- B. [a-z]+
- C. [a-z]*
- D. [a-z]?
  答案：B
  解析：+ 表示前面的字符至少出现一次。
以下哪个正则表达式可以匹配字符串的开头？
- A. $
- B. ^
- C. \b
- D. \B
  答案：B
  解析：^ 匹配字符串的开头，$ 匹配字符串的结尾。
以下哪个正则表达式可以匹配一个单词边界？
- A. \b
- B. \B
- C. ^
- D. $
  答案：A
  解析：\b 匹配单词边界，\B 匹配非单词边界。
以下哪个正则表达式可以匹配一个浮点数？
- A. \d+\.\d+
- B. \d*\.\d*
- C. \d+\.\d*
- D. \d*\.\d+
  答案：A
  解析：\d+\.\d+ 匹配至少一个数字，后跟一个小数点，再跟至少一个数字。
以下哪个正则表达式可以匹配一个邮箱地址？
- A. [a-zA-Z0-9]+@[a-zA-Z0-9]+\.[a-zA-Z]+
- B. [a-zA-Z0-9]+@[a-zA-Z0-9]+
- C. [a-zA-Z0-9]+@[a-zA-Z0-9]+\.[a-zA-Z0-9]+
- D. [a-zA-Z0-9]+@[a-zA-Z0-9]+\.[a-zA-Z0-9]+\.
  答案：A
  解析：邮箱地址的格式为 用户名@域名.顶级域名。
以下哪个正则表达式可以匹配一个 URL？
- A. https?://\S+
- B. http://\S+
- C. https://\S+
- D. http://\S
  答案：A
  解析：https? 匹配 http 或 https，\S+ 匹配非空白字符。
以下哪个正则表达式可以匹配一个 HTML 标签？
- A. <.*>
- B. <.*?>
- C. <.+>
- D. <.+?>
  答案：B
  解析：<.*?> 使用非贪婪匹配，避免匹配过多内容。
以下哪个正则表达式可以匹配一个中文字符？
- A. [\u4e00-\u9fff]
- B. [a-zA-Z]
- C. \d
- D. \w
  答案：A
  解析：[\u4e00-\u9fff] 是中文字符的 Unicode 范围。
以下哪个正则表达式可以匹配一个 IP 地址？
- A. \d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}
- B. \d{1,3}\.\d{1,3}\.\d{1,3}
- C. \d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}
- D. \d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}
  答案：A
  解析：IPv4 地址由 4 个 1 到 3 位的数字组成，用 . 分隔。
以下哪个正则表达式可以匹配一个日期（YYYY-MM-DD）？
- A. \d{4}-\d{2}-\d{2}
- B. \d{2}-\d{2}-\d{4}
- C. \d{4}/\d{2}/\d{2}
- D. \d{2}/\d{2}/\d{4}
  答案：A
  解析：\d{4}-\d{2}-\d{2} 匹配 YYYY-MM-DD 格式的日期。
以下哪个正则表达式可以匹配一个时间（HH:MM:SS）？
- A. \d{2}:\d{2}:\d{2}
- B. \d{2}:\d{2}
- C. \d{2}:\d{2}:\d{2}:\d{2}
- D. \d{2}:\d{2}:\d{2}:\d{2}:\d{2}
  答案：A
  解析：\d{2}:\d{2}:\d{2} 匹配 HH:MM:SS 格式的时间。
以下哪个正则表达式可以匹配一个十六进制颜色值？
- A. #[A-Fa-f0-9]{6}
- B. #[A-Fa-f0-9]{3}
- C. #[A-Fa-f0-9]{6}|#[A-Fa-f0-9]{3}
- D. #[A-Fa-f0-9]{6}|#[A-Fa-f0-9]{3}|#[A-Fa-f0-9]{2}
  答案：C
  解析：十六进制颜色值可以是 3 位或 6 位。
以下哪个正则表达式可以匹配一个文件名和扩展名？
- A. \w+\.\w+
- B. \w+\.\w
- C. \w+\.\w{2,4}
- D. \w+\.\w+\.\w+
  答案：A
  解析：\w+\.\w+ 匹配文件名和扩展名。
以下哪个正则表达式可以匹配一个强密码（至少 8 位，包含大小写字母、数字和特殊字符）？
- A. ^(?=.*[A-Z])(?=.*[a-z])(?=.*\d)(?=.*[\W_]).{8,}$
- B. ^(?=.*[A-Z])(?=.*[a-z])(?=.*\d).{8,}$
- C. ^(?=.*[A-Z])(?=.*[a-z]).{8,}$
- D. ^(?=.*[A-Z])(?=.*\d).{8,}$
  答案：A
  解析：(?=.*[A-Z]) 确保至少有一个大写字母，(?=.*[a-z]) 确保至少有一个小写字母，(?=.*\d) 确保至少有一个数字，(?=.*[\W_]) 确保至少有一个特殊字符。

填空题（每题 3 分，共 30 分）

正则表达式 \d{3}-\d{2}-\d{4} 可以匹配的格式是：________。
答案：XXX-XX-XXXX（例如：123-45-6789）
正则表达式 ^[A-Za-z]+$ 可以匹配的字符串是：________。
答案：仅包含字母的字符串
正则表达式 \b\w+\b 可以匹配的字符串是：________。
答案：一个完整的单词
正则表达式 \d{2}:\d{2}:\d{2} 可以匹配的格式是：________。
答案：HH:MM:SS（例如：12:34:56）
正则表达式 [\u4e00-\u9fff]+ 可以匹配的字符串是：________。
答案：中文字符
正则表达式 ^[a-zA-Z0-9_]{4,16}$ 可以匹配的字符串是：________。
答案：4 到 16 位的用户名（字母、数字、下划线）
正则表达式 https?://\S+ 可以匹配的字符串是：________。
答案：HTTP 或 HTTPS 协议的 URL
正则表达式 \d+\.\d+ 可以匹配的字符串是：________。
答案：浮点数（例如：3.14）
正则表达式 ^#([A-Fa-f0-9]{6}|[A-Fa-f0-9]{3})$ 可以匹配的字符串是：________。
答案：十六进制颜色值（例如：#FFFFFF 或 #FFF）
正则表达式 ^(\d{4})-(\d{2})-(\d{2})$ 可以匹配的格式是：________。
答案：YYYY-MM-DD（例如：2023-10-05）

编程题（每题 8 分，共 40 分）

编写一个正则表达式，匹配一个合法的邮箱地址。
答案：

import re
pattern = r'^[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+$'
emails = ["[email protected]", "invalid-email@com"]
for email in emails:
    if re.match(pattern, email):
        print(f"Valid: {email}")
    else:
        print(f"Invalid: {email}")

编写一个正则表达式，匹配一个合法的手机号码（中国大陆）。
答案：

import re
pattern = r'^1[3-9]\d{9}$'
phones = ["13800138000", "12345678901"]
for phone in phones:
    if re.match(pattern, phone):
        print(f"Valid: {phone}")
    else:
        print(f"Invalid: {phone}")

编写一个正则表达式，匹配一个合法的 URL。
答案：

import re
pattern = r'https?://(?:www\.)?\S+'
urls = ["https://www.example.com", "ftp://example.com"]
for url in urls:
    if re.match(pattern, url):
        print(f"Valid: {url}")
    else:
        print(f"Invalid: {url}")

编写一个正则表达式，匹配一个合法的日期（YYYY-MM-DD）。
答案：

import re
pattern = r'^\d{4}-\d{2}-\d{2}$'
dates = ["2023-10-05", "2023/10/05"]
for date in dates:
    if re.match(pattern, date):
        print(f"Valid: {date}")
    else:
        print(f"Invalid: {date}")

编写一个正则表达式，匹配一个合法的强密码（至少 8 位，包含大小写字母、数字和特殊字符）。
答案：

import re
pattern = r'^(?=.*[A-Z])(?=.*[a-z])(?=.*\d)(?=.*[\W_]).{8,}$'
passwords = ["Password123!", "weakpass"]
for pwd in passwords:
    if re.match(pattern, pwd):
        print(f"Strong: {pwd}")
    else:
        print(f"Weak: {pwd}")

总分：100 分

选择题：15 题 × 2 分 = 30 分
填空题：10 题 × 3 分 = 30 分
编程题：5 题 × 8 分 = 40 分

五、实战案例

本节内容包含 3 个关于“正则表达式”的综合应用项目，每个项目都包含完整的程序代码、测试案例、执行结果以及代码说明。具体项目是：

邮箱地址提取器
日志文件分析器
HTML 标签提取器

项目 1：邮箱地址提取器

功能描述

从一段文本中提取所有合法的邮箱地址。

代码

import re

def extract_emails(text):
    # 正则表达式匹配邮箱地址
    pattern = r'[a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+'
    # 查找所有匹配的邮箱地址
    emails = re.findall(pattern, text)
    return emails

# 测试案例
text = """
Contact us at [email protected] or [email protected]. 
For more information, visit https://www.example.com.
Invalid email: user@com.
"""
emails = extract_emails(text)
print("Extracted emails:", emails)

执行结果

Extracted emails: ['[email protected]', '[email protected]']

代码说明

使用正则表达式 [a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+ 匹配邮箱地址。
re.findall 返回所有匹配的邮箱地址。

项目 2：日志文件分析器

功能描述

从日志文件中提取所有错误日志（包含 “ERROR” 关键字）。

代码

import re

def extract_errors(log_file):
    # 正则表达式匹配错误日志
    pattern = r'ERROR.*'
    errors = []
    with open(log_file, 'r') as file:
        for line in file:
            match = re.search(pattern, line)
            if match:
                errors.append(match.group())
    return errors

# 测试案例
log_file = 'sample_log.txt'
# 假设 sample_log.txt 内容如下：
"""
INFO: User logged in
ERROR: Failed to connect to database
INFO: Request processed
ERROR: File not found
"""
errors = extract_errors(log_file)
print("Error logs:")
for error in errors:
    print(error)

执行结果

Error logs:
ERROR: Failed to connect to database
ERROR: File not found

代码说明

使用正则表达式 ERROR.* 匹配以 “ERROR” 开头的日志行。
逐行读取日志文件并提取匹配的错误日志。

项目 3：HTML 标签提取器

功能描述

从 HTML 文本中提取所有标签及其内容。

代码

import re

def extract_html_tags(html):
    # 正则表达式匹配 HTML 标签及其内容
    pattern = r'<(\w+)[^>]*>(.*?)'
    tags = re.findall(pattern, html)
    return tags

# 测试案例
html = """
Welcome
This is a test paragraph.
Link
"""
tags = extract_html_tags(html)
print("HTML tags and content:")
for tag, content in tags:
    print(f"Tag: {tag}, Content: {content}")

执行结果

HTML tags and content:
Tag: div, Content: Welcome
Tag: p, Content: This is a test paragraph.
Tag: a, Content: Link

代码说明

使用正则表达式 <(\w+)[^>]*>(.*?) 匹配 HTML 标签及其内容。
re.findall 返回所有匹配的标签及其内容。

小结

以上 3 个迷你项目展示了正则表达式在实际应用中的强大功能，包括文本提取、日志分析、HTML 处理等。通过这些项目，可以更好地理解和掌握正则表达式的使用。

你可能感兴趣的:(Python,精讲精练,-,从入门到实战,python,经验分享,编程技巧,编程实战,正则表达式)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
2022-10-20 体力劳动者
不因感觉稍纵即逝就不加记录。在女儿睡觉后我记下今天的小故事。接手新班级后，今天是第二次收到家长的感谢信（微信）。是我表扬次数最多的两位学生家长致来的感谢，他们明显感受到孩子自信、阳光了不少，写作业由被动变为了主动，家庭氛围也由鸡飞狗跳变成了其乐融融。在被顽皮的学生气得头晕之后，我感到了久违的价值感，责任感甚至使命感，我回复家长这样一句话：我们也需要家长的反馈好让我们的教育工作更有劲头。我也认识到，
移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
9、汇编语言编程入门：从环境搭建到简单程序实现神经网络酱汇编语言 MEPIS GNU工具链
汇编语言编程入门：从环境搭建到简单程序实现1.数据存储介质问题解决在处理数据存储时，若要使用MEPIS系统，需确保有其可访问的存储介质。目前，MEPIS无法向采用NTFS格式（常用于Windows2000和XP工作站）的硬盘写入数据。不过，若硬盘采用FAT32格式，MEPIS就能进行写入操作。此外，MEPIS还能将文件写入软盘和大多数USB闪存驱动器。若工作站连接到局域网，还可通过FTP协议或挂载
三件事—小白猫·雨天·八段锦咸鱼月亮
1.最近楼下出现一只非常漂亮的粘人小白猫，看着不像是流浪猫，非常亲人。眼睛比蓝球的还大，而且是绿色的，很漂亮。第一次遇到它，它就跟我到电梯口，如果我稍微招招手，肯定就跟我进电梯了。后来我喂过它几次，好可惜不能养它，一只蓝球就是我的极限了。2.下雨天就心烦，好奇怪。明明以前我超爱看窗外的雨和听雨声，看来近来的心情不够宁静了。3.最近在练八段锦，从第一次就爱上了这个运动，很轻松缓慢，但是却出汗。感觉可
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
现在发挥你的优势爱生活的佑嘉
来和我做咨询的一些朋友，涉及到定位的，都会说，我不知道我的优势是什么，你能不能帮我看看？还有一些朋友，喜欢做各种测试来了解自己，测试过后，然并卵。今天，我想来聊聊优势，如何能了解自己的优势是什么。首先，我们要知道，如果要成为“不一般”的人，我们所做的事情，就要基于自身的优势。我做管理者十多年，看到每个员工都有不同的特长，有的擅长数字，有的擅长人际，有的擅长写作。这些知道自己优势并且在这方面刻意练习
密码正则验证：大小写字母、数字、特殊字符至少8位 qq_21875331 渐进式的成长
正则表达式：密码必须包含大写字母、数字、特殊字符（四种里至少三种，且至少8位）写法一：/((^(?=.*[a-z])(?=.*[A-Z])(?=.*\W)[\da-zA-Z\W]{8,16}$)|(^(?=.*\d)(?=.*[A-Z])(?=.*\W)[\da-zA-Z\W]{8,16}$)|(^(?=.*\d)(?=.*[a-z])(?=.*\W)[\da-zA-Z\W]{8,16}$)|(^
深入解析JVM工作原理：从字节码到机器指令的全过程
一、JVM概述Java虚拟机(JVM)是Java平台的核心组件，它实现了Java"一次编写，到处运行"的理念。JVM是一个抽象的计算机器，它有自己的指令集和运行时内存管理机制。JVM的主要职责：加载：读取.class文件并验证其正确性存储：管理内存分配和垃圾回收执行：解释或编译字节码为机器指令安全：提供沙箱环境限制恶意代码二、JVM架构详解JVM由三个主要子系统组成：1.类加载子系统类加载过程分为
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
2021-会说话的人运气都不会太差-会说话的人更善于倾听（5）沉默、留白 12_德德
21、说话时，如想强调某一部分，一个有效方法是，以沉默留出空白。留出多大空白才好呢？7秒。22、沉默所营造的“空白”长度，说的人感觉到的，是实际长度的3倍，而听的人感觉到的，则只有实际长度的1/3。23、只要善于用“一直”来表达，就不会给人以不过是一时任性之感。能说“一直”的人，会得到周围的支持，在合适的时候想到你。24、要得到“是把好手”的高度评价，就要展示你对公司的热爱。特别是，如能对上司或公
车载刷写架构 --- 整车刷写中为何增加了ECU 队列刷写策略？汽车电子实验室电子电器架构——刷写方案车载电子电气架构架构开发语言车载诊断进阶篇汽车中央控制单元HPC软件架构关于网关转发性能引起的思考
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：周末洗了一个澡，换了一身衣服，出了门却不知道去哪儿，不知道去找谁，漫无目的走着，大概这就是成年人最深的孤独吧!旧人不知我近况，新人不知我过往，近况不该旧人知，过往不与新人讲。纵你阅人何其多，再无一人恰似我。时间不知不觉中，来到新的一年。2025开始新的忙碌。成年人的我也不知道去哪里渡
第八章竟然是他橥橥
十天之后，京城已在眼前。沐子莹总算松了口，天子脚下，相对安全。马车在城门外停下，杨嬷嬷掀了帘子往外望去，哀叹了一声。沐子莹拍拍身上的灰尘安慰她说：“嬷嬷，别怕，马上就要到府了，咱们可得把那车夫的事跟主母讲一讲，让主她这个当家的给我们作主才是。”嬷嬷却连连摆手，“不可啊小姐，咱们能平安回府就是幸事，车夫的事……就说他摔死在半路，其它的，莫要再提了吧。”“若真是车夫生事那算是万幸了，只怕容不得我们的，
周日随笔梅子Mey
今天心情有点烦燥，但是在看到每天读点故事弹出信息之后，心情瞬间阳光起来。坚持的路上，就是这样，没有容易。你随时可以说暂停，或者放弃。但是，就意味着你看不到未来的果实。但是，坚持的话，真的很难。这次，我想坚持下来。我希望我能在一件事上坚持半年到一年。这次是写作，我希望我能持续地输入和输出。因为这是我的热爱，因为这是我想做一辈子的事，因为，这同样也是有市场的领域。只是，我不够坚持，就看不到成果。我的文
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
不能随便扔垃圾小猪宝贝0905
阴雨天的周五，看你生病在家窝了快一周，嚷嚷着要去游乐场，那就决定带你去四海书城；为了不让你被雨淋湿，妈妈准备推个自行车，刚把你放到自行车后座上，你一个喷嚏鼻涕出来了，随手拿出纸巾擦擦鼻涕，妈妈因为嫌把你从座位上抱下来扔纸巾到前面的垃圾桶麻烦，就将纸巾扔进了旁边的树丛里；你却批评了妈妈，“不可以把纸巾扔到地上，应该扔进垃圾桶”；妈妈顿时感觉很羞愧，将你抱下来，重新捡起纸巾，扔进了垃圾桶。
漫游漫川关高曾骏骏
傍晚时分，夕阳从树的缝隙穿过来撒在我们老老小小一家人身上暖暖的，一抬头映入眼帘的是“朝秦暮楚”四个字挂在山壁上，我知道漫川关到了。90岁的老爸在前面慢悠悠的走着，用浓郁的河南话问正在赶路的几个老人家，：“你们是哪里人呀？”其中一个扛着锄头的老人家声如洪钟的答到：“我们是祖祖辈辈生活在这里的漫川关人。你是河南人吧？”看着老爸点点头老人家继续说，“这里可是一鸡鸣三省的地方，河南，陕西，湖北交界处”。老
EasyPlayer播放器系列开发计划2025 xiejiashu EasyPlayer EasyPlayer EasyPlayer播放器 RTSP播放器 js播放器 Web播放器
EasyPlayer系列产品发展至今，已经超过10年，从最早的EasyPlayerRTSP播放器，到如今维护的3条线：EasyPlayer-RTSP播放器：Windows、Android、iOS；EasyPlayerPro播放器：Windows、Android、iOS；EasyPlayer.js播放器：H5；这3个播放器各有各的应用场景，用户量也是巨大，像RTSP版本的播放器，到今天依然还有很多低
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
读张萌萌姐《从受欢迎到被需要》第一章读书总结韩静_Han
我是@张萌-萌姐#从受欢迎到被需要#读书会10班的书记官韩静我们的领读者是@郝美-菱这是今天的读书总结通过第一章的阅读，对高情商和自我介绍有了新的认知。思考题复盘：“我是谁，我需要什么，我能提供什么”【我是谁】我叫韩静，在房地产行业工作5年，现担任行政经理一职，是一位个子小却很坚强很拼的女生。【我能提供什么】️用自己减重26斤的经验帮助需要的人健康减肥️能提供房地产购房等方面的知识和问题️早起陪伴
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
【项目实战】容错机制与故障恢复：保障系统连续性的核心体系本本本添哥 004 -研效与DevOps运维工具链 002 -进阶开发能力分布式
在分布式系统中，硬件故障、网络波动、软件异常等问题难以避免。容错机制与故障恢复的核心目标是：通过主动检测故障、自动隔离风险、快速转移负载、重建数据一致性，最大限度减少故障对业务的影响，保障系统“持续可用”与“数据不丢失”。以下从核心机制、实现方式、典型案例等维度展开说明。一、故障检测：及时发现异常节点故障检测是容错的第一步，需通过多维度手段实时感知系统组件状态，确保故障被快速识别。1.健康检查与心
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
JVM 内存分配与回收策略：从对象创建到内存释放的全流程
在JVM的运行机制中，内存分配与回收策略是连接对象生命周期与垃圾收集器的桥梁。它决定了对象在堆内存中的创建位置、存活过程中的区域迁移，以及最终被回收的时机。合理的内存分配策略能减少GC频率、降低停顿时间，是优化Java应用性能的核心环节。本文将系统解析JVM的内存分配规则、对象晋升机制，以及实战中的内存优化技巧。一、对象优先在Eden区分配：新生代的“临时缓冲区”大多数情况下，Java对象在新生代
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

Python3 正则表达式：文本处理的魔法工具