Python智慧行囊

正则表达式：从入门到实战的全面指南

一、引言

二、正则表达式基础

2.1 正则表达式的定义

2.2 普通字符

2.3 元字符

2.3.1 点号（.）

2.3.2 脱字符（^）

2.3.3 美元符号（$）

2.3.4 星号（*）

2.3.5 加号（+）

2.3.6 问号（?）

2.3.7 方括号（[]）

2.3.8 大括号（{}）

2.3.9 竖线（|）

2.3.10 反斜杠（\）

三、正则表达式匹配模式

3.1 贪婪匹配与非贪婪匹配

3.2 忽略大小写匹配

3.3 多行匹配模式

四、正则表达式在不同场景中的应用实例

4.1 数据验证

4.1.1 验证手机号码

4.1.2 验证电子邮箱地址

4.2 文本搜索与替换

4.2.1 在文本中搜索特定模式的内容

4.2.2 替换文本中的特定内容

4.3 信息提取

五、正则表达式学习资源推荐

5.1 在线测试工具

5.2 书籍

5.3 官方文档

六、注意事项

6.1 正则表达式的复杂性

6.2 测试与调试

6.3 性能问题

七、总结

一、引言

在计算机科学与软件开发领域，正则表达式（Regular Expression，简称 regex 或 RE）是一种强大的文本处理工具。它通过特定的语法规则来描述、匹配和操作字符串模式，广泛应用于文本搜索、数据验证、信息提取、文本替换等场景。无论是在编程语言（如 Python、Java、JavaScript 等）中，还是在文本编辑器（如 Sublime Text、Notepad++ 等）和命令行工具（如 grep、sed 等）里，正则表达式都发挥着至关重要的作用。掌握正则表达式，能够显著提高我们处理文本数据的效率，是每个开发者不可或缺的技能之一。本文将带领读者从零开始，深入理解正则表达式的基本概念、语法规则，并通过丰富的实例掌握其实际应用技巧。

二、正则表达式基础

2.1 正则表达式的定义

正则表达式是由普通字符（例如字母、数字、标点符号等）和特殊字符（也称为元字符，Meta Characters）组成的字符串模式，用于描述一类字符串的共同特征。它就像是一种特殊的 “语言”，通过特定的组合方式来表达对字符串的匹配规则。

2.2 普通字符

普通字符是正则表达式中最基本的组成部分，直接匹配与自身相同的字符。例如，正则表达式 "abc" 就可以匹配字符串 "abc" 中的这三个连续字符。需要注意的是，普通字符在匹配时区分大小写，即 "A" 和 "a" 被视为不同的字符。

2.3 元字符

元字符是正则表达式中具有特殊含义的字符，它们赋予了正则表达式强大的模式匹配能力。以下是一些常见的元字符及其含义：

2.3.1 点号（.）

点号匹配除换行符（\n）之外的任意单个字符。例如，正则表达式 "a.c" 可以匹配 "abc"、"aec"、"a1c" 等字符串，但不能匹配 "a\nc"。

2.3.2 脱字符（^）

脱字符用于匹配字符串的开始位置。例如，正则表达式 "^abc" 表示匹配以 "abc" 开头的字符串，如 "abcdef"、"abc123" 等，但 "xabc" 则不会被匹配。

2.3.3 美元符号（$）

美元符号用于匹配字符串的结束位置。例如，正则表达式 "abc

"表示匹配以"abc"结尾的字符串，如"xabc"、"123abc"等，但"abcx"则不会被匹配。当同时使用和时，正则表达式将精确匹配整个字符串。例如，"^abc$" 只匹配字符串 "abc" 本身，其他任何包含 "abc" 的更长字符串都不会被匹配。

2.3.4 星号（*）

星号表示匹配其前面的字符或子表达式零次或多次。例如，正则表达式 "ab*c" 可以匹配 "ac"（此时 b 出现 0 次）、"abc"（b 出现 1 次）、"abbc"（b 出现 2 次）等。

2.3.5 加号（+）

加号表示匹配其前面的字符或子表达式一次或多次，即至少出现一次。例如，正则表达式 "ab+c" 可以匹配 "abc"、"abbc" 等，但不能匹配 "ac"。

2.3.6 问号（?）

问号有两种含义：一是表示匹配其前面的字符或子表达式零次或一次，即可选出现；二是用于非贪婪匹配模式（后文会详细介绍）。例如，正则表达式 "ab?c" 可以匹配 "ac" 或 "abc"。

2.3.7 方括号（[]）

方括号用于定义一个字符集合，匹配该集合中的任意一个字符。例如，[abc] 表示匹配 a、b 或 c 中的任意一个字符；[a-z] 表示匹配小写字母 a 到 z 中的任意一个；[0-9] 表示匹配数字 0 到 9 中的任意一个。方括号内还可以使用脱字符（^）表示取反，即匹配不在集合中的任意一个字符。例如，[^abc] 表示匹配除 a、b、c 之外的任意一个字符。

2.3.8 大括号（{}）

大括号用于指定其前面的字符或子表达式的出现次数。大括号内可以有一个数字，表示精确出现的次数；也可以有两个数字，用逗号分隔，表示出现次数的范围（左闭右闭）。例如，"a {3}" 表示匹配 a 恰好出现 3 次；"a {2,5}" 表示匹配 a 出现 2 到 5 次；"a {2,}" 表示匹配 a 至少出现 2 次；"a {,5}" 表示匹配 a 最多出现 5 次。

2.3.9 竖线（|）

竖线用于表示逻辑 “或” 关系，即匹配其左右两边的任意一个子表达式。例如，"ab|cd" 可以匹配 "ab" 或 "cd"；"a (b|c) d" 可以匹配 "abd" 或 "acd"。

2.3.10 反斜杠（\）

反斜杠用于转义元字符，使其失去特殊含义，作为普通字符匹配。例如，如果要匹配点号（.）本身，就需要使用 "."；要匹配反斜杠（\）本身，则需要使用 "\\"（因为反斜杠在字符串中本身也是转义字符，所以在编程语言中可能需要双重转义）。此外，反斜杠还与一些字母组合形成预定义的字符类，例如：

\d：匹配任意一个数字，等价于 [0-9]。

\D：匹配任意一个非数字字符，等价于 [^0-9]。

\s：匹配任意一个空白字符（包括空格、制表符、换行符等），等价于 [\t\n\r\f\v]。

\S：匹配任意一个非空白字符，等价于 [^ \t\n\r\f\v]。

\w：匹配任意一个单词字符（包括字母、数字和下划线），等价于 [a-zA-Z0-9_]。

\W：匹配任意一个非单词字符，等价于 [^a-zA-Z0-9_]。

三、正则表达式匹配模式

3.1 贪婪匹配与非贪婪匹配

在正则表达式中，默认情况下，量词（如 *、+、?、{} 等）是贪婪的，即尽可能多地匹配字符。例如，对于字符串 "aabbaabb"，正则表达式 "a.b"会匹配整个字符串"aabbaabb"，因为它会尽可能多地匹配中间的字符。而如果希望量词进行非贪婪匹配，即尽可能少地匹配字符，可以在量词后面加上问号（?）。此时，正则表达式"a.?b"会匹配第一个"a"和第一个"b"之间的内容，即"aab"。

3.2 忽略大小写匹配

在很多情况下，我们希望匹配字符时不区分大小写。可以通过在正则表达式中添加标志位来实现这一功能。不同的编程语言和工具使用的标志位可能有所不同。例如，在 Python 中，可以使用 re.IGNORECASE 标志（或简写为 re.I）；在 JavaScript 中，可以在正则表达式末尾添加 "i" 标志。例如，正则表达式 "/abc/i" 可以匹配 "abc"、"ABC"、"AbC" 等。

3.3 多行匹配模式

默认情况下，正则表达式中的脱字符（^）和美元符号（$）只匹配整个字符串的开始和结束位置。但在多行文本中，我们可能希望它们匹配每一行的开始和结束位置。这时可以使用多行匹配模式。例如，在Python中，使用re.MULTILINE标志（或简写为re.M）；在JavaScript中，在正则表达式末尾添加"m"标志。

四、正则表达式在不同场景中的应用实例

4.1 数据验证

4.1.1 验证手机号码

在中国，手机号码通常以 1 开头，第二位为 3、4、5、7、8 等数字，后面跟着 9 位数字，总长度为 11 位。可以使用以下正则表达式进行验证：

import re

pattern = r'^1[3-9]\d{9}$'

phone_number = "13812345678"

if re.match(pattern, phone_number):

    print("手机号码格式正确")

else:

    print("手机号码格式错误")

该正则表达式的含义是：以 1 开头，第二位是 3 - 9 中的任意一个数字，后面跟着 9 位数字，总长度为 11 位。

4.1.2 验证电子邮箱地址

电子邮箱地址的格式通常为 “用户名 @域名”，其中用户名可以包含字母、数字、下划线、点号等字符，域名通常由字母、数字和点号组成，且至少包含一个点号。以下是一个简单的电子邮箱验证正则表达式示例：

import re

pattern = r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$'
email = "[email protected]"

if re.match(pattern, email):
    print("电子邮箱格式正确")
else:
    print("电子邮箱格式错误")

该正则表达式中，用户名部分使用 [a-zA-Z0-9._%+-]+ 匹配至少一个由字母、数字、下划线、点号、百分号、加号和减号组成的字符；域名部分使用 [a-zA-Z0-9.-]+.[a-zA-Z]{2,} 匹配，其中 [a-zA-Z0-9.-]+ 表示域名的主体部分（可以包含字母、数字、点号和减号），.[a-zA-Z]{2,} 表示至少有一个点号，且点号后面有至少两个字母（如 com、net、cn 等）。

4.2 文本搜索与替换

4.2.1 在文本中搜索特定模式的内容

假设我们有一段文本，需要找出其中所有的电话号码，可以使用正则表达式进行搜索。以下是在 Python 中实现的示例：

import re

text = "我的电话号码是 13812345678，朋友的号码是 15987654321"

pattern = r'1[3-9]\d{9}'

phone_numbers = re.findall(pattern, text)

print("找到的电话号码：", phone_numbers)

运行结果为：["13812345678", "15987654321"]。

4.2.2 替换文本中的特定内容

例如，我们想将文本中的所有邮箱地址替换为 “[已隐藏]”，可以使用正则表达式的替换功能。

import re
text = "联系邮箱：[email protected]，另一个邮箱：[email protected]"
pattern = r'[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}'
new_text = re.sub(pattern, "[已隐藏]", text)
print(new_text)

运行结果为：“联系邮箱：[已隐藏]，另一个邮箱：[已隐藏]”。其中，正则表达式末尾的 "g" 标志表示全局匹配，即替换所有符合条件的内容，而不是只替换第一个匹配项。

4.3 信息提取

在网页爬取或日志分析等场景中，经常需要从复杂的文本中提取特定的信息。例如，从一段 HTML 代码中提取所有的链接地址，可以使用正则表达式匹配标签中的 href 属性值。以下是一个简单的示例（需要注意的是，实际应用中 HTML 结构可能更为复杂，使用正则表达式提取 HTML 内容并非最佳实践，推荐使用专门的 HTML 解析库，但此处仅作演示）：

import re

html = '示例网站关于我们'

pattern = r'href="(.*?)"'

links = re.findall(pattern, html)

print("提取到的链接：", links)

运行结果为：["https://www.example.com","/about"]。该正则表达式使用 href="(.?)" 来匹配 href 属性的值，其中括号用于捕获分组，.? 表示非贪婪匹配，尽可能少地匹配双引号之间的内容，以确保正确提取每个链接。

五、正则表达式学习资源推荐

5.1 在线测试工具

RegExr：一个功能强大的在线正则表达式测试工具，支持实时匹配演示和详细的语法解释，适合初学者练习和调试正则表达式。

Regex101：提供正则表达式的匹配示例、语法说明和可视化解释，方便用户理解正则表达式的工作原理。

5.2 书籍

《精通正则表达式（第 3 版）》：经典的正则表达式学习书籍，详细介绍了正则表达式的语法、应用场景和优化技巧，适合希望深入掌握正则表达式的读者。

《正则表达式入门》：适合零基础读者的入门书籍，通过简单易懂的示例和讲解，帮助读者快速掌握正则表达式的基本概念和常用技巧。

5.3 官方文档

不同的编程语言和工具对正则表达式的支持可能存在一些差异，建议读者查阅所使用语言或工具的官方文档，以获取最准确和详细的信息。例如，Python 的正则表达式模块（re 模块）文档、JavaScript 的正则表达式语法文档等。

六、注意事项

6.1 正则表达式的复杂性

正则表达式虽然强大，但复杂的模式可能会难以理解和维护。在编写正则表达式时，应尽量遵循简洁明了的原则，避免过度使用嵌套和复杂的组合。如果正则表达式过于复杂，可以考虑将其拆分成多个部分，或者使用注释进行说明。

6.2 测试与调试

在使用正则表达式处理实际数据之前，一定要进行充分的测试，确保其能够正确匹配预期的内容，避免出现误匹配或漏匹配的情况。可以使用在线测试工具或编写简单的测试用例来验证正则表达式的正确性。

6.3 性能问题

在处理大规模文本数据时，低效的正则表达式可能会影响程序的性能。例如，贪婪匹配可能导致不必要的回溯，从而增加计算时间。在这种情况下，可以尝试使用非贪婪匹配、优化正则表达式的结构或选择更高效的算法来提高性能。

七、总结

正则表达式是一种功能强大且用途广泛的文本处理工具，掌握其基本语法和应用技巧对于开发者来说至关重要。本文从正则表达式的基础概念入手，介绍了普通字符、元字符、匹配模式等核心内容，并通过丰富的实例演示了其在数据验证、文本搜索与替换、信息提取等场景中的应用。

密码正则验证：大小写字母、数字、特殊字符至少8位 qq_21875331 渐进式的成长
正则表达式：密码必须包含大写字母、数字、特殊字符（四种里至少三种，且至少8位）写法一：/((^(?=.*[a-z])(?=.*[A-Z])(?=.*\W)[\da-zA-Z\W]{8,16}$)|(^(?=.*\d)(?=.*[A-Z])(?=.*\W)[\da-zA-Z\W]{8,16}$)|(^(?=.*\d)(?=.*[a-z])(?=.*\W)[\da-zA-Z\W]{8,16}$)|(^
JavaScript正则表达式去除括号但保留内容与去除括号与内容 Selicens javascript 正则表达式
项目上碰到一个需求，是取多个递增文件的文件名，类似于test(1).txt、test(2).txt，但是不需要括号，只要test1、test2这种格式，最开始想到的办法就是js里的replace替换，先上一个比较笨但是也能实现效果的例子letname="test(1).txt"letdata=name.split('.')[0].replace('(','').replace(')','')con
《剑指offer》-数据结构篇-哈希表/数组/矩阵/字符串小新学习屋数据结构与算法数据结构 leetcode 哈希表
题目第一个只出现一次的字符数组中的重复的数字字符串流中第一个不重复的字符数组中只出现一次的数字调整数组顺序使奇数位于偶数前面数组中出现次数超过一半的数字把数组排成最小的数顺时针打印矩阵把字符串转换为整数表示数值的字符串左旋转字符串(矩阵翻转)替换空格正则表达式匹配代码实现第一个只出现一次的字符题目描述：在一个字符串(0len(numbers)/2:returnreselse:return0把数组排
【通识】正则表达式
1.正则表达式基本概念：正规表示/常规表示（RegularExpress)1）使用单个字符串描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器中，正则表达式通常被用来检索、替换符合某个模式的文本2）元字符和描述元字符描述\将下一个字符标记为特殊字符、或一个原义字符、或一个向后引用、或一个八进制等112.正则表达式的应用1111511
正则表达式 hui函数 python 正则表达式
正则表达式Python中提供了多种解析网页数据的技术，正则表达式就是其中的一种，其他技术还包括：XPath、BeautifulSoup。什么是正则表达式正则表达式是一种文本模式，该模式描述了匹配字符串的规则，用于检索字符串中，是否有符合该模式的子串，或者对匹配到的子串进行替换。正则表达式的优点是功能强大，应用广泛，缺点是只适合匹配文本的字面意义，而不适合匹配文本意义。例如，正则表达式匹配嵌套了HT
linux命令grep的实际应用
grep是Linux/Unix系统中用于文本搜索的超级工具，其核心功能是使用正则表达式匹配文本行并输出结果。下面结合具体场景，展示其强大而实用的应用技巧：一、基础搜索与过滤快速定位文件内容：grep"error"/var/log/syslog#查找syslog中所有含"error"的行grep-i"timeout"application.log#-i忽略大小写，查找"timeout"统计匹配行数：
文件改名软件Rename Pro：文件 / 目录混合改批量改名提升效率
各位文件管理小能手们！今天给你们介绍一款超神的软件——RenamePro！它就像是文件改名界的超级英雄，功能强大到离谱！啥基础操作，像添加、替换、删除、加序编号啥的，那都不在话下。软件下载地址安装包还有正则表达式、文件名编辑器这些高级玩法，它也能轻松拿捏！它不仅能给文件改名，还能对文件目录和文件混合着改名。而且，Exif标签、GPS标签，甚至MSOffice文档引言写入这些功能，它也一应俱全。能批
正则表达式 Dylan_muc 字符串正则表达式 mysql 数据库
一、什么是正则表达式？正则表达式是一种用于描述、匹配、检索和替换符合某些规则的文本字符串的工具。它像是一种简洁的“模式语言”，可以快速定位和操作大量文本中的特定内容。简而言之，正则表达式就是用特定的语法来描述一类字符串的规则，然后用这个规则去匹配、查找、筛选实际的文本内容。二、正则表达式的基础语法1.元字符（Metacharacters）正则表达式由普通字符（如a、1、X）和特殊字符（元字符）组成
在 Go 语言中使用正则表达式提取所有匹配字符串的方法详解 gopher.guo golang golang 正则表达式数据库
在Go语言中使用正则表达式提取所有匹配字符串的方法详解正则表达式（RegEx）是一种强大的文本处理工具，而在Go语言中，官方regexp标准库提供了完整的正则功能。一个常见需求是：从字符串中提取出所有符合某种模式的内容，比如所有邮箱地址、所有数字、所有HTML标签等。本文将介绍如何在Go中使用正则表达式一次性提取所有匹配项，并提供详细示例。一、核心函数：FindAllString与FindAllS
正则表达式
正则表达式是一种用来匹配字符串的规则语言。它常用于：检查输入是否合法（如用户名、邮箱、密码）从字符串中提取内容替换字符串中的某些部分正则意义示例匹配a匹配字符aa匹配“a”.任意单个字符.匹配“a”、“1”、”@”等\d任意数字[0-9]\d匹配“3”\w字母、数字、下划线[A-Za-z0-9_]\w匹配“a”、“5”、”_”\s空白符（空格、换行等）""、\n正则意义示例匹配*出现0次或多次a*
python中的一些常见库，及其用法安逸逸逸逸 python 开发语言
1.Python库的概念和重要性Python库是预先编写好的模块或代码集合，旨在为开发者提供特定功能的复用性代码。它们通常由函数、类和方法组成，可以被导入到你的项目中使用。python库分为标准库和第三方库两种标准库（StandardLibrary）：Python自带的库，包含了各种内置模块，如操作系统接口、文件I/O、字符串处理、正则表达式等。这些库无需额外安装，可以直接在Python中使用。第
ECMAScript 2025 (ES16) 核心新特性（8项） Web - Anonymous ES6 ecmascript 前端 javascript
ECMAScript2025(ES16)于2025年6月正式发布，并引入了8项核心新特性，显著地提升了JavaScript的开发效率和表达能力。在此列举其关键特性解析及浏览器支持情况。目录一、异步与错误处理1、Promise.try()二、数据结构增强2、Set集合方法3、同步迭代器辅助方法三、模块与数据处理4、JSON模块导入5、延迟模块加载(deferimport)四、正则表达式增强6、Reg
C# 正则表达式 lly202406 开发语言
C#正则表达式引言正则表达式（RegularExpression）是一种用于处理字符串的强大工具，它可以快速地匹配、查找、替换字符串中的特定模式。在C#中，正则表达式被广泛应用于字符串处理、数据验证、网络编程等领域。本文将详细介绍C#正则表达式的基本概念、语法、应用场景以及一些常用技巧。正则表达式的基本概念正则表达式由字符集、量词、修饰符等组成。以下是一些基本概念：字符集：表示一组字符，可以是单个
python的正则表达式小鬼客
python提供了实现正则表达式的re模块。正则表达式的匹配字符：元字符描述\将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如，“\\n”匹配\n。“\n”匹配换行符。序列“\\”匹配“\”而“\(”则匹配“(”。即相当于多种编程语言中都有的“转义字符”的概念。^匹配输入字行首。如果设置了RegExp对象的Multiline属性，^也匹配“\n”或“\r”之后的位置。$匹配输入行尾。如
Python代码库之正则表达式提出字符串内容(含demo源码) iCloudEnd
importredefgetSearch(mstr,d):v=''m=re.search(mstr,d,re.I)ifm:v=m.group(1)returnvd="拼音：bìng"mstr=r"拼音：(.*?)<"pinyin=getSearch(mstr,d).strip()更多精彩代码请关注我的专栏reportlab教程和源码大全python源码大全Sqlite教程和SQL语句请关注我的专栏
reflections java_「reflections」java 非常好用的反射框架Reflections - seo实验室 weixin_39878855 reflections java
reflectionsreflections通过扫描classpath，索引元数据，并且允许在运行时查询这些元数据。使用Reflections可以很轻松的获取以下元数据信息：1)获取某个类型的所有子类；比如，有一个父类是TestInterface，可以获取到TestInterface的所有子类。2)获取某个注解的所有类型/字段变量，支持注解参数匹配。3)使用正则表达式获取所有匹配的资源文件4)获取
【原生JS】前端JS字符串最常用 20 道面试题总结（含详细代码解析）全栈前端老曹前端 javascript 开发语言面试 vue react.js ecmascript
原生JavaScript字符串最常用20道面试题总结（含详细代码解析）字符串是前端开发中最常见的数据类型之一，也是各大公司高频考察点。以下是老曹总结的原生JS字符串相关的20道高频面试题，涵盖字符串操作、正则表达式、性能优化、常见陷阱等多个方面，每道题都配有详细的代码示例和讲解。面试题目录序号题目考察点1slice,substring,substr的区别？截取方法2如何判断一个字符串是否包含另一个
Jmeter(10)：json提取器元件及jsonpath介绍奔跑在路上you Jmeter_接口测试 Jsonpath jmeter json
json提取器元件介绍：json提取器与正则表达式提取器功能类似，也是用来截取响应信息的部分保存到指定的变量中去，不同的是，它只能用来处理响应正文，并且响应正文必须是json格式的。它的优势是能更快更灵活的截取json格式文本中的内容。json提取器在jmeter5.2.1版本中部分字段没有汉化过来。路径：右击http请求——后置处理器——json提取器如下图所示：json提取器元件字段介绍：名称
正则表达式先知后行。正则表达式
正则表达式（RegularExpression，简称Regex）是一种用于匹配、查找、替换文本模式的强大工具，广泛应用于编程、文本编辑（如Vim、VSCode）和数据处理（如Python、JavaScript）。以下是核心知识点和常见用法：1.基本语法符号说明示例.匹配任意字符（除换行符\n）a.c→"abc","ac"\d匹配数字（等价于[0-9]）\d\d→"42"\w匹配单词字符（字母、数字
python基础TASK5 微_e569
1.类和对象类：一些具有相同特性的对象的抽象。对象：类的具像(一个实例)。2.正则表达式正则表达式描述了一种字符串匹配的模式，可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。3.re模块re模块使Python语言拥有全部的正则表达式功能。re.search扫描整个字符串并返回第一个成功的匹配。re.sub用于替换字符串中的匹配项。4.datetime模块
常用正则表达式嘻洋洋
[]中括号匹配这个[]集合中的任一一个字符,[a-z]匹配小写字母。相反意思：使用^，[^xyz]不匹配这个集合中的任何一个字符{}大括号用于匹配次数，结合中括号使用比较多。{n}精确匹配n次{n,}匹配n次以上{n,m}匹配n-m次中括号和大括号综合使用场景//用户名是小写字母，长度不超过20个字符[a-z]{1,15}//qq号码：最低5位数，最高14位数。全部是数字，不能是0开头[1-9][
ABAP中正则表达式语法,用法以及完整示例小赫不吃姜 abap 正则表达式 sap abap 开发语言
目录1.ABAP中的正则表达式语法基础语法元素1.1字符匹配1.2预定义字符类1.3位置锚点1.4量词（重复匹配）1.5分组与捕获1.6特殊构造零宽断言模式修饰符2.基本用法2.1创建正则表达式对象2.2创建匹配器2.3简写形式3.常用方法3.1检查是否匹配3.2查找所有匹配项3.3获取匹配组4.实用实例4.1验证电子邮件格式4.2提取日期4.3分割字符串4.4正则表达式解析主要结构详细解析整数部
Python 入门手札：从 0 到会--第九天Python的模块化编程--模块、包以及常见系统模块和第三方模块总结
目录一、模块1.模块化编程（ModularProgramming）2.什么是模块（Module）3.模块的分类3.1内置模块（标准库模块）3.1.1.与操作系统交互3.1.2.文件与数据处理3.1.3.正则表达式与文本处理3.1.4.数学与随机数3.1.5.时间与日期3.1.6.数据结构与算法3.1.7.网络与服务3.1.8.异常与调试3.2第三方模块3.2.1.科学计算与数据分析3.2.2.机器
掌握正则表达式：在Python中检测重复词的实战演练 Kimgoeunlaogong
本文还有配套的精品资源，点击获取简介：正则表达式是IT领域中用于文本处理的强大工具，本示例将介绍如何使用正则表达式检测字符串中的重复词，这在数据清洗、文本分析和日志处理等场景下非常有用。通过Python的re模块，我们将详细介绍检测重复词的步骤，包括字符串的处理、单词频率的统计以及重复词的筛选和输出。同时，解释如何使用不同的正则表达式元字符和修饰符来满足特定需求，例如不区分大小写或处理特殊字符。此
split() 函数在 Java、JavaScript 和 Python 区别 CATTLECODE python java
split()函数在Java、JavaScript和Python中均用于字符串分割，但在语法、参数设计和行为上存在显著差异。以下是三者的核心区别及使用示例：1.语法与参数设计语言语法参数说明JavaString.split(regex,limit)regex：必须为正则表达式（需转义特殊字符如.、`JavaScriptstr.split(separator,limit)separator：支持字符
linux正则提取字符串,正则表达式 – shell脚本如何使用正则表达式提取字符串... weixin_39747577 linux正则提取字符串
使用bashregularexpressions：re="http://([^/]+)/"if[[$name=~$re]];thenecho${BASH_REMATCH[1]};fi编辑–OP要求解释语法。Regularexpressionsyntax是一个很大的话题，我无法在这里全面解释，但我会尝试解释足够的理解这个例子。re="http://([^/]+)/"这是存储在bash变量中的正则表达
Java 正则表达式详解 BigData_Hubert java基础正则表达式 regex java
正则表达式乍一看上去是一堆繁琐的、无规律的、令人头大的字符串，但是其简单易学，适用于各种语言；当你了解他之后，你就会知道它的强大。很多程序设计语言都支持用正则表达式来进行字符串的操作。正则表达式简介初识正则表达式正则表达式是使用单个字符串来描述、匹配一系列规则的字符串。正则表达式并不仅限于某一种语言（几乎所有的语言都有字符串），在每种语言中有细微的差别。一个正则表达式字符串：^p[a-zA-Z_]
Java String 正则表达式设计模式包装类 Object类自动拆箱额么么么么 java 正则表达式设计模式
其它API（ApplicationProgramingInterface）应用程序接口（功能）,我们java讲解最常用的一些功能。API作用：API表示的是功能,学习API可以快速进行编程开发。API设计初衷,设计者将复杂的业务逻辑,封装成方法,供调用者更好的使用。对于开发者而言,不需要关注功能的具体逻辑实现,只需要知道如何使用即可。Java提供了很多的包,有一些包需要导入，有一些不需要导入:1.
19、Java正则表达式与字符集详解杠精协会主席 Java NIO：革新I/O处理的新范式 Java 正则表达式 Pattern
Java正则表达式与字符集详解1.Java正则表达式相关类在JavaJ2SE1.4版本中，引入了一些期待已久的正则表达式类，下面为你详细介绍：-CharSequence：这是一个新的接口，由多个类实现，用于以抽象的方式描述字符序列。-Pattern：该类将正则表达式封装在一个不可变的对象实例中。可以通过编译表达式字符串来创建实例，同时还有一些静态实用方法用于一次性匹配。importjava.uti
华为服务器管理工具（Intelligent Platform Management Interface）小小玫瑰大智慧华为服务器运维
一、核心功能与技术架构硬件级监控与控制全维度传感器管理：实时监测CPU、内存、硬盘、风扇、电源等硬件组件的温度、电压、转速等参数，支持超过200种传感器类型。例如，通过IPMI命令ipmitoolsdrelist可快速获取服务器传感器状态，并通过正则表达式提取关键指标。远程操作能力：支持远程开关机、重启、BIOS设置调整、固件升级等操作，即使服务器操作系统崩溃或网络中断，仍可通过独立BMC芯片实现
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &

正则表达式：从入门到实战的全面指南

一、引言​

二、正则表达式基础​

2.1 正则表达式的定义​

2.2 普通字符​

2.3 元字符​

2.3.1 点号（.）​

2.3.2 脱字符（^）​

2.3.3 美元符号（$）​

2.3.4 星号（*）​

2.3.5 加号（+）​

2.3.6 问号（?）​

2.3.7 方括号（[]）​

2.3.8 大括号（{}）​

2.3.9 竖线（|）​

2.3.10 反斜杠（\）​

三、正则表达式匹配模式​

3.1 贪婪匹配与非贪婪匹配​

3.2 忽略大小写匹配​

3.3 多行匹配模式​

四、正则表达式在不同场景中的应用实例​

4.1 数据验证​

4.1.1 验证手机号码​

4.1.2 验证电子邮箱地址​

4.2 文本搜索与替换​

4.2.1 在文本中搜索特定模式的内容​

4.2.2 替换文本中的特定内容​

4.3 信息提取​

五、正则表达式学习资源推荐​

5.1 在线测试工具​

5.2 书籍​

5.3 官方文档​

六、注意事项​

6.1 正则表达式的复杂性​

6.2 测试与调试​

6.3 性能问题​

七、总结​

你可能感兴趣的:(正则表达式)

一、引言

二、正则表达式基础

2.1 正则表达式的定义

2.2 普通字符

2.3 元字符

2.3.1 点号（.）

2.3.2 脱字符（^）

2.3.3 美元符号（$）

2.3.4 星号（*）

2.3.5 加号（+）

2.3.6 问号（?）

2.3.7 方括号（[]）

2.3.8 大括号（{}）

2.3.9 竖线（|）

2.3.10 反斜杠（\）

三、正则表达式匹配模式

3.1 贪婪匹配与非贪婪匹配

3.2 忽略大小写匹配

3.3 多行匹配模式

四、正则表达式在不同场景中的应用实例

4.1 数据验证

4.1.1 验证手机号码

4.1.2 验证电子邮箱地址

4.2 文本搜索与替换

4.2.1 在文本中搜索特定模式的内容

4.2.2 替换文本中的特定内容

4.3 信息提取

五、正则表达式学习资源推荐

5.1 在线测试工具

5.2 书籍

5.3 官方文档

六、注意事项

6.1 正则表达式的复杂性

6.2 测试与调试

6.3 性能问题

七、总结