再读thinking in java -- 第十三章 字符串

String对象是不可变的。每个看起来修改String值的方法实际上都创建了一个全新的String对象。

String对象具有只读性,所以指向它的任何引用都不可能改变它的值。若要在toString方法中使用循环,最好自己创建一个StringBuilder对象,用它来构造最终结果。用String的话会不停创建StringBuilder,所以效率低下。

若想打印对象地址,可在toString方法中添加super.toString(),指的是Object中的toString方法

当需要改变字符串的内容时,String类对象都会返回一个新的String对象。若没有发生变化,则返回指向原对象的引用。

格式化输出的%d和%f等占位符称为格式修饰符。System.out中的printf与format()是等价的。

所有新的格式化功能都有java.util.Formatter类处理。Formatter可看做一个翻译器,将格式化字符串和数据翻译成需要的结果。创建一个Formatter对象需要向其构造器传递信息,告诉他最终结果输出方向。

String.format()是一个static方法,返回String对象。

java中,\\表示插入一个正则表达式的反斜线,其后的字符具有特殊的意义。一个数字的正则表达式:\\d;\\\\普通的反斜线

?表示可能; -?表示可能有负号,但无正号。

若字符有特殊的意义,在正则表达式中需要用\\进行转义,使之成为普通字符。\W表示非单词字符。\w表示单词字符。“+”表示一个或多个

String中自带有用的正则表达式工具有split(),与替换replaceFirst方法等

* 0个或多个
[abc] 包含a、b、c的任何字符(和a|b|c作用相同)
[^abc] 除了abc外的任何字符
[a-zA-Z] 从a到z或A到Z的任何字符
[abc[hij]] 任意abchij字符,相当于或
[a-z&&[hij]] 任意hij
\s 空白符
\S 非空白符
\d 数字0-9
\D 非数字
\w 词字符[a-zA-Z0-9]
\W 非词字符[^\w]
   

边界匹配符

^ 一行的开始
$ 一行的结束
\b 词的边界
\B 非词的边界
\G 前一个匹配结果

量词描述了一个模式吸收文本的方式:

1、贪婪型:为模式发现尽可能多的匹配

2、勉强型:用文豪来制定,满足模式所需的最少字符数,也成为懒惰型

3、占有型

贪婪型 m勉强型 z占有型 p匹配方式
X? X?? X?+ 一个或零个X
X* X*? X*+ 0或多个X
X+ X+? X++ y一个或多个X
X{n} X{n}? X{n}+ 恰好n次X
X{n,} X{n,}? X{n,}+ 至少n次X
X{n,m} X{n,m}? X{n,m}+ X至少n次,最多m次

检索用正则表达式的步骤:

导入java.util.regex包;用static Pattern.compile(正则表达式)编译;它会根据String类的正则表达式生成一个Pattern对象。把想检索的字符串传入Pattern对象的matcher(匹配对象)。该方法生成一个Matcher对象

组是用括号划分的正则表达式。组号为0表示整个表达式。组号为1表示第一对括号的组

正则表达式并未看完

你可能感兴趣的:(java基础知识)