PHP强化之01 - 字符串 String

----- 最后更新【2019-1-7】-----

一、语法

1、字符串的4种声明方式:

在php语法当中,一个字符串可以用 4 种方式表达,它们分别是:单引号双引号heredoc语法结构nowdoc语法结构

1)单引号
要表达一个单引号自身,需在它的前面加个反斜线\来转义,即\'。要表达一个反斜线自身,则用两个反斜线\\。其它任何方式的反斜线都会被当成反斜线本身,即在单引号字符串中的变量和特殊字符的转义序列将不会被替换(例如\r或者\n也是不会被转义,也是原样输出)。

2)双引号
如果字符串是包围在双引号" "中, PHP 将对一些特殊的字符进行解析。
当 PHP 解析器遇到一个美元符号$时,它会和其它很多解析器一样,去组合尽量多的标识以形成一个合法的变量名。可以用花括号{}来明确变量名的界线。

3)heredoc 语法结构
第三种表达字符串的方法是用 heredoc 语法结构:<<<。在该运算符之后要提供一个标识符,然后换行。接下来是字符串string本身,最后要用前面定义的标识符作为结束标志。

$str = <<

Warning: 要注意的是结束标识符这行除了可能有一个分号;外,绝对不能包含其它字符。这意味着标识符不能缩进,分号的前后也不能有任何空白或制表符。

4)nowdoc 语法结构
就象 heredoc 结构类似于双引号字符串,Nowdoc 结构是类似于单引号字符串的。Nowdoc 结构很象 heredoc 结构,但是 nowdoc 中不进行解析操作。这种结构很适合用于嵌入 PHP 代码或其它大段文本而无需对其中的特殊字符进行转义。
一个 nowdoc 结构也用和 heredocs 结构一样的标记<<<, 但是跟在后面的标识符要用单引号括起来,即<<<'EOT'。Heredoc 结构的所有规则也同样适用于 nowdoc结构,尤其是结束标识符的规则。

$str = <<<'EOD'
Example of string
spanning multiple lines
using nowdoc syntax.
EOD;

注意:
--单引号比双引号效率更高。
--当双引号里面包含单引号,然后单引号里面包含变量,这种情况变量也是会正常解析的,同时单引号会原样输出。

2、存取和修改字符串中的字符:

string 中的字符可以通过一个从 0 开始的下标,用类似 array 结构中的方括号包含对应的数字来访问和修改,比如$str[42]。也可用花括号访问,比如 $str{42}。可以把 string 当成字符组成的 array。函数 substr()substr_replace()可用于操作多于一个字符的情况。

3、转换成字符串

1)自动转换
在一个需要字符串的表达式中,会自动转换为 string。比如在使用函数 echo 或 print 时,或在一个变量和一个 string 进行比较时,就会发生这种转换。

2)强制转换
在PHP中,数据类型的转换属于强制转换,且共有三种转换方式:
一个值可以通过在其前面加上(string)或用strval()函数来转变成字符串。
在一个需要字符串的表达式中,会自动转换为 string。也可参考函数settype(),如settype($var, "string");

二、常用函数

1、子字符串操作

1)substr—返回字符串的子串

string substr( string $string, int $start [, int $length ] )

返回字符串 string 由 start 和 length 参数指定的子字符串。

substr("abcdef", -3, 1); // 返回 "d"
substr('abcdef', 1, 3);  // bcd

2)substr_replace—替换字符串的子串

mixed substr_replace ( mixed $string , mixed $replacement , mixed $start [, mixed $length ] )

substr_replace()在字符串 string 的副本中将由 start 和可选的 length 参数限定的子字符串使用 replacement 进行替换。返回结果字符串。如果 string 是个数组,那么也将返回一个数组。
Tip: 在用于长文本隐藏时非常有用(如用...来替换后面的字符串)。

3)str_replace—子字符串替换

mixed str_replace ( mixed $search , mixed $replace , mixed $subject [, int &$count ] )

该函数返回一个字符串或者数组。该字符串或数组是将 subject 中全部的 search 都被 replace 替换之后的结果。
如果没有一些特殊的替换需求(比如正则表达式),你应该使用该函数替换 ereg_replace()preg_replace()
类似的方法有:
preg_replace - 执行一个正则表达式的搜索和替换

4)strpos—查找字符串首次出现的位置

int strpos ( string $haystack , mixed $needle [, int $offset = 0 ] )

返回 needle 在 haystack 中首次出现的数字位置。

$newstring = 'abcdef abcdef';
$pos = strpos($newstring, 'a'); //$pos =  0
$pos = strpos($newstring, 'a', 1); // $pos = 7, 不是 0

与该方法类似的还有:
stripos - 查找字符串首次出现的位置(不区分大小写)
strrpos - 计算指定字符串在目标字符串中最后一次出现的位置
strripos - 计算指定字符串在目标字符串中最后一次出现的位置(不区分大小写)

5)strstr—查找字符串的首次出现;别名也叫strchr

string strstr ( string $haystack , mixed $needle [, bool $before_needle = FALSE ] )

返回 haystack 字符串从 needle 第一次出现的位置开始到 haystack 结尾的字符串
Note:该函数区分大小写。如果想要不区分大小写,请使用stristr()
Note:如果你仅仅想确定needle是否存在于haystack中,请使用速度更快、耗费内存更少的strpos()函数。

$email  = '[email protected]';
echo strstr($email, '@'); // 打印 @example.com
echo strstr($email, '@', true); // 打印 name,从 PHP 5.3.0 起

与该方法类似的还有:
stristr - strstr函数的忽略大小写版本
strrchr - 查找指定字符在字符串中的最后一次出现

2、字符串修改

1)strrev—反转字符串

echo strrev("Hello world!"); // 输出 "!dlrow olleH"

2)trim—去除字符串首尾处的空白字符(或者其他字符)
相关方法:
ltrim - 删除字符串开头的空白字符(或其他字符)
rtrim - 删除字符串末端的空白字符(或者其他字符)。chop—rtrim 的别名

3)从字符串中去除 HTML 和 PHP 标记

string strip_tags ( string $str [, string $allowable_tags ] )

该函数尝试返回给定的字符串 str 去除空字符、HTML 和 PHP 标记后的结果。它使用与函数 fgetss() 一样的机制去除标记。

$text = '

Test paragraph.

Other text'; echo strip_tags($text); echo "\n"; // 允许

echo strip_tags($text, '

');

以上例程会输出:

Test paragraph. Other text

Test paragraph.

Other text

4)字符串中大小写的转换
strtoupper - 将字符串转化为大写
strtolower - 将字符串转化为小写
ucfirst - 将字符串的首字母转换为大写
ucwords - 将字符串中每个单词的首字母转换为大写

3、字符串转换为数组

1)str_split—将字符串转换为数组
array str_split ( string $string [, int $split_length = 1 ] )
将一个字符串转换为数组。

$str = "Hello Friend";
$arr = str_split($str, 3);
print_r($arr);

以上例程会输出:

Array
(
    [0] => Hel
    [1] => lo
    [2] => Fri
    [3] => end
)

2)preg_split - 通过一个正则表达式分隔字符串。

array preg_split ( string $pattern , string $subject [, int $limit = -1 [, int $flags = 0 ]] )

通过一个正则表达式分隔给定字符串.

//使用逗号或空格(包含" ", \r, \t, \n, \f)分隔短语
$keywords = preg_split("/[\s,]+/", "hypertext language, programming");
print_r($keywords);

以上例程会输出:

Array
(
    [0] => hypertext
    [1] => language
    [2] => programming
)

3)explode—使用一个字符串分割另一个字符串,返回一个数组。

array explode ( string $delimiter , string $string [, int $limit ] )

此函数返回由字符串组成的数组,每个元素都是 string 的一个子串,它们被字符串 delimiter 作为边界点分割出来。

$str = 'one|two|three|four';
print_r(explode('|', $str));
// 正数的 limit
print_r(explode('|', $str, 2));
// 负数的 limit(自 PHP 5.1 起)
print_r(explode('|', $str, -1));

以上例程会输出

Array
(
    [0] => one
    [1] => two
    [2] => three
    [3] => four
)
Array
(
    [0] => one
    [1] => two|three|four
)
Array
(
    [0] => one
    [1] => two
    [2] => three
)

相关方法:
implode - 将一个一维数组的值转化为字符串
split - 用正则表达式将字符串分割到数组中

4、固定字符串的宽度

1)生成固定宽度字符串

方法一: 使用pack()函数

$str = pack("A35A14A4", "The line of Unix", "Nosee Chan", 2018);
var_dump($str);

在命令行中执行可以看到如下效果:

格式字符串A35A14A4告诉pack()将后面的参数分别转换为一个包含35个字符用空格填充的字符串、 一个14字符用空格填充的字符串、以及一个4个字符用空格填充的字符串。要在固定宽度记录中生成空格填充字段,pack()为此提供了一个简洁的解决方案。

方法二: 使用substr()str_pad()结合。
如果非空格的其它字符来填充字段,则可以考虑用该方法。

string str_pad ( string $input , int $pad_length [, string $pad_string = " " [, int $pad_type = STR_PAD_RIGHT ]] )

使用另一个字符串填充字符串为指定长度

$data = "The line of Unix";
$str = str_pad(substr($data, 0, 25), 25, '_');
var_dump($str);

2)使文本在指定行长度自动换行。

string wordwrap ( string $str [, int $width = 75 [, string $break = "\n" [, bool $cut = FALSE ]]] )

打断字符串为指定数量的字串
参数说明:str--输入字符串。 width--列宽度。 break--使用可选的break参数打断字符串。 cut--如果cut设置为TRUE,字符串总是在指定的width或者之前位置被打断。因此,如果有的单词宽度超过了给定的宽度,它将被分隔开来。(参见第二个范例)。当它是FALSE,函数不会分割单词,哪怕width小于单词宽度。

$text = "A very long woooooooooooord.";
$newtext = wordwrap($text, 8, "\n", true);
echo "$newtext\n";

以上例程会输出:

A very
long
wooooooo
ooooord.
$text = "A very long woooooooooooooooooord. and something";
$newtext = wordwrap($text, 8, "\n", false);
echo "$newtext\n";

以上例程会输出:

A very
long
woooooooooooooooooord.
and
something

5、获取字符串信息

1)获取字符串长度

int strlen ( string $string )

返回给定的字符串 string 的长度。

mixed mb_strlen ( string $str [, string $encoding = mb_internal_encoding() ] )

获取字符串的长度。返回具有 encoding 编码的字符串 str 包含的字符数。 多字节的字符被计为 1。如果给定的 encoding 无效则返回 FALSE

$str = '玩去吧a';
echo strlen($str); //输出10
echo mb_strlen($str); //输出10
echo mb_strlen($str,'UTF-8'); //输出4

注意:
在PHP中,字符串的长度信息是直接存储在zval结构体中的,所以函数strlen()的速度非常快,时间复杂度为O(1)。

2)strval — 获取变量的字符串值

string strval ( mixed $var )

var 可以是任何标量类型(integer/float/string/boolean)。不能将 strval() 用于数组或对象。

3)is_string — 检测变量是否是字符串

bool is_string ( mixed $var )

如果 var 是 string 则返回 TRUE,否则返回 FALSE

6、其它常用函数

htmlentities - 将字符转换为 HTML 转义字符
md5_file - 计算指定文件的 MD5 散列值
md5 - 计算字符串的 MD5 散列值
sha1 - 计算字符串的 sha1 散列值
str_repeat - 重复一个字符串
strip_tags - 从字符串中去除 HTML 和 PHP 标记

三、经典实例

1、求出字符串"45,8,7,22,34,1,12"所有数字的总合。

扩展:如果字符串中的数字并不是规范地间隔开来的呢,这时要怎么处理。如,字符串"aa56 hello,--12--5,10"。

$str = 'aa56 hello,--12--5,10';
preg_match_all('/([0-9]+)/',$str,$reg);   //取出字符串中的所有数字
$sum = array_sum($reg[1]);    //将数组中的所有值相加
var_dump($sum);

// 运行结果如下:
nosee123@Chan:~$ php demo9.php
int(83)

注意:如果要兼容数字有小数点的情况,则正则表达式改为/([0-9]+\.?[0-9]*)/

2、统计字符串"aaa,abcd,xxxdd;dcba"中每个字符出现的次数。

$str ='aaa,abcd,xxxdd;dcba';
$arr = str_split($str);  //字符串分割成数组
$res = array_count_values($arr);   //统计数组中所有值出现的次数
var_dump($res);

// 结果如下:
array (size=7)
  'a' => int 5
  ',' => int 2
  'b' => int 2
  'c' => int 2
  'd' => int 4
  'x' => int 3
  ';' => int 1

其它方法参考:

$res = array();      
$arr = str_split($str);    
foreach ($arr as $key => $val) { 
    if (!isset($res[$val])) {     
        $res[$val] = 1;      
    } else {
        $res[$val] += 1;    
    }
}

//或者:
$res = array();     
$arr = str_split($str);   
$unique = array_unique($arr); 
foreach ($unique as $key => $val) {
  $res[$val] = substr_count($str, $val);  // 统计某字符在字符串中出现的次数
}

3、不使用PHP函数,用方法写一个反转字符串的函数
这里很明显是不能使用PHP的内置函数strrev(),下面我们来模拟一个strrev方法:

$str = 'abcdefg';
function str_rev($str){
        $res = '';
        $len = strlen($str);
        for($i=$len; $i>0;$i--){
                $res .= $str[$i-1];
        }
        return $res;
}
echo str_rev($str);  //输出为:gfedcba

4、将字符串"open_door"转换成"OpenDoor"、"make_by_id"转换成 "MakeById"。

str_replace(' ','',ucwords(str_replace('_',' ',$str)));

参考:

1、官方文档:

  • http://php.net/manual/zh/book.strings.php
  • http://php.net/manual/zh/language.types.string.php

2、相关书籍:

  • 《PHP经典实例》 David Sklar & Adam Trachtenberg

你可能感兴趣的:(PHP强化之01 - 字符串 String)