本文实例讲述了php字符串截取函数mb_substr用法。分享给大家供大家参考,具体如下:
string mb_substr ( string $str , int $start [, int $length = NULL [, string $encoding = mb_internal_encoding() ]] )-截取字符串
(PHP 4 >= 4.0.6, PHP 5)
$str 要获取字符串的目标字符串(字符串起始位置为0)
$start,$str中要使用的第一个字符的位置
$length,获取的子字符串的长度(注意不是结束位置)
$encoding,可指定字符编码(一般用于处理中文字符时使用,同时这个问题碰到的非常多)
示例:
1
2
3
4
5
6
7
8
9
|
<?php mb_internal_encoding ( "UTF-8" ); //如果把UTF-8改为编码,下面针对于中文字符串处理的值会改变。 echo mb_internal_encoding(). "" ; //获取字符编码为ISO-8859-1 echo mb_substr( 'abcdefghijk' ,0,9). "" ; //abcdefghi echo mb_substr( 'abcdefghijk' ,1,5). "" ; //bcdef echo mb_substr( '我们都是中国人' ,0,9). "" ; //我们都是中国人 echo mb_substr( '我们都是中国人' ,0,9, 'gb2312' ). "" ; //我们都是中 echo mb_substr( '我们都是中国人' ,0,9, 'utf-8' ); //我们都是中国人 ?> |
总结:
1、在处理英文字符串的时候,该函数的第四个参数($encoding)可以忽略。
2、在处理中文字符串的时候,就要小心了,一定要考虑编码问题,编码不同,中文的值也不同。
3、在中文字符串导入数据库时,就显得更为重要了。
4、处理字符串或文本的编码能力,是衡量程序员功力的一项标准。
补充:substr和mb_substr的区别
异同点:
两个函数都是截取字符串的长度,不同的是mb_substr
可以针对多字节编码的汉字进行截取,从而防止乱码的出现
实例说明:
示例1:
1
2
3
4
5
6
|
<?php $chuan = "我是中国人!" ; echo substr ( $chuan ,0,3); echo '<br />' ; echo mb_substr( $chuan ,0,3, 'utf8' ); ?> |
运行结果:
我
我是中
在utf8编码下,由于一个汉字占3个字节,所以第一个输出的是: 我
第二个输出的是: 我是中
示例2:
1
2
3
4
5
6
|
<?php $chuan = "我是中国人!" ; echo substr ( $chuan ,0,-4); echo '<br />' ; echo mb_substr( $chuan ,0,-2, 'utf8' ); ?> |
运行结果:
我是中国
我是中国
两个输出的都是: 我是中国
第一个长度为负4,就会省略掉!和人,从零开始,就会包括我是中国
第二个同理
希望本文所述对大家PHP程序设计有所帮助。
原文链接:https://www.cnblogs.com/jinsanguo/p/7627359.html