多字节字符串 函数
在线手册:中文  英文

mb_strcut

(PHP 4 >= 4.0.6, PHP 5)

mb_strcut获取字符的一部分

说明

string mb_strcut ( string $str , int $start [, int $length [, string $encoding ]] )

mb_strcut()mb_substr() 类似,都是从一个字符串中提取子字符串,但是按字节数来执行,而不是字符个数。 如果截断位置位于多字节字符两个字节的中间,将于该字符的第一个字节开始执行。 这也是和 substr() 函数的不同之处,后者简单地将字符串在字节之间截断,这将导致一个畸形的字节序列。

参数

str

要截断的 string

start

起始位置,以字节为单位。

length

字节长度。

encoding

encoding 参数为字符编码。如果省略,则使用内部字符编码。

返回值

mb_strcut() 根据 startlength 参数返回 str 的一部分。

参见


多字节字符串 函数
在线手册:中文  英文

用户评论:

php_engineer_bk at yahoo dot com (2010-10-08 03:52:18)

function cut_sense($matne_harf, $l_harf ,$return=1 ) {
if ( strlen($matne_harf) > $l_harf){
$end='...';
}else{
$end='';
}
if ( function_exists('mb_strcut') ){
$matne_harf = mb_strcut ( $matne_harf, 0 , $l_harf , "UTF-8" );
}else{
$matne_harf =substr($matne_harf, 0, $l_harf);
}
$text=''.$matne_harf.''.$end.'';
if ( $return == 1){
return $text;
}else{
print $text;
}
}
Iranian php programmer (farhad zand +989383015266)

egoalesum at IHATEBOTS dot youarchive dot it (2009-05-21 09:07:21)

I found this function to be extremely useful.

Here is a practical example, showing the difference between substr(), mb_substr() and mb_strcut():

<?php
mb_internal_encoding
('UTF-8');
$string 'cioèòà';
var_dump(
substr($string06),
mb_substr($string06),
mb_strcut($string06)
);
?>

Output:
string(6) "cioè?"
string(9) "cioèòà"
string(5) "cioè"

Explanation:
$string is long 9 bytes
c - 1 byte
i - 1 byte
o - 1 byte
è - 2 bytes
ò - 2 bytes
à - 2 bytes

substr() works with bytes, so it returns a string which is exactly 6 bytes long. Thus, it truncates the ò character.
mb_substr(), instead, works with characters, so it returns a string which is exactly 6 characters long (but in this case is 9 bytes long).
mb_strcut() works exactly as substr(), but, if the last byte appears to be truncated, it simply omits the character.

When you use
$string = mb_strcut($string, 6);
you can know for sure that strlen($string) <= 6. But no unicode characters will be truncated.

I hope my comment could finally be a simple explanation.

t dot starling at physics dot unimelb dot edu dot au (2004-08-27 04:01:54)

What the manual and the first commenter are trying to say is that mb_strcut uses byte offsets, as opposed to mb_substr which uses character offsets.
Both mb_strcut and mb_substr appear to treat negative and out-of-range offsets and lengths in the basically the same way as substr. An exception is that if start is too large, an empty string will be returned rather than FALSE. Testing indicates that mb_strcut first works out start and end byte offsets, then moves each offset left to the nearest character boundary.

oyag02 at yahoo dot co dot jp (2003-09-26 03:53:59)

diffrence between mb_substr and mb_substr
example:
mb_strcut('I_ROHA', 1, 2) returns 'I_'. Treated as byte stream.
mb_substr('I_ROHA', 1, 2) returns 'ROHA' Treated as character stream.
# 'I_' 'RO' 'HA' means multi-byte character

易百教程