当前位置: 主机百科 » 资源 » 技术 » 正文

php substr中文截取乱码解决办法

在php中使用substr函数进行中文字符串截取时,有可能会产生乱码,因为中文的两种常用编码格式中:UTF-8编码,每个汉字占3字节,而GB2312编码中,每个汉字占2字节,英文占1字节,这就导致很多时候substr()硬生生地将一个中文字符“锯”成两半,造成断开的字符会把其后的..拉过来一起做一个字,所以出现了php substr中文乱码。

解决方法一:使用mb_substr函数。

mb_substr (PHP 4 >= 4.0.6, PHP 5, PHP 7) — 获取部分字符串

1
  string mb_substr ( string $str , int $start [, int $length = NULL [, string $encoding = mb_internal_encoding() ]] )

根据字符数执行一个多字节安全的 substr() 操作。 位置是从 str 的开始位置进行计数。 第一个字符的位置是 0。第二个字符的位置是 1,以此类推。

解决方法二:编写自定义函数。

1
  function sub_str($str, $length = , $append = true)  {  &nbsp; $str = trim($str);  &nbsp; $strlength = strlen($str);  &nbsp; if ($length == || $length &gt;= $strlength)  &nbsp; {  &nbsp;&nbsp;&nbsp; return $str; //截取长度等于或大于等于本字符串的长度,返回字符串本身    }    elseif ($length < ) //如果截取长度为负数    {      $length = $strlength + $length;//那么截取长度就等于字符串长度减去截取长度      if ($length < )      {        $length = $strlength;//如果截取长度的绝对值大于字符串本身长度,则截取长度取字符串本身的长度      }    }    if (function_exists('mb_substr'))    {      $newstr = mb_substr($str, , $length, EC_CHARSET);    }    elseif (function_exists('iconv_substr'))    {      $newstr = iconv_substr($str, , $length, EC_CHARSET);    }    else    {      //$newstr = trim_right(substr($str, , $length));      $newstr = substr($str, , $length);    }    if ($append && $str != $newstr)    {      $newstr .= '…';    }    return $newstr;  }

未经允许不得转载:主机百科 » php substr中文截取乱码解决办法

相关文章