[PHP] utf-8 문자열을 주어진 바이트로 자르기

php 에서 제공하는 substr 함수 등을 이용해 주어진 문자를 특정 바이트로 잘라야 하는 경우 영문이나 숫자는 문제가 되지 않지만 한글 등 utf-8 문자에서는 마지막 문자가 정상적으로 표시되지 않는 등의 문제가 발생한다. 이런 경우에 사용하고자 아래 함수를 만들었다.

function getSubstring($str, $length)
{
    $str = trim($str);

    if (strlen($str) <= $length)
        return $str;

    $strArr = preg_split("//u", $str, -1, PREG_SPLIT_NO_EMPTY);
    $cutStr = '';

    foreach ($strArr as $s) {
        $len1 = strlen($s);
        $len2 = strlen($cutStr) + $len1;

        if ($len2 > $length)
            break;
        else
            $cutStr .= $s;
    }

    return $cutStr;
}

getSubstring 함수는 주어진 문자열을 주어진 길이(byte) 만큼 자른 후 리턴한다. 만약 주어진 길이만큼 자를 때 마지막 문자가 정상적인 문자가 아닌 경우는 그 전 문자까지 리턴한다.

편리

PHP와 MariaDB, jQuery 등을 사용해 게시판, 쇼핑몰 솔루션을 개발합니다. 그누보드5와 영카트5 개발에 참여 했습니다. Linux와 Nginx는 물론 WordPress, Git 등에도 관심이 많습니다. 자전거 타기 및 사진 촬영을 취미로 하고 있습니다.

카카오톡 플러스친구 채팅 : NCUBE.NET

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.