php匹配中文及生僻字

 
更多

php基本汉字的unicode编码匹配在[\x{4e00}-\x{9fa5}]范围,如果要加上一些生僻字,补充汉字,扩展汉字就需要增加匹配的范围。unicode汉字编码范围参考。

//自动转UTF-8编码
$str = "鿊";
$encode = mb_detect_encoding($str, ["ASCII", 'UTF-8', "GB2312", "GBK", 'BIG5', 'LATIN1']);
if ($encode != 'UTF-8') {
    $str = mb_convert_encoding($str, 'UTF-8', $encode);
}

$res = preg_match("/^([\x{4e00}-\x{9fa5}]|[\x{9fa6}-\x{9fef}]|[\x{3400}-\x{4db5}]|[\x{20000}-\x{2ebe0}]){2,15}$/u", $str);
if (!$res) {
    echo "不是中文汉字";
}
打赏

本文固定链接: https://www.cxy163.net/archives/3275 | 绝缘体

该日志由 绝缘体.. 于 2020年04月26日 发表在 未分类 分类下, 你可以发表评论,并在保留原文地址及作者的情况下引用到你的网站或博客。
原创文章转载请注明: php匹配中文及生僻字 | 绝缘体
关键字: , , , ,

php匹配中文及生僻字:等您坐沙发呢!

发表评论


快捷键:Ctrl+Enter