mysql怎么用函数实现多字节字符的截取_使用SUBSTRING与CHARACTER_LENGTH
MySQL 中 SUBSTRING 截取中文乱码?本质是字节 vs 字符混淆
核心问题在于:SUBSTRING 函数默认按字节进行截取。在 utf8mb4 编码下,一个中文字符通常占用 3 到 4 个字节。若错误地使用返回字节数的 LENGTH() 函数来配合 SUBSTRING 操作,极易截取到半个汉字,从而产生乱码。正确的解决方案是使用 CHARACTER_LENGTH() 函数,它返回的是我们直观可见的字符数,能确保精准定位到“第几个字”。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

SUBSTRING(str, pos, len) 的 pos 和 len 都按字符位置算
需要明确一个关键点:SUBSTRING 函数本身不区分编码,其参数 pos(起始位置)和 len(长度)在定义上就是基于“字符数”计算的。但前提是,你传递给它的数值必须是字符数,而非字节数。
- 典型的错误写法:
SUBSTRING(name, LENGTH(LEFT(name, 2)), 1)。此代码试图先用LEFT取前2个字节,再用LENGTH()计算其字节长度作为起始位。风险在于,LEFT(name, 2)取出的2个字节可能只是一个汉字的一部分,导致后续计算完全偏离预期。 - 正确的做法:直接使用字符数。例如,
SUBSTRING(name, 1, 2)就是截取前2个字符,简单直接。若需动态计算,例如截取最后2个字符,可写作:SUBSTRING(name, CHARACTER_LENGTH(name) - 2 + 1, 2)。 - 额外注意:在
utf8mb4的排序规则(如utf8mb4_0900_as_cs)下,SUBSTRING的行为是稳定可靠的。但如果使用的是旧版的utf8(实为 utf8mb3),处理四字节的 Emoji 表情时仍可能出错。
CHARACTER_LENGTH() 不是万能补丁,得看字段实际编码
使用 CHARACTER_LENGTH() 就能一劳永逸吗?并非如此。该函数返回的是 Unicode 字符的个数,但其准确性依赖于字段本身声明的字符集。设想一个场景:一个字段被定义为 latin1 字符集,但实际存储的却是 UTF-8 编码的中文。此时,CHARACTER_LENGTH() 可能会将一个汉字错误地计为3个字符。这并非函数缺陷,而是数据存储层出现了编码不匹配。
- 第一步,检查字段的真实字符集:执行
SHOW FULL COLUMNS FROM table_name LIKE 'column_name';,重点关注Collation列,确保其指向utf8mb4_*系列的排序规则。 - 临时转换的权宜之计:若暂时无法修改表结构,可在查询时进行编码转换:
SUBSTRING(CONVERT(column_name USING utf8mb4), 1, 5)。但此方法存在性能开销,不建议在数据量大的表或 WHERE 条件中频繁使用。 - 更简洁的替代方案:对于简单的截取操作,
LEFT(column_name, 5)与SUBSTRING(column_name, 1, 5)效果完全相同,前者书写更简洁。RIGHT()函数同理。
遇到 SUBSTRING 返回空或问号?先查连接层编码
有时,即使 SQL 语句逻辑无误,执行结果仍可能出现乱码、空字符串或问号。这通常源于数据库连接层的编码问题。如果客户端连接使用的是 latin1 编码,或未正确设置 SET NAMES utf8mb4,那么 SUBSTRING 函数接收到的可能已是一个被损坏的字符串,后续任何字符数计算都将失效。
- 连接时指定编码:在命令行连接时,可添加参数:
mysql --default-character-set=utf8mb4 -u user -p。 - 执行前校验编码设置:运行查询
SELECT @@character_set_client, @@character_set_connection, @@character_set_results;,确保这三个系统变量的值均为utf8mb4。 - 一个常见的错误现象:执行
SUBSTRING('你好世界', 1, 2)却返回空值或乱码。这大概率是客户端解码失败所致,而非函数本身功能失效。
归根结底,真正的挑战往往不在于函数语法本身,而在于确保字符集声明、连接参数与实际字段存储三者之间的一致性。只要其中任何一层未能对齐,缺少了关键的 mb4 支持,那么之前所有基于 CHARACTER_LENGTH() 的精心计算都可能前功尽弃。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
mysql启动失败报The server quit without updating PID file怎么办_检查权限与磁盘空间
MySQL启动失败报“The server quit without updating PID file”怎么办?检查权限与磁盘空间 遇到MySQL启动时报“The server quit without updating PID file”,这事儿确实挺让人头疼。表面上看是PID文件没更新,但背后
怎样从Navicat导出XML文件_完整操作步骤与格式选择
Na vicat 自15版起彻底移除XML导出功能,唯一可靠方案是使用mysqldump --xml命令;其生成的XML为MySQL自定义格式,含结构,需注意字符转义、时区、base64编码等兼容性问题。 Na vicat 不支持直接导出 XML 格式 如果你正在 Na vicat 里翻箱倒柜地寻找
SQL如何将行数据转为列显示_使用PIVOT函数或CASE聚合实现
SQL行转列:从PIVOT到CASE,一次讲透实现与取舍 SQL行转列在不同数据库中实现方式差异大:SQL Server和Oracle 11g+原生支持PIVOT,MySQL PostgreSQL等需用CASE+聚合模拟;PIVOT要求硬编码列值、不可动态,动态场景应由应用层拼SQL或交由报表工具处
mysql如何实现排行榜实时更新_mysql内存表与索引优化
MySQL排行榜实时更新卡顿,先看是不是在用普通InnoDB表做高频UPDATE 你的MySQL排行榜一更新就卡顿延迟?别急着排查复杂业务代码,问题根源很可能出在基础的表结构设计上。许多开发者习惯性地使用标准的InnoDB表来处理高频的积分更新操作,却忽略了其底层机制带来的性能瓶颈。InnoDB引擎
SQL子查询与临时表如何选择_性能对比与执行计划分析实战
SQL子查询与临时表如何选择_性能对比与执行计划分析实战 在数据库优化中,子查询和临时表的选择常常让人纠结。其实,真正的问题往往不在于工具本身,而在于对执行计划的理解不够透彻。今天,我们就来拆解几个实战中高频出现的性能陷阱,看看如何通过分析EXPLAIN来做出最佳决策。 子查询在 WHERE 中嵌套
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

