在MySQL 8.0版本之前, 默认字符集是latin1, 使用默认字符集的时候输入中文会出现乱码问题, 所以我们开发人员经常会将MySQL字符集的格式修改为utf8解决乱码问题, utf8字符集默认指向的是utf8mb3格式编码, 在MySQL 8.0版本开始, 默认的字符集将改为了utf8mb4, 有效的解决了中文乱码问题 查看当前MySQL数据库使用的字符集 MySQL 8.0版本查询默认字符集 MySQL 5.7版本查询默认字符集 对于MySQL 5.7版本我们可以通过Navicat等工具来对数据库的默认字符集进行修改, 也可以通过修改MySQL的配置文件my.cnf来修改默认字符集 my.cnf文件在Linux系统下的地址是: /etc/my.cnf 在 [mysqld] 下新增 character_set_server=utf8 修改成功之后注意要重启 MySQL, 使配置生效, 重启命令systemctl restart mysqld.service 在上面字符集列表里面有几个属性可以了解一下: 在日常操作中utf8字符集表示一个字符需要 1 在MySQL中, utf8通常指的是 utf8mb4 查看当前MySQL支持的字符集可输入下列查询: 我们可以看到查询结果一共有四列, 分别是字符集名称, 简介, 该字符集默认排序规则, 使用该字符集最大字节数 Default collation表示的是该字符集默认的比较规则, utf8_general_ci是一种通用的比较规则,这里可以选择比较规则主要作用于哪种语言 在我们使用Navicat编辑数据库的时候可以看到当前数据库使用的字符集和排序规则 utf8_unicode_ci和 utf8_general_ci对中英文来说没有区别 utf8_general_ci 校对速度快, 准确度较差 utf8_unicode_ci 准确度高, 但校对速度稍慢 一般来讲使用utf8_general_ci就够了, 但是如果应用中使用到德语, 法语或者俄语, 一定要使用 utf8_unicode_ci, 因为 utf8_general_ci是一种比较老的标准 utf8_unicode_ci会更符合这些国家人们的习惯 后缀 英文释义 描述 _ai accent insensitive 不区分重音 _as accent sensitive 区分重音 _ci case insensitive 不区分大小写 _cs case sensitive 区分大小写 _bin binary 以二进制的方式比较 修改数据库的默认字符集和比较规则后, 原来已经创建的表的字符集和比较规则并不会改变, 需要单独的去更改字符集的查询与修改
show variables like 'character%';
-- 或
show variables like '%char%';
字符集比较规则
utf8mb3和 utf8mb4
4个字节, 但是我们常用的一些字符只需要使用 13个字节, 而字符集表示使用一个字符的最大字节长度, 长度不同占用空间大小也不同, 所以在MySQL中定义了utf8mb3和utf8mb4:show charset;
-- 或
show character set;
比较规则后缀含义
字符集常用SQL
-- 查看服务器的字符集和比较规则
show variables like '%_server';
-- 查看数据库的字符集和比较规则
show variables like '%_database';
-- 查看具体数据库的字符集
show create database 表名;
-- 修改具体数据库的字符集
alter database 表名 default character set 'utf8' collate 'utf8_general_ci';