字符集的查询与修改

在MySQL 8.0版本之前, 默认字符集是latin1, 使用默认字符集的时候输入中文会出现乱码问题, 所以我们开发人员经常会将MySQL字符集的格式修改为utf8解决乱码问题, utf8字符集默认指向的是utf8mb3格式编码, 在MySQL 8.0版本开始, 默认的字符集将改为了utf8mb4, 有效的解决了中文乱码问题

查看当前MySQL数据库使用的字符集

show variables like 'character%';

-- 或

show variables like '%char%';

MySQL 8.0版本查询默认字符集

MySQL 5.7版本查询默认字符集

对于MySQL 5.7版本我们可以通过Navicat等工具来对数据库的默认字符集进行修改, 也可以通过修改MySQL的配置文件my.cnf来修改默认字符集

my.cnf文件在Linux系统下的地址是: /etc/my.cnf 在 [mysqld] 下新增 character_set_server=utf8 修改成功之后注意要重启 MySQL, 使配置生效, 重启命令systemctl restart mysqld.service

在上面字符集列表里面有几个属性可以了解一下:

character_set_client 服务器解码请求时使用的字符集
character_set_connection 服务器处理请求时会把请求字符串从character_set_client转为character_set_connection
character_set_results 服务器向客户端返回数据时使用的字符集

字符集比较规则

utf8mb3和 utf8mb4

在日常操作中utf8字符集表示一个字符需要 1~~4个字节, 但是我们常用的一些字符只需要使用 1~~3个字节, 而字符集表示使用一个字符的最大字节长度, 长度不同占用空间大小也不同, 所以在MySQL中定义了utf8mb3和utf8mb4:

utf8mb3 1~3字节
utf8mb4 1~4字节

在MySQL中, utf8通常指的是 utf8mb4

查看当前MySQL支持的字符集可输入下列查询:

show charset;

-- 或

show character set;

我们可以看到查询结果一共有四列, 分别是字符集名称, 简介, 该字符集默认排序规则, 使用该字符集最大字节数

Default collation表示的是该字符集默认的比较规则, utf8_general_ci是一种通用的比较规则,这里可以选择比较规则主要作用于哪种语言在我们使用Navicat编辑数据库的时候可以看到当前数据库使用的字符集和排序规则

utf8_croatiian_ci就是以罗克地亚语的规则比较,
utf8_czech_ci 以捷克语的规则比较
utf8_danish_ci 以丹麦语规则比较
...

utf8_unicode_ci和 utf8_general_ci对中英文来说没有区别 utf8_general_ci 校对速度快, 准确度较差 utf8_unicode_ci 准确度高, 但校对速度稍慢
一般来讲使用utf8_general_ci就够了, 但是如果应用中使用到德语, 法语或者俄语, 一定要使用 utf8_unicode_ci, 因为 utf8_general_ci是一种比较老的标准 utf8_unicode_ci会更符合这些国家人们的习惯

比较规则后缀含义

后缀	英文释义	描述
_ai	accent insensitive	不区分重音
_as	accent sensitive	区分重音
_ci	case insensitive	不区分大小写
_cs	case sensitive	区分大小写
_bin	binary	以二进制的方式比较

字符集常用SQL

-- 查看服务器的字符集和比较规则
show variables like '%_server';

-- 查看数据库的字符集和比较规则
show variables like '%_database';

-- 查看具体数据库的字符集
show create database 表名;

-- 修改具体数据库的字符集
alter database 表名 default character set 'utf8' collate 'utf8_general_ci';

修改数据库的默认字符集和比较规则后, 原来已经创建的表的字符集和比较规则并不会改变, 需要单独的去更改

玖叶教程网

前端编程开发入门

MySQL基础篇之字符集

字符集的查询与修改

字符集比较规则

utf8mb3和 utf8mb4

比较规则后缀含义

字符集常用SQL