本来准备直接开讲NoSQL的(当时开篇就是说的NoSQL)考虑到有些同志可能连MySQL系都没接触过,所以我们2019说数据系的时候预计从MySQL(穿插MSSQL)开始,这篇文章就当试水篇,效果好就继续往下写~(这篇偏理论和运维)
1.1.MariaDB and MySQL
官方文档:https://mariadb.com/kb/zh-cn/mariadb
目前主流:MySQL 5.7 or MariaDB 5.5.x(推荐)
多一句嘴,MySQL当年被Oracle收购后,MySQL之父觉得靠Oracle维护MySQL很不靠谱,然后就跳槽弄了个MariaDB(很多Oracle竞争对手扶持着),目前MariaDB是发展最快的MySQL分支版本(PS:MySQL现在是双协议了,大部分公司用的版本都是<=5.7)
然后得说下迁移问题:MySQL 5.x到 MariaDB 5.x基本上是无缝的,MariaDB最新稳定版为:MariaDB 5.5
MariaDB与MySQL兼容性可以查看:
https://mariadb.com/kb/en/library/mariadb-vs-mysql-compatibility
PS:国内比较火的还有阿里的MySQL分支:https://github.com/alibaba/AliSQL
不谈其他的,咱们看看它们开发的积极程度就知道为什么MariaDB是主流了
1.2.MariaDB部署
1.环境配置和初始化
安装很简单,以CentOS为例:
systemctl start mariadb.service # 启动MariaDB systemctl enable mariadb.service # 设置开机启动 systemctl stop mariadb.service # 停止MariaDB systemctl restart mariadb.service # 重启MariaDB
PS:Win安装注意这一步:
执行文件简单说明:有时候我们 ps aux | grep mysql 的时候,发现运行的并不是/usr/bin/下的mysqld而是mysqld_safe,那这个mysqld_safe是啥呢?==> 线程安全的实例
MariaDB的程序组成:ls /usr/bin | grep mysql
- Client:
- mysql 命令行客户端
- mysqldump 数据库备份用
- mysqladmin 远程管理工具
- mysqlbinlog 二进制日志管理工具
- ...
- Server:
- mysqld_safe 线程安全的实例
- mysqld_multi 多实例
- mysqld
- mysql_secure_installation 安全初始化工具(记得先启动数据库哦)
- ...
mysql的账号由两部分组成:username@host,MySQL客户端连接参数:
- -u用户名:默认为root
- -h服务器主机:默认为localhosthost用于限制用户可以通过哪些主机连接
- 支持通配符:
- %匹配任意长度的任意字符:172.16.0.0/16 ==> 172.16.%.%
- _匹配任意单个字符
- -p密码:默认为空安装完成后运行mysql_secure_installation来设置密码并初始化
很多人安装完成后是这样设置密码的:(不推荐)
正确打开方式:mysql_secure_installation
如果允许root远程登录:Disallow root login remotely? [Y/n] n
安全初始化后登录图示:
2.配置文件
以MariaDB 5.5.60为例:
- Linux:配置文件查找顺序(找不到就往下继续)
- /etc/my.cnf --> /etc/mysql/conf.d/*.cnf --> ~/.my.cnf
- Windows:MariaDB安装目录/data/my.ini
PS:一般配置文件都会设置这3个
# 指定数据库文件存放路径 datadir = /home/dnt/data # 独立表空间: 每一个表都有一个.frm表描述文件,还有一个.ibd文件 innodb_file_per_table=on # 不对连接进行DNS解析(省时) skip_name_resolve=on
其他配置MariaDB提供了样本:
[dnt@localhost ~] ls /usr/share/mysql/ | grep .cnf my-huge.cnf # 超大内存配置参考 my-innodb-heavy-4G.cnf # 4G内存配置参考 my-large.cnf # 大内存配置 my-medium.cnf # 中等内存配置 my-small.cnf # 小内存配置
PS:thread_concurrency=CPU数*2最佳,修改配置后记得重启数据库
远程访问
1.之前安全初始化的时候把root禁止远程登录了,现在我们创建一个其他用户
2.给用户权限
3.防火墙放行指定端口
4.远程客户端测试一下
Code如下:
# 分配权限 grant all privileges on 数据库.* to 用户名@"%" identified by "密码"; # 刷新设置 flush privileges; # 显示服务状态 systemctl status firewalld # 添加 --permanent永久生效(没有此参数重启后失效) firewall-cmd --zone=public --add-port=80/tcp --permanent # 重新载入 firewall-cmd --reload # 查看 firewall-cmd --zone= public --query-port=80/tcp # 删除 firewall-cmd --zone= public --remove-port=80/tcp --permanent
SQLServer远程连接:https://www.cnblogs.com/dunitian/p/5474501.html
MySQL军规(58)
文章结尾贴一节58的MySQL军规:(适用于并发量大,数据量大的典型互联网业务)
1.基础规范
- 表存储引擎必须使用InnoDB
- 表字符集默认使用utf8,必要时候使用utf8mb4utf8通用,无乱码风险,汉字3字节,英文1字节
- utf8mb4是utf8的超集,存储4字节时使用(eg:表情符号)
- 禁止使用存储过程,视图,触发器,Event调试,排错,迁移都比较困难,扩展性较差
- 对数据库性能影响较大,互联网业务,能让站点层和服务层干的事情,不要交到数据库层
- 禁止在数据库中存储大文件(eg:照片)
- 可以将大文件存储在对象存储系统,数据库中存储路径
- 禁止在线上环境做数据库压力测试
- 测试,开发,线上数据库环境必须隔离
2.命名规范
- 库名,表名,列名必须用小写,采用下划线分隔abc,Abc,ABC都是给自己埋坑
- 库名,表名,列名必须见名知义,长度不要超过32字符
- tmp,wushan谁TM知道这些库是干嘛的
- 库备份必须以bak为前缀,以日期为后缀
- 从库必须以-s为后缀
- 备库必须以-ss为后缀
3.表设计规范
- 单实例表个数必须控制在2000个以内
- 单表分表个数必须控制在1024个以内
- 表必须有主键,推荐使用unsigned整数为主键潜在坑:删除无主键的表,如果是row模式的主从架构,从库会挂住
- 禁止使用外键,如果要保证完整性,应由应用程式实现
- 外键使得表之间相互耦合,影响update/delete等SQL性能
- 有可能造成死锁,高并发情况下容易成为数据库瓶颈
- 建议将大字段,访问频度低的字段拆分到单独的表中存储,分离冷热数据
- 垂直拆分的依据,尽量把长度较短,访问频率较高的属性放在主表里
- 流量大数据量大时,数据访问要有service层,并且service层不要通过join来获取主表和扩展表的属性
- 具体可以参考沈剑大牛写的《如何实施数据库垂直拆分》
4.列设计规范
- 根据业务区分使用tinyint/int/bigint,分别会占用1/4/8字节
- 根据业务区分使用char/varchar(PS:没有MSSQL里的nvarchar)
- 字段长度固定,或者长度近似的业务场景,适合使用char,能够减少碎片,查询性能高
- 字段长度相差较大,或者更新较少的业务场景,适合使用varchar,能够减少空间
- 根据业务区分使用datetime/timestampdatetime占用5个字节,timestamp占用4个字节
- 存储年使用year,存储日期使用date,存储时间使用datetime
- 必须把字段定义为NOT NULL并设默认值NULL需要更多的存储空间
- NULL的列使用索引,索引统计,值都更加复杂,MySQL更难优化
- NULL只能采用IS NULL或者IS NOT NULL,而在=/!=/in/not in时有大坑
- 使用int unsigned存储IPv4,不要用char(15)
- 使用varchar(20)存储手机号,不要使用整数手机号不会用来做数学运算
- varchar可以模糊查询(eg:like ‘138%’)
- 牵扯到国家代号,可能出现+、-、()等字符,eg:+86
- 使用tinyint来代替enumenum增加新值要进行DDL操作
5.索引规范(常用)
- 唯一索引使用uniq_字段名来命名
- 非唯一索引使用idx_字段名来命名
- 单张表索引数量建议控制在5个以内互联网高并发业务,太多索引会影响写性能
- 异常复杂的查询需求,可以选择ES等更为适合的方式存储
- 生成执行计划时,如果索引太多,会降低性能,并可能导致MySQL选择不到最优索引
- 组合索引字段数不建议超过5个如果5个字段还不能极大缩小row范围,八成是设计有问题
- 不建议在频繁更新的字段上建立索引
- 非必要不要进行join查询,如果要进行join查询,被join的字段必须类型相同,并建立索引join字段类型不一致容易导致全表扫描
- 理解组合索引最左前缀原则,避免重复建设索引
- 如果建立了(a,b,c),相当于建立了(a), (a,b), (a,b,c)
6.SQL规范(常用)
- 禁止使用select *,只获取必要字段指定字段能有效利用索引覆盖
- select *会增加cpu/io/内存/带宽的消耗
- 指定字段查询,在表结构变更时,能保证对应用程序无影响
- insert必须指定字段,禁止使用insert into T values()指定字段插入,在表结构变更时,能保证对应用程序无影响
- 隐式类型转换会使索引失效,导致全表扫描(很重要)
- 禁止在where条件列使用函数或者表达式
- 导致不能命中索引,全表扫描
- 禁止负向查询以及%开头的模糊查询
- 导致不能命中索引,全表扫描
- 禁止大表join和子查询
- 同一个字段上的or必须改写为in,in的值必须少于50个
- 应用程序必须捕获SQL异常(方便定位线上问题)
课后思考:为什么select uid from user where phone=13811223344不能命中phone索引?
课后拓展:
MyISAM与InnoDB两者之间区别与选择 https://www.cnblogs.com/y-rong/p/5309392.html https://www.cnblogs.com/y-rong/p/8110596.html 了解下Mysql的间隙锁及产生的原因 https://www.cnblogs.com/wt645631686/p/8324671.html grant授权和revoke回收权限 https://www.cnblogs.com/kevingrace/p/5719536.html centos7自带数据库MariaDB重启和修改密码 https://blog.csdn.net/shachao888/article/details/50341857 MySQL添加用户、删除用户与授权 https://www.cnblogs.com/wanghetao/p/3806888.html 深度认识 Sharding-JDBC:做最轻量级的数据库中间层 https://my.oschina.net/editorial-story/blog/888650
作者:毒逆天
出处:https://www.cnblogs.com/dotnetcrazy。
打开支付宝首页搜“551548623”领小编红包,每天都有噢~