在上一篇博文中我们讲到了MySQL
的一些命令行脚本,主要讲了数据库的操作、数据表的操作以及对数据的增删改查(CURD
)操作。这几个操作里面我们最常见的就是CURD
操作啦,在CURD
操作中,我们最常见的就是查询(Select
)操作,所以这篇博文我们就来详细的谈一谈MySQL
的查询操作。
简单查询
创建数据库、数据表
1 | -- 创建数据库 |
准备数据
1 | -- 向students表中插入数据 |
- 查询所有字段
1 | select * from 表名; |
- 查询指定字段
1 | select 列1,列2,... from 表名; |
- 使用
as
给字段取别名
1 | select id as 序号, name as 名字, gender as 性别 from students; |
- 可以通过
as
给表取别名
1 | -- 如果是单表查询 可以省略表明 |
消除重复行
- 在
select
后面列前使用distinct
可以消除重复的行
1 | select distinct 列1,... from 表名; |
条件
使用Where
子句对表中的数据筛选,结果为True
的行会出现在结果集中。
- 语法如下:
1 | select * from 表名 where 条件; |
where
后面支持多种运算符,进行条件的处理:- 比较运算符
- 逻辑运算符
- 模糊查询
- 范围查询
- 空判断
比较运算符
- 等于: =
- 大于: >
- 大于等于: >=
- 小于: <
- 小于等于: <=
- 不等于: <>或者!=
例1:查询编号大于3的学生:
1 | select * from students where id > 3; |
例2:查询编号不大于4的学生:
1 | select * from students where id <= 4; |
例3:查询姓名不是“黄蓉”的学生:
1 | select * from students where name != '黄蓉'; |
例4:查询没被删除的学生:
1 | select * from students where is_delete=0; |
逻辑运算符
and
or
not
例4:查询编号大于3的女同学
1 | select * from students where id > 3 and gender=0; |
例5:查询编号小于4或没被删除的学生
1 | select * from students where id < 4 or is_delete=0; |
模糊查询
- like
- %表示任意多个任意字符
- _表示一个任意字符
rlike
正则匹配
例7:查询姓黄的学生:
1 | select * from students where name like '黄%'; |
例8:查询姓黄并且并且”名”是一个字的学生:
1 | select * from students where name like '黄_'; |
例9:查询姓黄或者叫靖的学生:
1 | select * from students where name like '黄%' or name like '%靖'; |
例10:查询以’周’开头的学生(正则表达式):
1 | select * from students where name rlike '^周.*' |
例11:查询以’周’开头,以’伦’结尾的学生:
1 | select * from students where name rlike '^周.*伦$' |
范围查询
in
表示在一个非连续的范围内
例12:查询编号是1或3或8的学生:
1 | select * from students where id in(1,3,8); |
between ... and ...
表示在一个连续的范围内:
例13:查询编号为3-8的学生:
1 | select * from students where id between 3 and 8; |
例14:查询编号是3-8的男生:
1 | select * from students where (id between 3 and 8) and gender=1; |
空判断
- 注意:
null
与’’是不同的 - 判空
is null
例15:查询没有填写身高的学生:
1 | select * from students where height is null; |
- 判非空
is not null
例16:查询填写了身高的学生:
1 | select * from students where height is not null; |
例17:查询填写了身高的男生:
1 | select * from students where height is not null and gender=1; |
优先级
- 优先级从高到低的顺序为:小括号,
not
, 比较运算符, 逻辑运算符 and
比or
先运算,如果同时出现并希望先运算or
,需要结合()
使用
排序
为了方便查看数据,可以对数据进行排序
语法:
1 | select * from 表名 order by 列1 asc|desc [,列2 asc|desc,...] |
说明:
- 将行数据按照列1进行排序,如果某些行列1的值相同时,则按照列2排序,以此类推
- 默认按照列值从小到大排列(
asc
) asc
从小到大排列,即升序desc
从大到小排列,即降序
例1:查询未删除男生信息,按学号降序排序:
1 | select * from students where gender=1 and is_delete=0 order by id desc; |
例2:查询未删除学生信息,按照学号升序排序:
1 | select * from students where is_delete=0 order by name; |
例3:显示所有的学生信息,先按照年龄从大–>小排序,当年龄相同时 按照身高从高–>矮排序
1 | select * from students order by age desc,height desc; |
聚合函数
为了快速得到统计数据,经常会用到如下5个聚合函数:
总数
count(*)
表示计算总行数,括号中写星与列名,结果是相同的
例1:查询学生总数
1 | select count(*) from students; |
最大值
max(列)
表示求此列的最大值
例2:查询女生的编号的最大值
1 | select max(id) from students where gender=2; |
最小值
min(列)
表示求此列的最小值
例3:查询未删除的学生的最小编号:
1 | select min(id) from students where is_delete=0; |
求和
sum(列)
表示求此列的和
例4:查询男生的总年龄
1 | select sum(age) from students where gender=1; |
平均值
avg(列)
表示求此列的平均值
例5:查询未删除女生的编号的平均值
1 | select avg(id) from students where is_delete=0 and gender=2; |
近似
round(计算结果, 保留小数的位数)
表示求对应的结果的近似值
例6:计算所有人的平均年龄,并保留两位小数
1 | select round(avg(age),2) from students; |
分组
group by
group by
的含义,将查询结果按照1个或多个字段进行分组,字段值相同的为一组group by
可用于单个字段分组,也可用于多个字段分组
1 | select * from students; |
根据gender
字段来分组,gender
字段的全部值有4个’男’, ‘女’, ‘中性’, ‘保密’,所以分为了4组。当group by
单独使用时,只显示出每组的第一条记录, 所以group by
单独使用时的实际意义不大
group by + group_concat()
group_concat(字段名)
可以作为一个输出字段来使用- 表示分组之后,根据分组结果,使用
group_concat()
来放置每一组的某字段的值的集合
1 | select gender from students group by gender; |
group by + 聚合函数
- 通过
group_concat()
的启发,我们既然可以统计出每个分组的某字段的值的集合,那么我们也可以通过集合函数来对这个值的集合做一些操作
1 | select gender,group_concat(age) from students group by gender; |
group by + having
having
条件表达式:用来分组查询后指定一些条件来输出查询结果having
作用和where
一样,但having
只能用于group by
1 | select gender,count(*) from students group by gender having count(*)>2; |
group by + with rollup
with rollup
的作用是:在最后新增一行,来记录当前列里所有记录的总和
1 | select gender,count(*) from students group by gender with rollup; |
分页
获取部分行
当数据量过大时,在一页中查看数据是一件非常麻烦的事情
语法:
1 | select * from 表名 limit start,count |
说明:
- 从
start
开始,获取count
条数据
例1:查询前3行男生信息:
1 | select * from students where gender=1 limit 0,3; |
示例:
- 已知:每页显示m条数据,当前显示第n页
- 求总页数:此段逻辑后面会在python中实现
- 查询总条数
p1
- 使用
p1
除以m
得到p2
- 如果整除则
p2
为总页数 - 如果不整除则
p2+1
为总页数
- 查询总条数
- 求第
n
页的数据
1 | select * from students where is_delete=0 limit (n-1)*m,m |
连接查询
当查询结果的列来源于多张表时,需要将多张表连接成一个大的数据集,再选择合适的列返回mysql
支持三种类型的连接查询, 分别为:
- 内连接查询:查询的结果为两个表匹配到的数据:
- 右连接查询:查询的结果为两个表匹配到的数据,右表特有的数据,对于左表中不存在的数据使用
null
填充
- 左连接查询:查询的结果为两个表匹配到的数据,左表特有的数据,对于右表中不存在的数据使用
null
填充
语法:
1 | select * from 表1 inner或left或right join 表2 on 表1.列 = 表2.列 |
例1:使用内连接查询班级表与学生表:
1 | select * from students inner join classes on students.cls_id = classes.id; |
例2:使用左连接查询班级表与学生表:
- 此处使用了
as
为表起别名,目的是编写简单
1 | select * from students as s left join classes as c on s.cls_id = c.id; |
例3:使用右连接查询班级表与学生表:
1 | select * from students as s right join classes as c on s.cls_id = c.id; |
例4:查询学生姓名及班级名称:
1 | select s.name,c.name from students as s inner join classes as c on s.cls_id = c.id; |
例5:查询没有对应班级信息的学生
1 | select * from students as s left join classes as s on s.cls_id = c.id having c.id is null |
自关联
设计省信息的表结构
provinces
id
ptitle
设计市信息的表结构
citys
id
ctitle
proid
citys
表的proid
表示城市所属的省,对应着provinces
表的id
值
问题:
能不能将两张表合成一张表呢?
思考:
观察两张表发现,
citys
表比provinces
表多一个列proid
,其它列的类型都是一样的
意义:
存储的都是地区信息,而且每种信息的数据量有限,没必要增加一个新表,或者将来还要存储区、乡镇信息,都增加新表的开销太大
答案:
定义表
areas
,结构如下:
id
atitle
proid
说明:
- 因为省没有所属的省份,所以可以填写为
null
- 城市所属的省份
pid
,填写省所对应的编号id
- 这就是自关联,表中的某一列,关联了这个表中的另外一列,但是它们的业务逻辑含义是不一样的,城市信息的
pid
引用的是省信息的id
- 在这个表中,结构不变,可以添加区县、乡镇街道、村社区等信息
创建areas表的语句如下:
1 | create table areas( |
- 从
sql
文件中导入数据
1 | source areas.sql; |
- 查询一共有多少省
1 | select count(*) from areas where pid is null; |
- 例1:查询省的名称为“山西省”的所有城市:
1 | select city.* from areas as city |
- 例2:查询市的名称为“广州市”的所有区县:
1 | select dis.* from areas as dis |
子查询
子查询
在一个
select
语句中,嵌入了另外一个select
语句, 那么被嵌入的select
语句称之为子查询语句
主查询
主要查询的对象,第一条select语句
主查询和子查询的关系
- 子查询是嵌入到主查询中
- 子查询是辅助主查询的,要么充当条件,要么充当数据源
- 子查询是可以独立存在的语句,是一条完整的
select
语句
子查询分类
- 标量子查询:子查询返回的的结果是一个数据(一行一列)
- 列子查询:返回的结果是一列(一列多行)
- 行子查询:返回的结果是一行(一行多列)
标量子查询
- 查询班级学生的平均年龄
- 查询大于平均年龄的学生
查询班级学生的平均身高:
1 | select * from students where age > (select avg(age) from students); |
列级子查询
- 查询还有学生在班的所有班级名字
- 找出学生表中所有的班级
id
- 找出班级表中对应的名字
- 找出学生表中所有的班级
1 | select name from classes where id in (select cls_id from students); |
行级子查询
- 需求:查找班级年龄最大,身高最高的学生
- 行元素:将多个字段合成一个行元素,在行级子查询中会使用到行元素
1 | select * from students where (height,age) = (select max(height),max(age) from students); |
子查询中特定关键字使用
in
范围- 格式: 主查询 where 条件 in (列子查询)
总结
查询的完整格式:
1 | SELECT select_expr [,select_expr,...] [ |
- 完整的
select
语句
1 | select distinct * |
执行顺序为:
from
表名where
……group by
select distict *
having
……order by
……limit start,count
实际使用中,只是语句中某些部分的组合,而不是全部