Fork me on GitHub

详解MySQL查询

在上一篇博文中我们讲到了MySQL的一些命令行脚本,主要讲了数据库的操作、数据表的操作以及对数据的增删改查(CURD)操作。这几个操作里面我们最常见的就是CURD操作啦,在CURD操作中,我们最常见的就是查询(Select)操作,所以这篇博文我们就来详细的谈一谈MySQL的查询操作。


简单查询

创建数据库、数据表

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
-- 创建数据库
create database python_test_1 charset=utf8;

-- 使用数据库
use python_test_1;

-- students表
create table students(
id int unsigned primary key auto_increment not null,
name varchar(20) default '',
age tinyint unsigned default 0,
height decimal(5,2),
gender enum('男','女','中性','保密') default '保密',
cls_id int unsigned default 0,
is_delete bit default 0
);

-- classes表
create table classes (
id int unsigned auto_increment primary key not null,
name varchar(30) not null
);

准备数据

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
-- 向students表中插入数据
insert into students values
(0,'小明',18,180.00,2,1,0),
(0,'小月月',18,180.00,2,2,1),
(0,'彭于晏',29,185.00,1,1,0),
(0,'刘德华',59,175.00,1,2,1),
(0,'黄蓉',38,160.00,2,1,0),
(0,'凤姐',28,150.00,4,2,1),
(0,'王祖贤',18,172.00,2,1,1),
(0,'周杰伦',36,NULL,1,1,0),
(0,'程坤',27,181.00,1,2,0),
(0,'刘亦菲',25,166.00,2,2,0),
(0,'金星',33,162.00,3,3,1),
(0,'静香',12,180.00,2,4,0),
(0,'郭靖',12,170.00,1,4,0),
(0,'周杰',34,176.00,2,5,0);

-- 向classes表中插入数据
insert into classes values (0, "python_01期"), (0, "python_02期");
  • 查询所有字段
1
2
3
select * from 表名;
例:
select * from students;
  • 查询指定字段
1
2
3
select1,列2,... from 表名;
例:
select name from students;
  • 使用as给字段取别名
1
select id as 序号, name as 名字, gender as 性别 from students;
  • 可以通过as给表取别名
1
2
3
4
5
6
7
8
-- 如果是单表查询 可以省略表明
select id, name, gender from students;

-- 表名.字段名
select students.id,students.name,students.gender from students;

-- 可以通过 as 给表起别名
select s.id,s.name,s.gender from students as s;

消除重复行

  • select后面列前使用distinct可以消除重复的行
1
2
3
select distinct1,... from 表名;
例:
select distinct gender from students;

条件

使用Where子句对表中的数据筛选,结果为True的行会出现在结果集中。

  • 语法如下:
1
2
3
select * from 表名 where 条件;
例:
select * from students where id=1;
  • where后面支持多种运算符,进行条件的处理:
    • 比较运算符
    • 逻辑运算符
    • 模糊查询
    • 范围查询
    • 空判断

比较运算符

  • 等于: =
  • 大于: >
  • 大于等于: >=
  • 小于: <
  • 小于等于: <=
  • 不等于: <>或者!=

例1:查询编号大于3的学生:

1
select * from students where id > 3;

例2:查询编号不大于4的学生:

1
select * from students where id <= 4;

例3:查询姓名不是“黄蓉”的学生:

1
select * from students where name != '黄蓉';

例4:查询没被删除的学生:

1
select * from students where is_delete=0;

逻辑运算符

  • and
  • or
  • not

例4:查询编号大于3的女同学

1
select * from students where id > 3 and gender=0;

例5:查询编号小于4或没被删除的学生

1
select * from students where id < 4 or is_delete=0;

模糊查询

  • like
  • %表示任意多个任意字符
  • _表示一个任意字符
  • rlike 正则匹配

例7:查询姓黄的学生:

1
select * from students where name like '黄%';

例8:查询姓黄并且并且”名”是一个字的学生:

1
select * from students where name like '黄_';

例9:查询姓黄或者叫靖的学生:

1
select * from students where name like '黄%' or name like '%靖';

例10:查询以’周’开头的学生(正则表达式):

1
select * from students where name rlike '^周.*'

例11:查询以’周’开头,以’伦’结尾的学生:

1
select * from students where name rlike '^周.*伦$'

范围查询

  • in表示在一个非连续的范围内

例12:查询编号是1或3或8的学生:

1
select * from students where id in(1,3,8);
  • between ... and ...表示在一个连续的范围内:

例13:查询编号为3-8的学生:

1
select * from students where id between 3 and 8;

例14:查询编号是3-8的男生:

1
select * from students where (id between 3 and 8) and gender=1;

空判断

  • 注意:null与’’是不同的
  • 判空is null

例15:查询没有填写身高的学生:

1
select * from students where height is null;
  • 判非空is not null

例16:查询填写了身高的学生:

1
select * from students where height is not null;

例17:查询填写了身高的男生:

1
select * from students where height is not null and gender=1;

优先级

  • 优先级从高到低的顺序为:小括号, not, 比较运算符, 逻辑运算符
  • andor先运算,如果同时出现并希望先运算or,需要结合()使用

排序

为了方便查看数据,可以对数据进行排序

语法

1
select * from 表名 order by1 asc|desc [,列2 asc|desc,...]

说明

  • 将行数据按照列1进行排序,如果某些行列1的值相同时,则按照列2排序,以此类推
  • 默认按照列值从小到大排列(asc)
  • asc从小到大排列,即升序
  • desc从大到小排列,即降序

例1:查询未删除男生信息,按学号降序排序:

1
select * from students where gender=1 and is_delete=0 order by id desc;

例2:查询未删除学生信息,按照学号升序排序:

1
select * from students where is_delete=0 order by name;

例3:显示所有的学生信息,先按照年龄从大–>小排序,当年龄相同时 按照身高从高–>矮排序

1
select * from students  order by age desc,height desc;

聚合函数

为了快速得到统计数据,经常会用到如下5个聚合函数:

总数

  • count(*)表示计算总行数,括号中写星与列名,结果是相同的

例1:查询学生总数

1
select count(*) from students;

最大值

  • max(列)表示求此列的最大值

例2:查询女生的编号的最大值

1
select max(id) from students where gender=2;

最小值

  • min(列)表示求此列的最小值

例3:查询未删除的学生的最小编号:

1
select min(id) from students where is_delete=0;

求和

  • sum(列)表示求此列的和

例4:查询男生的总年龄

1
2
3
4
select sum(age) from students where gender=1;

-- 平均年龄
select sum(age)/count(*) from students where gender=1;

平均值

  • avg(列)表示求此列的平均值

例5:查询未删除女生的编号的平均值

1
2
3
4
select avg(id) from students where is_delete=0 and gender=2;

--计算平均值还可以用sum(列)/count(*)
select sum(id)/count(*) from students where is_delete=0 and gender=2;

近似

  • round(计算结果, 保留小数的位数)表示求对应的结果的近似值

例6:计算所有人的平均年龄,并保留两位小数

1
select round(avg(age),2) from students;

分组

group by

  • group by的含义,将查询结果按照1个或多个字段进行分组,字段值相同的为一组
  • group by可用于单个字段分组,也可用于多个字段分组
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
select * from students;

+----+-----------+------+--------+--------+--------+-----------+
| id | name | age | height | gender | cls_id | is_delete |
+----+-----------+------+--------+--------+--------+-----------+
| 1 | 小明 | 18 | 180.00 | 女 | 1 | |
| 2 | 小月月 | 18 | 180.00 | 女 | 2 |  |
| 3 | 彭于晏 | 29 | 185.00 | 男 | 1 | |
| 4 | 刘德华 | 59 | 175.00 | 男 | 2 |  |
| 5 | 黄蓉 | 38 | 160.00 | 女 | 1 | |
| 6 | 凤姐 | 28 | 150.00 | 保密 | 2 |  |
| 7 | 王祖贤 | 18 | 172.00 | 女 | 1 |  |
| 8 | 周杰伦 | 36 | NULL | 男 | 1 | |
| 9 | 程坤 | 27 | 181.00 | 男 | 2 | |
| 10 | 刘亦菲 | 25 | 166.00 | 女 | 2 | |
| 11 | 金星 | 33 | 162.00 | 中性 | 3 |  |
| 12 | 静香 | 12 | 180.00 | 女 | 4 | |
| 13 | 周杰 | 34 | 176.00 | 女 | 5 | |
| 14 | 郭靖 | 12 | 170.00 | 男 | 4 | |
+----+-----------+------+--------+--------+--------+-----------+

select gender from students group by gender;

+--------+
| gender |
+--------+
| 男 |
| 女 |
| 中性 |
| 保密 |
+--------+

根据gender字段来分组,gender字段的全部值有4个’男’, ‘女’, ‘中性’, ‘保密’,所以分为了4组。当group by单独使用时,只显示出每组的第一条记录, 所以group by单独使用时的实际意义不大

group by + group_concat()

  • group_concat(字段名)可以作为一个输出字段来使用
  • 表示分组之后,根据分组结果,使用group_concat()来放置每一组的某字段的值的集合
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
select gender from students group by gender;

+--------+
| gender |
+--------+
| 男 |
| 女 |
| 中性 |
| 保密 |
+--------+

select gender,group_concat(name) from students group by gender;

+--------+-----------------------------------------------------------+
| gender | group_concat(name) |
+--------+-----------------------------------------------------------+
| 男 | 彭于晏,刘德华,周杰伦,程坤,郭靖 |
| 女 | 小明,小月月,黄蓉,王祖贤,刘亦菲,静香,周杰 |
| 中性 | 金星 |
| 保密 | 凤姐 |
+--------+-----------------------------------------------------------+





select gender,group_concat(id) from students group by gender;

+--------+------------------+
| gender | group_concat(id) |
+--------+------------------+
| 男 | 3,4,8,9,14 |
| 女 | 1,2,5,7,10,12,13 |
| 中性 | 11 |
| 保密 | 6 |
+--------+------------------+

group by + 聚合函数

  • 通过group_concat()的启发,我们既然可以统计出每个分组的某字段的值的集合,那么我们也可以通过集合函数来对这个值的集合做一些操作
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
select gender,group_concat(age) from students group by gender;

+--------+----------------------+
| gender | group_concat(age) |
+--------+----------------------+
| 男 | 29,59,36,27,12 |
| 女 | 18,18,38,18,25,12,34 |
| 中性 | 33 |
| 保密 | 28 |
+--------+----------------------+


分别统计性别为男/女的人年龄平均值

select gender,avg(age) from students group by gender;

+--------+----------+
| gender | avg(age) |
+--------+----------+
| 男 | 32.6000 |
| 女 | 23.2857 |
| 中性 | 33.0000 |
| 保密 | 28.0000 |
+--------+----------+

分别统计性别为男/女的人的个数

select gender,count(*) from students group by gender;

+--------+----------+
| gender | count(*) |
+--------+----------+
| 男 | 5 |
| 女 | 7 |
| 中性 | 1 |
| 保密 | 1 |
+--------+----------+

group by + having

  • having条件表达式:用来分组查询后指定一些条件来输出查询结果
  • having作用和where一样,但having只能用于group by
1
2
3
4
5
6
7
8
select gender,count(*) from students group by gender having count(*)>2;

+--------+----------+
| gender | count(*) |
+--------+----------+
| 男 | 5 |
| 女 | 7 |
+--------+----------+

group by + with rollup

  • with rollup的作用是:在最后新增一行,来记录当前列里所有记录的总和
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
select gender,count(*) from students group by gender with rollup;

+--------+----------+
| gender | count(*) |
+--------+----------+
| 男 | 5 |
| 女 | 7 |
| 中性 | 1 |
| 保密 | 1 |
| NULL | 14 |
+--------+----------+


select gender,group_concat(age) from students group by gender with rollup;

+--------+-------------------------------------------+
| gender | group_concat(age) |
+--------+-------------------------------------------+
| 男 | 29,59,36,27,12 |
| 女 | 18,18,38,18,25,12,34 |
| 中性 | 33 |
| 保密 | 28 |
| NULL | 29,59,36,27,12,18,18,38,18,25,12,34,33,28 |
+--------+-------------------------------------------+

分页

获取部分行

当数据量过大时,在一页中查看数据是一件非常麻烦的事情

语法

1
select * from 表名 limit start,count

说明

  • start开始,获取count条数据

例1:查询前3行男生信息:

1
select * from students where gender=1 limit 0,3;

示例

  • 已知:每页显示m条数据,当前显示第n页
  • 求总页数:此段逻辑后面会在python中实现
    • 查询总条数p1
    • 使用p1除以m得到p2
    • 如果整除则p2为总页数
    • 如果不整除则p2+1为总页数
  • 求第n页的数据
1
select * from students where is_delete=0 limit (n-1)*m,m

连接查询

当查询结果的列来源于多张表时,需要将多张表连接成一个大的数据集,再选择合适的列返回mysql支持三种类型的连接查询, 分别为:

  • 内连接查询:查询的结果为两个表匹配到的数据:

内连接查询

  • 右连接查询:查询的结果为两个表匹配到的数据,右表特有的数据,对于左表中不存在的数据使用null填充

右连接查询

  • 左连接查询:查询的结果为两个表匹配到的数据,左表特有的数据,对于右表中不存在的数据使用null填充

左连接查询

语法

1
select * from1 innerleftright join2 on1.列 = 表2.

例1:使用内连接查询班级表与学生表:

1
select * from students inner join classes on students.cls_id = classes.id;

例2:使用左连接查询班级表与学生表:

  • 此处使用了as为表起别名,目的是编写简单
1
select * from students as s left join classes as c on s.cls_id = c.id;

例3:使用右连接查询班级表与学生表:

1
select * from students as s right join classes as c on s.cls_id = c.id;

例4:查询学生姓名及班级名称:

1
select s.name,c.name from students as s inner join classes as c on s.cls_id = c.id;

例5:查询没有对应班级信息的学生

1
select * from students as s left join classes as s on s.cls_id = c.id having c.id is null

自关联

  • 设计省信息的表结构provinces

    • id
    • ptitle
  • 设计市信息的表结构citys

    • id
    • ctitle
    • proid
  • citys表的proid表示城市所属的省,对应着provinces表的id

问题:

能不能将两张表合成一张表呢?

思考:

观察两张表发现,citys表比provinces表多一个列proid,其它列的类型都是一样的

意义:

存储的都是地区信息,而且每种信息的数据量有限,没必要增加一个新表,或者将来还要存储区、乡镇信息,都增加新表的开销太大

答案:

定义表areas,结构如下:

  • id
  • atitle
  • proid

说明:

  • 因为省没有所属的省份,所以可以填写为null
  • 城市所属的省份pid,填写省所对应的编号id
  • 这就是自关联,表中的某一列,关联了这个表中的另外一列,但是它们的业务逻辑含义是不一样的,城市信息的pid引用的是省信息的id
  • 在这个表中,结构不变,可以添加区县、乡镇街道、村社区等信息

创建areas表的语句如下:

1
2
3
4
5
create table areas(
aid int primary key,
atitle varchar(20),
pid int
);
  • sql文件中导入数据
1
source areas.sql;
  • 查询一共有多少省
1
select count(*) from areas where pid is null;
  • 例1:查询省的名称为“山西省”的所有城市:
1
2
3
select city.* from areas as city
inner join areas as province on city.pid=province.aid
where province.atitle='山西省';
  • 例2:查询市的名称为“广州市”的所有区县:
1
2
3
select dis.* from areas as dis
inner join areas as city on city.aid=dis.pid
where city.atitle='广州市';

子查询

子查询

在一个select语句中,嵌入了另外一个select语句, 那么被嵌入的select语句称之为子查询语句

主查询

主要查询的对象,第一条select语句

主查询和子查询的关系

  • 子查询是嵌入到主查询中
  • 子查询是辅助主查询的,要么充当条件,要么充当数据源
  • 子查询是可以独立存在的语句,是一条完整的select语句

子查询分类

  • 标量子查询:子查询返回的的结果是一个数据(一行一列)
  • 列子查询:返回的结果是一列(一列多行)
  • 行子查询:返回的结果是一行(一行多列)
标量子查询
  • 查询班级学生的平均年龄
  • 查询大于平均年龄的学生

查询班级学生的平均身高:

1
select * from students where age > (select avg(age) from students);
列级子查询
  • 查询还有学生在班的所有班级名字
    • 找出学生表中所有的班级id
    • 找出班级表中对应的名字
1
select name from classes where id in (select cls_id from students);
行级子查询
  • 需求:查找班级年龄最大,身高最高的学生
  • 行元素:将多个字段合成一个行元素,在行级子查询中会使用到行元素
1
select * from students where (height,age) = (select max(height),max(age) from students);
子查询中特定关键字使用
  • in范围
    • 格式: 主查询 where 条件 in (列子查询)

总结

查询的完整格式

1
2
3
4
5
6
7
8
SELECT select_expr [,select_expr,...] [      
FROM tb_name
[WHERE 条件判断]
[GROUP BY {col_name | postion} [ASC | DESC], ...]
[HAVING WHERE 条件判断]
[ORDER BY {col_name|expr|postion} [ASC | DESC], ...]
[ LIMIT {[offset,]rowcount | row_count OFFSET offset}]
]
  • 完整的select语句
1
2
3
4
5
6
select distinct *
from 表名
where ....
group by ... having ...
order by ...
limit start,count
  • 执行顺序为:

    • from表名
    • where……
    • group by
    • select distict *
    • having……
    • order by……
    • limit start,count
  • 实际使用中,只是语句中某些部分的组合,而不是全部

----------------本文结束感谢您的阅读----------------
坚持原创技术分享,您的支持将鼓励我继续创作!
0%