首页 >> 百科

sql数据库基础知识(数据库分析的基本步骤和技巧)

2022-09-08 百科 182 作者:admin

在数据分析面试中,有一种知识绝对是面试官考察的最重要的内容,但很多人往往忽略了它,那就是——数据库和SQL!

你可以把数据想象成文件夹,数据库就是文件柜,而这个文件柜存储了大量的数据,不管数据是什么,也不管它是如何组织的

这里请注意,人们经常使用术语数据库来指代他们使用的数据库软件,这是不正确的,并且是您过去混淆的根源

准确的说数据库软件应该叫DBMS,也就是数据库管理系统。数据库由 DBMS 创建和操作。比如我们可以在sql 中创建一个数据库

也就是说,DBMS 就像一个图书管理员,你不直接访问数据库,而是使用 DBMS 访问数据库,让图书管理员为你找到一个文件柜。

这里所说的数据库是指数据库管理系统。根据早期的数据库理论,目前流行的数据库模型主要有层次数据库、网格数据库和关系数据库三种。

在当今的互联网公司中,最常用的数据库模型有两种,即关系型数据库和非关系型数据库。

关系数据库模型将复杂的数据结构简化为简单的二元关系(即二维表)

在关系型数据库中,几乎所有对数据的操作都是基于一个或多个关系表,而数据管理是通过对这些关联表进行排序、合并、连接或选择等操作来实现的。

关系类型通俗的理解是数据以二维数组的形式存在,可以理解为图书馆书籍的排列方式。

书架和地板可以理解为关系数据结构。书籍作为数据存在,所有图书馆员都是不同任务的数据库进程。有的人灭火(数据恢复、备份),有的人整理书架和书籍(数据整理、归档),而用户流程是指来图书馆的客户,他们看书,搬书,管理员会维护它。

关系数据库从诞生到现在已经40多年了,从理论到开发再到产品实现,如:

普通的MySQL和数据库已经在数据库领域上升到了霸主地位,形成了每年数百亿的巨大产业市场,而MySQL也是一个不容忽视的数据库,因此被收购很多钱。

非关系型数据库也称为 NoSQL 数据库。 NoSQL的原意是“Not Only SQL”,指的是非关系型数据库,不是“NO SQL”

因此,NoSQL的产生并不是要完全否定关系型数据库,而是作为对传统数据库的有效补充,在特定场景下能发挥出难以想象的高效率和高性能。

NoSQL 是对非关系型数据库的广义定义,它打破了关系型数据库和 ACID 理论长期以来的统一。 NoSQL 数据存储不需要固定的表结构,通常没有连续的操作。具有关系型数据库在大数据访问中无法比拟的性能优势。

那么,作为最常见的SQL关系型数据库,它是如何存储数据的呢?

1、表:

当你将文件夹放入文件柜时,不能只是把它们扔到抽屉里就完成了,而是在文件柜中创建文件,然后将相关信息放入相关文件中,这就是数据库表。

表是用于存储某种类型数据的结构化文件。比如这样一个sql文件包含20多个数据库表,每个表的名字不应该相同,但是我们可以在不同的数据库中存储同名的数据表。

同时我们不能把学生数据和教师数据放在同一张表中,这样会导致我们很难提取数据,而且检索和访问也很麻烦,所以我们应该创建两张表, 每个列表一个。

2、栏目:

列是组成表格的字段信息。一个表可以由一个或多个列组成。

我们可以理解为,每一列就是数据库表中的每一个字段。比如下面的学生id栏、学生姓名栏、考试成绩栏就是三个字段。

正确地将数据分解为多列非常重要。例如,班级和学生姓名应该是独立的列。通过分解它们,可以使用特定的队列数据进行排序和过滤。如果将学生姓名和班级合并在一列中,按班级筛选将非常困难。

数据库中的每一列都有对应的数据类型,它定义了该列可以存储的数据类型。

例如,如果列存储数字,则对应的数据类型应该是数字。如果该列存储日期、文本、注释、金额等,则应使用适当的数据类型对其进行指定。

数据类型:允许的数据类型,每一列都应该有对应的数据类型,限制了存储的数据形式。

3、行:

数据库表中的数据是按行存储的,每一行是一个存储的数据,比如第一行是张三的数据,第二行是李四的数据。

4、主键:

表中的每一行都应该有一个可以唯一标识自己的列。比如在学生信息表中,我们不能用学生的名字作为主键,因为我们会发现一旦出现同名,就会有两个不同的数据;

当然,考试成绩不能作为主键。比如按照“90分”作为主键提取时,我们也会提取两条数据;

所以我们应该使用学生证作为主键,因为学生证反正不会重复,是唯一的,所以可以作为主键。

所以主键是唯一区分数据表行的标识符,用来表示特定的行。

如果没有主键,我们很难更新或删除表中的特定行。它必须满足两个条件:

没有两行应该有相同的主键值

每一行必须有一个主键值(主键列不存在空值)

在数据库中,可以关联不同的表,依赖于主键,比如下面两张表:

比如上面两张图,左图是学生信息表,右图是老师信息表。左图中的主键是学生证,右图的主键是教师证。细心的读者可能会发现,右图中还有一张学生证。这里的学生证是专门用来加入用户表的,不是主键。只是这两张表是通过学生证的唯一信息关联起来的。

但是两个表的关系并不是信息之间的一一对应关系,也会有空缺,比如:

所以,要想知道数据库的内容,首先要了解sql、sql 、mysql,以及数据库和数据库管理系统的区别,因为网上很多人学数据分析,到处找资料,这些术语在不同的资料中被滥用,造成大家的困惑,也增加了大家理解SQL的难度。

关于我们

最火推荐

小编推荐

联系我们


Copyright 8S新商盟 Rights Reserved.
联系YY号:2949821684
邮箱:chenjing919994@sohu.com
备案号:浙ICP备2023016511号-1