欢迎来到第五章,在这一章中,我们将学习 Tableau 中的连接数据,以及应该选择哪一个。
如果你想浏览其他章节,请访问: Tableau :这是什么?为什么它是最好的?;Tableau 桌面专家认证之路。
如果你想直接上 Tableau 桌面专家笔记,请在这里访问→https://dakshtrehan . comment . site/Tableau-Notes-c 13 fceda 97 b 94 BDA 940 edbf 6751 cf 30
使用链接访问免费 Tableau 认证转储(有效期至 2022 年 7 月 6 日):
当我们连接数据时, Tableau 让我们以不同的方式连接数据,每种方式对于特定的数据类型和用例都是唯一的。
每当我们向 Tableau 添加数据源时,我们就创建了一个数据模型。顾名思义,它指定了 Tableau 应该如何查询不同的表来组合数据。一个数据模型可以包含一个表或多个表,这些表使用不同的关系、连接、联合组合。
数据模型的分解视图
- 逻辑层&物理层
- 关系
- 加入
- 工会
- 数据混合
- 选哪个?
- 本题的样题
Tableau 数据模型由两层组成:
逻辑层 →我们的数据源页面中默认的数据画布视图就是我们的逻辑层。它能够使用*关系(或面)*来连接数据。当组合来自多个表的数据时,我们不指定逻辑层中的连接,而是执行关系,其中 Tableau 基于数据和分析自动选择适当的连接类型。在逻辑层中形成的表被称为逻辑表。
逻辑层
在早期的 Tableau 版本中,只有物理层,但从 v2020.2 开始,Tableau 引入了关系&逻辑层。逻辑层中的表不会合并,而是保持不同。
逻辑层由合并的物理表和其他逻辑表组成。逻辑表可以包含一个或多个与联合或连接相关联的物理表。
物理层 →这可以看作是一个子逻辑层,要访问它,双击一个逻辑表。它支持使用连接/联合来组合数据。在物理层连接的表被称为物理表,在转换后被合并成一个平面表。
逻辑层中的联合
逻辑层中的联接
Tableau 中关系的视觉提示。
关系是 Tableau 刚刚推出的 USP。它使得数据连接对所有人来说都很容易,,并且不特别需要连接/联合的知识。这些用面条状的结构表示,在数据画布页面上很容易找到。
**只能在逻辑层建立关系。**这就像两个基于匹配字段的表之间的契约,contact Tableau 自动执行适当的连接并组合数据。
匹配字段必须具有相同的数据类型,匹配列是否来自相同的数据源并不重要。关系不支持地理数据类型作为匹配字段。
关系需要至少一个数据源。
关系保留原来的表结构。
不能在已发布的数据源上定义关系。
关系在本地计算。
发布数据源后,不能编辑关系。
当我们使用关系连接多个表时,Tableau 会自动检测同名字段并创建一个关系。如果数据源有不同的字段名,Tableau 会要求用户定义匹配的列。
为了提高性能,我们可以修改基数并研究引用完整性。但是,大多数时候,最好是把它留给画面。
Tableau 中连接的可视提示
连接是一种基于特定条件组合数据的传统方法。在 Tableau 中,连接只能在物理层中完成。要创建连接,请双击逻辑表。
连接总是会创建一个新表。
连接将数据组合起来,然后进行聚合。
连接是静态的。
至少需要一个数据源。
可适用于多种数据连接。
将不同聚合或不同细节级别的数据连接在一起会导致数据重复。
Tableau 支持四种类型的连接:内、外、左、右。
举例来说,我们拿两个表:名字和标记。
内部连接→ 它只表示两个表中相同的值。如果一个值在任一表中不完全匹配,它将被立即删除。
在我们的示例中,我们刚刚标记了 StudentID 1、3、5,因此,我们分别为这些 ID 获得了学生姓名。
外部连接→ 它代表两个表中的所有值,如果任何一个表中的值不匹配,那里就会有一个空值。
在我们的例子中,因为我们在两个表中只有 3 个匹配的行,其他表的标记被指定为 null 。
右连接→ 它代表右表中的所有值,如果左右表中的某个值不匹配,它将被赋值为 null 。
如果我们对表 Name & Marks 执行右连接,结果会有点像内连接*(内连接和右连接的每次结果不一定都相同)*。
但是,如果我们在标记&名称之间执行右连接,结果将完全不同,即类似外连接。
Left Join → 它代表左表中的所有值,如果右表中的某个值不匹配,它将被赋值为 null 。
如果我们在表 Name & Marks 上执行左连接,结果会有点像外连接*(外连接和左连接的每次结果不一定都相同)*。
但是,如果我们在标记&名称之间执行左连接,结果将完全不同,即类似于内连接。
跨数据库联接需要从多个连接中设置数据源
要创建跨数据库联接:
第一步:点击“添加”。
步骤 2:添加另一个连接。
第三步:一旦我们进入工作表,我们就可以在一个单一的数据源中找到所有的数据。我们可以在它们之间切换。
画面中结合的视觉线索
Union 是一种追加两个具有相同列数和数据类型的数据连接的方法。这发生在物理层,可以通过双击一个逻辑表来访问。
Union 总是会创建一个新表。
不同数据源的数据不能联合。
在联合中,Tableau 添加引用字段来帮助识别数据源。
联合表可用于创建连接。
可以通过两种方式完成联合:手动、通配符搜索
要创建手动联合,请进入物理层并单击“新建联合”。
该方法自动创建表之间的联合。通配符将有助于找到表名的特定模式。
它将创建一个名称中包含“Order”的所有文件的联合。
如果两个字段有不同的名称或者没有名称,我们可以要求 Tableau 根据表中数据的排序执行联合。
当两个表中的值不匹配时,它们将被联合表中的空值替换。我们可以将所有不匹配的字段合并在一起,以消除空值。
Tableau 中数据混合的可视提示
数据混合是连接 Tableau 中多个连接的数据的另一种方法。这最适合连接不同细节层次的数据,或者简单地说,连接不同文件格式的数据。
混合需要两个连接,即初级和次级。首先选择的连接将被认为是主要的,随后将是次要的。主要连接将由蓝色表示,而次要连接将由橙色表示。
一个混合体聚集然后结合。
混合保留原来的表结构。
数据混合是主表和辅助表之间的左外连接,辅助表中可能存在一些缺失数据。
数据混合特定于工作表,即不同的工作表有所不同。
数据源之间必须有一个共同的维度才能创建数据混合。
数据从未真正在 Blend 中组合,但每个数据源都被独立查询,结果被聚合并一起呈现。
混合数据不能发布到 Tableau Online 或 Tableau Server。
围绕非加性总量有一些数据混合限制,如 COUNTD、MEDIAN 和 RAWSQLAGG。
在回答这个问题之前,让我们回顾一下所有的加入类型:
关系&连接需要一个数据源,而混合需要至少两个数据源。
Relationship、Join、Blend 是在特定条件下绑定数据的方法,但 Union 只是追加数据。现在,竞争和困惑归结为三个竞争者: 关系,加入&交融。
"如果可以,利用关系;如果必须,加入;如果绝对必须,融合."多纳贝尔·桑托斯
地理字段/计算字段可以连接关系?
- 真实的
- 错误的
解:假
____ 和 ____ 保留原有的表格结构。
- 连接
- 关系
- 混合
- 联盟
解决方案:融合与关系
____ 和 _ _ _ _ _ 将始终创建一个新表。
- 加入
- 联盟
- 关系
- 混合
解决方案:连接和联合
使用哪种连接方法会导致添加参考字段?
- 加入
- 联盟
- 混合
- 关系
解决方案:联合
混合中的所有次要数据都必须汇总?
- 真实的
- 错误的
解:真
使用链接访问免费 Tableau 认证转储(有效期至 2022 年 7 月 6 日):
[2] 个人笔记
[3] Tableau 桌面专家考试(新花样— 2021) — Apisero
[4] sqlbelle
请随意鼓掌,这样我就知道这篇文章对你有多有帮助,并在你的社交网络上分享它,这对我会很有帮助。
如果你喜欢这篇文章,想了解更多机器学习,数据科学,Python,BI。请考虑订阅我的时事通讯:
在网上找到我:www.dakshtrehan.com
在 LinkedIn 与我联系:www.linkedin.com/in/dakshtrehan
阅读我的科技博客:www.dakshtrehan.medium.com
在 Instagram 和我联系:【www.instagram.com/daksh_trehan
YouTube 是如何利用人工智能推荐视频的? 利用深度学习检测新冠肺炎 逃不掉的 AI 算法:抖音 GPT-3 向一个 5 岁的孩子解释。 Tinder+AI:一场完美的牵线搭桥? 一个内部人士的使用机器学习卡通化指南 谷歌是如何做出“哼哼来搜索?” 单行神奇代码执行 EDA! 给我 5 分钟,我给你深度假!
欢呼