BigQuery:如何查询数据

在之前的BigQuery教程中,我们介绍了BigQuery体系结构,存储管理,以及将数据提取到BigQuery中。在本文中,我们将介绍使用SQL在BigQuery中查询数据,保存和共享查询,创建视图和实例化视图。

标准SQL

BigQuery支持两种SQL方言:标准SQL和旧式SQL。标准SQL是查询BigQuery中存储的数据的首选,因为它符合ANSI SQL 2011标准。与旧版SQL相比,它还有其他优点,例如JOIN操作的自动谓词下推以及对相关子查询的支持。有关更多信息,请参见标准SQL优点。

在BigQuery中运行SQL查询时,它会自动创建,安排和运行查询作业。BigQuery以两种模式运行查询作业: 交互(默认)和批量。

  • 交互式查询将尽快执行,并且这些查询将计入并发速率限制和每日限制。
  • 只要BigQuery共享资源池中有可用的空闲资源,批处理查询就会排队并开始,这通常在几分钟之内发生。如果BigQuery在24小时内仍未启动查询,则作业优先级将更改为“交互式”。批量查询不计入您的并发速率限制。它们使用与交互式查询相同的资源。

除非另有说明,否则本文中的查询均遵循标准SQL方言并以交互模式运行。

BigQuery表类型

BigQuery中的每个表格均由列名称,数据类型和其他元数据定义。BigQuery支持以下表格类型:

BigQuery:如何查询数据_第1张图片

BigQuery架构

在BigQuery中,架构是在表级别定义的,并为数据提供结构。架构描述列定义及其名称,数据类型,描述和模式。

  • 数据类型可以是简单的数据类型(例如整数),也可以是更复杂的数据类型,例如ARRAYSTRUCT
  • 列模式可以为NULLABLEREQUIREDREPEATED

在将数据加载到表中或创建空表时,可以指定表架构。或者,在加载数据时,您可以使用自动检测来识别源数据格式,也可以在JSON文件中定义架构,如图所示。

[  
 {
     
   "description": "[DESCRIPTION]",  
   "name": "[NAME]",  
   "type": "[TYPE]",  
   "mode": "[MODE]"  
 },  
 {
     
   "description": "[DESCRIPTION]",  
   "name": "[NAME]",  
   "type": "[TYPE]",  
   "mode": 

你可能感兴趣的:(数据工程,大数据,数据挖掘)