雪花食谱

书籍描述

用雪花的独特建筑和集成能力开发现代解决方案;将批量和实时数据流入数据湖;并利用时间旅行,克隆和数据共享功能来优化数据操作

主要特征

  • 使用一体化雪花平台构建和缩放现代数据解决方案
  • 执行高级云分析,以实现大数据和数据科学解决方案
  • 通过揭示您的数据的关键见解来制作更快和更好的业务决策

书籍描述

Snowflake是一种独特的基于云的数据仓库平台,从头开始,在云上执行数据管理。本书向您介绍了雪花的独特建筑,将其放在云数据仓库的最前沿。

您将浏览雪花的计算模型,并找出雪花如何允许通过虚拟仓库进行广泛的扩展。然后,您将学习如何配置虚拟仓库以优化成本和性能。继续前进,您将掌握数据生态系统,并发现雪花如何与其他技术进行集成,用于分期和加载数据。

当您通过章节进行时,您将利用Snowflake的功能来处理一系列SQL语句,使用任务构建数据管道,并了解如何创建现代数据解决方案和管道,旨在提供高性能和可扩展性。您还将使用创建角色层次结构,添加自定义角色,以及在涵盖数据共享,克隆和性能优化等高级主题之前为用户设置默认角色。

在这本雪花书的最后,您将在雪花的架构中进行融合,以建立现代分析解决方案,并了解使用实用食谱解决常见问题的最佳实践。

你会学到什么

  • 使用与雪花的云架构对齐的数据仓储技术来掌握
  • 将您的技能拓宽为数据仓库设计师,以覆盖雪花生态系统
  • 从内部部署数据仓库转移技能到雪花云分析平台
  • 优化与雪花解决方案相关的性能和成本
  • 对象存储的阶段数据存储并将其加载到雪花中
  • 安全数据并有效地分享访问权限
  • 使用存储过程管理交易并扩展雪花
  • 使用Spark Connector扩展云数据应用程序

这本书是谁

本书用于数据仓库开发人员,数据分析师,数据库管理员以及任何参与设计,实施和优化雪花数据仓库的人。对数据仓库和数据库和云概念的知识将是有用的。与雪花的基本熟悉是有益的,但没有必要。

出版商资源

下载示例代码

目录

  1. 雪花食谱
  2. 贡献者
  3. 关于作者
  4. 关于审稿人
  5. 前言
    1. 这本书是谁
    2. 这本书覆盖了什么
    3. 充分利用这本书
      1. 下载示例代码文件
    4. 下载彩色图像
    5. 使用的约定
    6. 章节
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
      4. 还有更多…
      5. 也可以看看
    7. 保持联系
    8. 评论
  6. 第1章:雪花入门
    1. 技术要求
    2. 创建新的雪花实例
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    3. 创建量身定制的多集群虚拟仓库
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
      4. 还有更多…
    4. 使用雪花WebUI并执行查询
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    5. 使用snowsql连接到雪花
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
      4. 还有更多…
    6. 与JDBC连接到雪花
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
      4. 还有更多…
    7. 创建一个新的帐户管理员用户和了解内置角色
      1. 怎么做…
      2. 这个怎么运作…
      3. 还有更多…
  7. 第2章:管理数据生命周期
    1. 技术要求
    2. 管理数据库
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
      4. 还有更多…
    3. 管理模式
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
      4. 还有更多…
    4. 管理表
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
      4. 还有更多…
    5. 管理外部表和阶段
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
      4. 还有更多…
    6. 在雪花中管理视图
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
      4. 还有更多…
  8. 第3章:将数据加载和提取到雪花中
    1. 技术要求
    2. 配置雪花进入私人S3桶
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    3. 从云存储将分隔的散装数据加载到雪花中
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    4. 将分隔的散装数据从本地机器加载到雪花中
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    5. 将木质文件加载到雪花中
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    6. 使JSON半结构化数据感和转换为关系视图
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    7. 将换行符分隔的JSON(或NDJSON)处理到雪花桌中
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    8. 使用雪橇处理近实时数据的雪花桌子
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    9. 从雪花中提取数据
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
  9. 第4章:在雪花中建立数据管道
    1. 技术要求
    2. 创建和安排任务
      1. 准备好
      2. 这个怎么运作…
    3. 通过任务树共轭管道
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    4. 查询和查看任务历史记录
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    5. 探索流的概念来捕获表级更改
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    6. 结合流和任务的概念,构建流水线,处理计划更改数据
      1. 怎么做…
      2. 这个怎么运作…
    7. 转换数据类型和雪花的故障管理
      1. 怎么做…
      2. 这个怎么运作…
      3. 还有更多…
    8. 使用不同的实用程序函数管理上下文
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
      4. 还有更多…
  10. 第5章:雪花中的数据保护和安全性
    1. 技术要求
    2. 设置自定义角色并完成角色层次结构
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
      4. 还有更多…
    3. 配置和分配给用户的默认角色
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
      4. 还有更多…
    4. 从安全性和角色管理中描绘用户管理
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    5. 配置自定义角色以管理对高度安全数据的访问
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    6. 设置开发,测试,预生产和生产数据库层次结构和角色
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    7. 在会计师角色中保护AccountAdmin角色和用户
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
  11. 第6章:性能和成本优化
    1. 技术要求
    2. 检查表模式并导出表格的最佳结构
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    3. 识别查询计划和瓶颈
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    4. 通过分析进行效率低下的疑问
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    5. 识别和减少不必要的故障安全和时间旅行存储使用
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    6. 雪花中的预测
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
      4. 还有更多…
    7. 查看查询计划修改表群集
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    8. 优化虚拟仓库量表
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
  12. 第7章:安全数据共享
    1. 技术要求
    2. 与另一个雪花账户共享表格
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    3. 通过与另一个雪花账户的视图共享数据
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    4. 使用另一个雪花账户共享完整的数据库并设置将来的对象设置为可共享
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    5. 创建读者帐户并为非雪花共享配置它们
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
      4. 准备好
      5. 怎么做…
      6. 这个怎么运作…
    6. 使用非雪花用户共享数据时保持支票的成本
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
  13. 第8章:随着时间的旅行回到未来
    1. 技术要求
    2. 使用时间行程在特定时间返回数据状态
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    3. 使用时间行程从意外丢失表数据中恢复
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    4. 识别丢弃的数据库,表格和其他对象并使用时间旅行恢复它们
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    5. 使用时间行程与克隆一起改善调试
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    6. 使用Cloning迅速地建立新环境的新环境
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
  14. 第9章:高级SQL技术
    1. 技术要求
    2. 管理时间戳数据
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    3. 粉碎日期数据以提取日历信息
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    4. 独特的计数和雪花
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    5. 在雪花中管理交易
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    6. 在窗框框架上有序分析
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
    7. 在雪花中产生序列
      1. 准备好
      2. 怎么做…
      3. 这个怎么运作…
  15. 第10章:扩展雪花功能
    1. 技术要求
    2. 使用SQL创建标量用户定义的函数
      1. 准备好
      2. 怎么做...
      3. 这个怎么运作...
    3. 使用SQL创建表用户定义的函数
      1. 准备好
      2. 怎么做
      3. 这个怎么运作
    4. 使用JavaScript创建标量用户定义的函数
      1. 准备好
      2. 怎么做
      3. 这个怎么运作
    5. 使用JavaScript创建表用户定义的函数
      1. 准备好
      2. 怎么做
      3. 这个怎么运作
    6. 将雪花与apache spark连接
      1. 准备好
      2. 怎么做
      3. 这个怎么运作
    7. 使用Apache Spark为在雪花上准备存储数据
      1. 准备好
      2. 怎么做
      3. 这个怎么运作
    8. 为何订阅?
  16. 您可以享受的其他书籍
    1. Packt正在寻找像你这样的作者
    2. 留下审查 - 让其他读者知道您的想法

产品信息

  • 标题:雪花食谱
  • 作者:Hamid Mahmoodqureshi,Hammad Sharif
  • 发布日期:2021年2月
  • 出版商:Packt Publishing.
  • ISBN:9781800560611.