
hive
文章平均质量分 70
hive是基于Hadoop的一个数据仓库工具
黑冰vip
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Day16_分区表创建及加载数据
房屋建筑时间分布 year_group 5年以内 10年以内 15年以内 20年以内 20年以上 分析: build_date 获取 房龄 1987年建 截取字符串 use second_house; SELECT t.year_group, COUNT(1) AS total FROM( SELECT build_date, CASE WHEN (2018 - ...原创 2021-05-23 19:21:41 · 595 阅读 · 0 评论 -
Day15_20180503_链家二手房信息案例分析
一、回顾 -》Hive:为用户提供SQL接口来操作Hadoop的工具 -》将hdfs上的文件映射成表 -》将SQL语句转换为MapReduce程序提交给yarn -》hive的使用 -》client:HQL -》-e:在Linux shell中执行一条命令 -》-f:在Linux shell中执行一个sql文件 注意:实际工作中 -》使用脚本,将SQL语句封装到一个SQL...原创 2021-05-23 14:41:29 · 1029 阅读 · 0 评论 -
Day14_20180426_Hive元数据配置及开发使用
一、回顾 -》hive的功能 -》将SQL转换成了MapReduce程序提交给yarn去运行 -》将HDFS上的文件映射成了表 -》hive的组件 -》Hadoop: -》存储:hdfs -》计算:MapReduce -》metastore:整个数据库中所有的scheme信息 -》表与hdfs的映射 -》文件与表的映射 ...原创 2021-05-23 09:24:49 · 298 阅读 · 3 评论 -
day13
2号晚上12点之前提交Hadoop笔记 -》重难点 -》二次排序、HA、yarn、hdfs -》MarkDown/有道笔记 -》提交方式:邮箱,姓名+hadoop笔记 一、介绍Hive -》来源:Facebook -》2008年 -》原因: -》MapReduce编程十分麻烦 -》driver、Mapper、reduce ...原创 2021-05-22 13:12:40 · 146 阅读 · 0 评论