众所周知,海牛大数据交流群中藏龙卧虎,隐藏着很多能去大厂的高手,今天我们就为大家奉上一份来自大厂的面试真题,没有答案,需要大家自行解答,查找资料,提升自己的技术实力。
后续我们会陆续推出高手的大厂面试真人经验,敬请期待。有不明白的技术问题,大数据相关的各种问题,也可以私信或者留言与我们讨论。
面试真题:
1.自我介绍一下?
2.介绍一下最近的项目?
3.目前在研究什么技术?
4.如何判定一个表是事实表还是维度表?
5.数据建模过程说一下?
6.三范式知道吗,说一下?
7.数据仓库模型建设可以使用范式建模吗,你是怎么看的?
8.缓慢变化维处理方式?
9.大宽表的优点与缺点?
10.拉链表的实现逻辑说一下?
11.Mapreduce执行流程说一下?
12.Shulffle过程瓶颈在哪里,你会怎么解决?
13.你刚说到会有小文件和数据倾斜,这个怎么处理?
14.空值key加随机数是一种数据倾斜解决方案,如果有单个key是热点值呢?又如果有多个key是热点值呢?用参数和代码分别怎么解决?
15.Kylin调优?
16.Kylin的优点和缺点?
17.Kylin的rowkey如何设计?
18.Kylin的cuboid,cube和segment的关系?
19.一张hive宽表有5个维度,kylin构建cube的时候我选了4个维度,我select *的时候会有几个维度字段?
20.其他olap工具有了解过吗?
21.Flink savepoint和checkpoint?
22.Flink算子记得哪些?
23.Flink map和flatmap比较?
24.flink双流join说一下?
25.flink两段提交原理说一下?
26.你们数仓用的是hive还是spark,你平常怎么选择?
27.Hive优化说一下
28.用你最熟悉的编程语言(java,python,scala)写一个二分查找(牛客网在线写)
29.订单表,t_order, 字段,user_id,order_id,ctime(10位时间戳),city_id,sale_num,sku_id(商品)
问题:20201201至今每日订单量top10的城市及其订单量(订单量对order_id去重)(在线写)
30.你有什么想问我的吗?

总结
以上就是今天的内容了,如果对你有所帮助,希望你能够关注、点赞、转发一键三连支持一下。
需要完整学习线路和配套课堂笔记,请直接回复111。
后续我们会陆续推出高手的大厂面试真人经验,敬请期待。有不明白的技术问题,大数据相关的各种问题,也可以私信或者留言与我们讨论。
面试真题:
1.自我介绍一下?
2.介绍一下最近的项目?
3.目前在研究什么技术?
4.如何判定一个表是事实表还是维度表?
5.数据建模过程说一下?
6.三范式知道吗,说一下?
7.数据仓库模型建设可以使用范式建模吗,你是怎么看的?
8.缓慢变化维处理方式?
9.大宽表的优点与缺点?
10.拉链表的实现逻辑说一下?
11.Mapreduce执行流程说一下?
12.Shulffle过程瓶颈在哪里,你会怎么解决?
13.你刚说到会有小文件和数据倾斜,这个怎么处理?
14.空值key加随机数是一种数据倾斜解决方案,如果有单个key是热点值呢?又如果有多个key是热点值呢?用参数和代码分别怎么解决?
15.Kylin调优?
16.Kylin的优点和缺点?
17.Kylin的rowkey如何设计?
18.Kylin的cuboid,cube和segment的关系?
19.一张hive宽表有5个维度,kylin构建cube的时候我选了4个维度,我select *的时候会有几个维度字段?
20.其他olap工具有了解过吗?
21.Flink savepoint和checkpoint?
22.Flink算子记得哪些?
23.Flink map和flatmap比较?
24.flink双流join说一下?
25.flink两段提交原理说一下?
26.你们数仓用的是hive还是spark,你平常怎么选择?
27.Hive优化说一下
28.用你最熟悉的编程语言(java,python,scala)写一个二分查找(牛客网在线写)
29.订单表,t_order, 字段,user_id,order_id,ctime(10位时间戳),city_id,sale_num,sku_id(商品)
问题:20201201至今每日订单量top10的城市及其订单量(订单量对order_id去重)(在线写)
30.你有什么想问我的吗?

总结
以上就是今天的内容了,如果对你有所帮助,希望你能够关注、点赞、转发一键三连支持一下。
需要完整学习线路和配套课堂笔记,请直接回复111。