【面试真题】美团优选-数据仓库高级工程师面试真题（无答案）

众所周知，海牛大数据交流群中藏龙卧虎，隐藏着很多能去大厂的高手，今天我们就为大家奉上一份来自大厂的面试真题，没有答案，需要大家自行解答，查找资料，提升自己的技术实力。
后续我们会陆续推出高手的大厂面试真人经验，敬请期待。有不明白的技术问题，大数据相关的各种问题，也可以私信或者留言与我们讨论。
面试真题：
1.自我介绍一下？
2.介绍一下最近的项目？
3.目前在研究什么技术？
4.如何判定一个表是事实表还是维度表？
5.数据建模过程说一下？
6.三范式知道吗，说一下？
7.数据仓库模型建设可以使用范式建模吗，你是怎么看的？
8.缓慢变化维处理方式？
9.大宽表的优点与缺点？
10.拉链表的实现逻辑说一下？
11.Mapreduce执行流程说一下？
12.Shulffle过程瓶颈在哪里，你会怎么解决？
13.你刚说到会有小文件和数据倾斜，这个怎么处理？
14.空值key加随机数是一种数据倾斜解决方案，如果有单个key是热点值呢？又如果有多个key是热点值呢？用参数和代码分别怎么解决？
15.Kylin调优？
16.Kylin的优点和缺点？
17.Kylin的rowkey如何设计？
18.Kylin的cuboid,cube和segment的关系？
19.一张hive宽表有5个维度，kylin构建cube的时候我选了4个维度，我select *的时候会有几个维度字段？
20.其他olap工具有了解过吗？
21.Flink savepoint和checkpoint？
22.Flink算子记得哪些？
23.Flink map和flatmap比较？
24.flink双流join说一下?
25.flink两段提交原理说一下?
26.你们数仓用的是hive还是spark，你平常怎么选择？
27.Hive优化说一下
28.用你最熟悉的编程语言(java,python,scala)写一个二分查找(牛客网在线写)
29.订单表，t_order, 字段，user_id，order_id，ctime(10位时间戳)，city_id，sale_num，sku_id(商品)
问题:20201201至今每日订单量top10的城市及其订单量(订单量对order_id去重)(在线写)
30.你有什么想问我的吗？

总结
以上就是今天的内容了，如果对你有所帮助，希望你能够关注、点赞、转发一键三连支持一下。
需要完整学习线路和配套课堂笔记，请直接回复111。

感谢

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

1回复贴，共1页

<<返回海牛学院吧

分享到:

日	一	二	三	四	五	六