北京晖*科技

北京晖*科技

admin • 2023年11月30日 am2:31 • 大数据面试 • 阅读 66

1、spark并行度怎么设置比较合适
2、随机森林原理
3、数仓分层的设计和逻辑
4、Hive，Hive on Spark和SparkSQL区别？
5、如果数据量太大，应该怎么存储？（压缩？，存储格式？，小文件的处理？）每个都聊一下，区别是啥
6、描述一下开发经历
7、ReduceByKey和Reduce的区别是什么呢？
8、flume有哪些组件，flume的source、channel、sink具体是做什么的?
9、有三次面试,一次初始,在实时.离线都要问,第二次项目经理电话面试,问的相对比较底层,第三次复试,问的项目问题交多
10、推荐系统项目细节，角色，做了什么

发布者：admin，如若转载，请注明出处：https://ai1024.vip/33646.html

相关推荐

西安协*信息科技

上海欣**科技

北京江*科技

天津洪**公司

深圳禾**软件

广州木*科技

请登录