1. 首页
  2. 公司真题
  3. 大数据面试

北京晖*科技



1、spark并行度怎么设置比较合适
2、随机森林原理
3、数仓分层的设计和逻辑
4、Hive,Hive on Spark和SparkSQL区别?
5、如果数据量太大,应该怎么存储?(压缩?,存储格式?,小文件的处理?)每个都聊一下,区别是啥
6、描述一下开发经历
7、ReduceByKey和Reduce的区别是什么呢?
8、flume有哪些组件,flume的source、channel、sink具体是做什么的?
9、有三次面试,一次初始,在实时.离线都要问,第二次项目经理电话面试,问的相对比较底层,第三次复试,问的项目问题交多
10、推荐系统项目细节,角色,做了什么

发布者:admin,如若转载,请注明出处:https://ai1024.vip/33646.html

QR code
//