1. 首页
  2. 公司真题
  3. 大数据面试

广州世*信息



1、50个人的并发量也很低,为什么会出现系统页面数据显示过慢?
2、在项目中哪里运用了数据建模
3、有很多消息队列技术,为什么选择kafka ?----kafka的特性方面回答
4、如何将hive中提取的特征值写入mysql
5、HBase物理模型
6、实习主要做了什么,用什么技术栈
7、spark Core与spark的内存设置,上限,与原则
8、ORC、Parquet等列式存储的优点
9、你说几个项目指标,怎么计算的,sq1怎么写
10、平时在开发spark的时候遇到什么问题(比如内存溢出)
11、HiveSQL 转MapReduce join 实现怎么处理join关系。写程序,怎么实现两个表join
12、差不多4个sql的题,就是他说然后说语句给他
13、使用的资源调度器?
14、数据倾斜的产生和解决办法?

发布者:admin,如若转载,请注明出处:https://ai1024.vip/33894.html

QR code
//