1. 首页
  2. 公司真题
  3. 大数据面试

天津浩**技术服务



1、链表倒数第K个数(讲思路)
2、Kmeans的过拟合与欠拟合?
3、Spark的性能调优?
4、spark优化
5、map跟mappartition的区别,哪个性能更好一些
6、hadoop的块大小,从哪个版本开始是128M?
7、kafka为什么要设5个分区
8、对于Spark你觉得他对于现有大数据的现状的优势和劣势在哪里?
9、cluster by,distribute by,sort by,order by区别?
10、redis分布式锁怎么实现
11、MapReduce 中排序发生在哪几个阶段?这些排序是否可以避免?为什么?
12、MapReduce中容易发生数据倾斜,是怎么产生的,如何处理?
13、数仓建设流程
14、关于flink的了解?

发布者:admin,如若转载,请注明出处:https://ai1024.vip/33744.html

QR code
//