天津浩**技术服务

admin • 2023年11月30日 am2:33 • 大数据面试 • 阅读 65

1、链表倒数第K个数（讲思路）
2、Kmeans的过拟合与欠拟合？
3、Spark的性能调优？
4、spark优化
5、map跟mappartition的区别，哪个性能更好一些
6、hadoop的块大小，从哪个版本开始是128M?
7、kafka为什么要设5个分区
8、对于Spark你觉得他对于现有大数据的现状的优势和劣势在哪里？
9、cluster by,distribute by,sort by,order by区别？
10、redis分布式锁怎么实现
11、MapReduce 中排序发生在哪几个阶段？这些排序是否可以避免？为什么？
12、MapReduce中容易发生数据倾斜，是怎么产生的，如何处理？
13、数仓建设流程
14、关于flink的了解？

发布者：admin，如若转载，请注明出处：https://ai1024.vip/33744.html

天津浩**技术服务

相关推荐

深圳广*信息

广州福*技术开发

北京同*科技公司

深圳旭*信息科技

广州吕*软件技术

杭州宏**软件

请登录