北京火*有限公司

admin • 2023年11月30日 am2:37 • 大数据面试 • 阅读 83

1、kettle的原理？
2、kafka为什么要分多个partition？
3、HDFSNameNode高可用如何实现，需要哪些角色.YARN有哪些组件，如何分配资源
4、sql的优化.简述sql调优的一般过程，至少包含如何发现慢sql，如何定位原因，如何优化.
5、Yarn支持的调度器及管理硬件资源种类
6、CAP理论，分区容错性的意义
7、找出二叉树中任意两个节点的最低公共根节点，如果树是BST呢.深度优先搜索+二分查找树性质
8、splitsize 如何确定，算法
9、你们spark任务是怎么进行资源分配的?
10、mysql，mongodb，rides的端口
11、推荐系统的应用一堆扯
12、设计hbase表需要注意的点，在用hbase遇到过什么问题
13、索引的缺点
14、设计一个栈，包含出栈，入栈，是否为空等

发布者：admin，如若转载，请注明出处：https://ai1024.vip/33982.html

北京火*有限公司

相关推荐

上海新**科技

北京辉**科技

上海同*有限公司

上海和*公司

北京晖*科技

广州世*信息

请登录