1. 首页
  2. 公司真题
  3. 大数据面试

北京火*有限公司



1、kettle的原理?
2、kafka为什么要分多个partition?
3、HDFSNameNode高可用如何实现,需要哪些角色.YARN有哪些组件,如何分配资源
4、sql的优化.简述sql调优的一般过程,至少包含如何发现慢sql,如何定位原因,如何优化.
5、Yarn支持的调度器及管理硬件资源种类
6、CAP理论,分区容错性的意义
7、找出二叉树中任意两个节点的最低公共根节点,如果树是BST呢.深度优先搜索+二分查找树性质
8、splitsize 如何确定,算法
9、你们spark任务是怎么进行资源分配的?
10、mysql,mongodb,rides的端口
11、推荐系统的应用一堆扯
12、设计hbase表需要注意的点,在用hbase遇到过什么问题
13、索引的缺点
14、设计一个栈,包含出栈,入栈,是否为空等

发布者:admin,如若转载,请注明出处:https://ai1024.vip/33982.html

QR code
//