1. 首页
  2. 公司真题
  3. 大数据面试

北京基**信息科技



1、怎么出查看文件里面有哪些特定的字段?
2、Spark sql对信息进行过哪些处理?
3、调度系统设计
4、Azkaban跑在多少个服务器上
5、hive的调优
6、分区中区分静态分区和动态分区,怎么定义静态分区和动态分区?还有有什么区别吗?
7、平时逛不逛社区,有没有参与过开源项目
8、项目中用到的hive存储结构有哪些,采用的什么方式压缩的
9、大概说一下wordcount的实现过程,用到过那些函数?
10、介绍一下spark运行流程
11、Redis 原子性怎么保证的?
12、TCP和UDP区别,三次握手,TIME_WAIT状态
13、map join和reduce join的区别
14、内部表和外部表的区别?
15、sql的存储过程你理解嘛!?

发布者:admin,如若转载,请注明出处:https://ai1024.vip/33742.html

QR code
//