1. 首页
  2. 公司真题
  3. 大数据面试

成都国**有限公司



1、kafka如何保证生产者端只生产一次?
2、spark提交流程
3、数据库与Redis缓存一致问题。
4、改造hive表后怎么进行数据一致性校验的,有没有自动化流程
5、说明一下防抖和节流,代码实现他们
6、打标签一共有多少个标签?
7、hive里面的分区和分桶
8、项目中数据仓库是怎么分层的?
9、Hive自定义那些UDF函数,你们都处理过哪些??
10、linux的基本命令有哪些?常用的是哪些?sed和awk的区别是什么?
11、Linux命令(内存占用)
12、介绍一下kafka的事务?
13、Consumer Group中Consumer和Partition的对应关系?
14、Spark的Shuffle原理及调优?

发布者:admin,如若转载,请注明出处:https://ai1024.vip/33864.html

QR code
//