成都国**有限公司

admin • 2023年11月30日 am2:35 • 大数据面试 • 阅读 72

1、kafka如何保证生产者端只生产一次？
2、spark提交流程
3、数据库与Redis缓存一致问题。
4、改造hive表后怎么进行数据一致性校验的，有没有自动化流程
5、说明一下防抖和节流，代码实现他们
6、打标签一共有多少个标签？
7、hive里面的分区和分桶
8、项目中数据仓库是怎么分层的?
9、Hive自定义那些UDF函数，你们都处理过哪些？？
10、linux的基本命令有哪些？常用的是哪些？sed和awk的区别是什么？
11、Linux命令（内存占用）
12、介绍一下kafka的事务？
13、Consumer Group中Consumer和Partition的对应关系?
14、Spark的Shuffle原理及调优？

发布者：admin，如若转载，请注明出处：https://ai1024.vip/33864.html

成都国**有限公司

相关推荐

上海亚*科技公司

苏州高**软件

北京干**信息科技

北京康*有限公司

深圳光*信息

长沙荣*信息

请登录