1. 首页
  2. 公司真题
  3. 大数据面试

上海新**科技



1、GIL锁的概念,python中如何实现并发
2、Flume的数据导入到了哪里?(Kafka),你负责的这个数据是怎么用的?
3、hive内部表 外部表
4、三范式
5、写一下单例模式,在多线程情况下呢?
6、如果要设计一个线程池,需要考虑哪些要素.Executors工厂类能创建哪些线程池,用过哪些
7、Kmeans的过拟合与欠拟合?
8、spark的UDF、UDAF、UDTF
9、hdfs存储机制是怎样的?(hdfs存储机制)
10、kafka的数据存在内存还是磁盘
11、线程有哪几种状态?Sleep和wait有什么不同?
12、Hbase版本和Phoenix版本整合

发布者:admin,如若转载,请注明出处:https://ai1024.vip/33928.html

QR code
//