1. 首页
  2. 大数据
  3. Hadoop

介绍下Hadoop和Spark的差异吗?



被问到也不要惊讶,面试官往往通过你对于不同技术的差异描述,就能看出你是不是真的具有很强的学习能力。

||Hadoop|Spark|
|-|-|-|
|类型|基础平台,包含计算,存储,调度|分布式计算工具|
|场景|大规模数据集上的批处理|迭代计算,交互式计算,流计算|
|价格|对机器要求低,便宜|对内存有要求,相对较贵|
|编程范式|MapReduce,API 较为底层,算法适应性差|RDD组成DAG有向无环图,API较为顶层,方便使用|
|数据存储结构|MapReduce中间计算结果存在HDFS磁盘上,延迟大|RDD中间运算结果存在内存中,延迟小|
|运行方式|Task以进程方式维护,任务启动慢|Task以线程方式维护,任务启动快|

发布者:admin,如若转载,请注明出处:https://ai1024.vip/36902.html

QR code
//