hadoop是干什么用的?

学习hadoop要有什么语言基础啊?java c 还是php啊

推荐答案 2019-06-21

提供海量数据存储和计算的。需要java语言基础。

Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上；而且它提供高吞吐量来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。

Hadoop的框架最核心的设计就是：HDFS和MapReduce。HDFS为海量的数据提供了存储，而MapReduce则为海量的数据提供了计算。

扩展资料

Hadoop是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。能够对大量数据进行分布式处理的软件框架Hadoop 以一种可靠、高效、可伸缩的方式进行数据处理。

Hadoop 是可靠的，因为它假设计算元素和存储会失败，因此它维护多个工作数据副本，确保能够针对失败的节点重新分布处理。Hadoop 是高效的，因为它以并行的方式工作，通过并行处理加快处理速度。

参考资料：百度百科-Hadoop

温馨提示：答案为网友推荐，仅供参考

当前网址：http://66.wendadaohang.com/zd/vUvspxxnipi2p9Dpxv.html

其他回答

第1个回答 2021-02-04

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。

hadoop简介：

充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统（ Distributed File System），其中一个组件是HDFS。HDFS有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上。

扩展资料：

优点：

1，高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖。

2，高扩展性。Hadoop是在可用的计算机集簇间分配数据并完成计算任务的，这些集簇可以方便地扩展到数以千计的节点中。

3，高效性。Hadoop能够在节点之间动态地移动数据，并保证各个节点的动态平衡，因此处理速度非常快。

4，高容错性。Hadoop能够自动保存数据的多个副本，并且能够自动将失败的任务重新分配。

5，低成本。与一体机、商用数据仓库以及QlikView、Yonghong Z-Suite等数据集市相比，hadoop是开源的，项目的软件成本因此会大大降低。

参考资料：百度百科——Hadoop

本回答被网友采纳

第2个回答 2015-01-30

要有java语言基础，和 linux系统命令基础。
hadoop是运行的系统要求是 linux。
hadoop 用 java写的分布式，处理大数据的框架。
只要思想是分组合并思想
分组：比如有一个大型数据，那么他就会将这个数据按照算法分成多份，每份存储在奴隶主机上，并且在奴隶主机上进行计算。
合并：将每个机器上的计算结果合并起来再在一台机器上计算，得到最终结果。
就是mapreduce 算法。追问

主要用来存储数据?那和我现在用的网站mysql 还有 Oracle 有啥区别啊.不都是存数据么

追答

区别很大，hadoop采用分布式存储。能够处理海量数据。

第3个回答推荐于2017-12-16

hadoop是什么？
hadoop是一个平台，是一个适合大数据的分布式存储和计算的平台。什么是分布式存储？这就是后边我们要讲的hadoop核心之一HDFS；什么是分布式计算？这是我们后边要讲的hadoop另外一个重要的核心MapReduce。
hadoop的优点一：低成本
hadoop本身是运行在普通PC服务器组成的集群中进行大数据的分发及处理工作的，这些服务器集群是可以支持数千个节点的。
hadoop优点二：高效性
这也是hadoop的核心竞争优势所在，接受到客户的数据请求后，hadoop可以在数据所在的集群节点上并发处理。
hadoop优点三：可靠性
通过分布式存储，hadoop可以自动存储多份副本，当数据处理请求失败后，会自动重新部署计算任务。
hadoop优点四：扩展性
hadoop的分布式存储和分布式计算是在集群节点完成的，这也决定了hadoop可以扩展至更多的集群节点。
hadoop安装方式|hadoop部署方式
hadoop安装方式只有三种：本地安装；伪分布安装；集群安装。后期我们会专题进行讲解。本回答被提问者和网友采纳

第4个回答 2021-03-26

大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产，简单来说大数据就是海量的数据，就是数据量大、来源广、种类繁多(日志、视频、音频)，大到PB级别，现阶段的框架就是为了解决PB级别的数据。

大数据的7大特征：海量性，多样性，高速性，可变性，真实性，复杂性，价值性

随着大数据产业的发展，它逐渐从一个高端的、理论性的概念演变为具体的、实用的理念。

很多情况下大数据来源于生活。
比如你点外卖，准备什么时候买，你的位置在哪，商家位置在哪，想吃什么……这都是数据，人一多各种各样的信息就越多，还不断增长，把这些信息集中，就是大数据。

大数据的价值并不是在这些数据上，而是在于隐藏在数据背后的——用户的喜好、习惯还有信息。
修改回答
0
评论
分享
删除回答

其他回答
尚学堂java学院
2021-01-04·百度认证:北京尚学堂科技有限公司官方帐号
关注

大数据概述
专业解释：大数据英文名叫big data，是一种IT行业术语，是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
通俗解释：大数据通俗的解释就是海量的数据，顾名思义，大就是多、广的意思，而数据就是信息、技术以及数据资料，合起来就是多而广的信息、技术、以及数据资料。
大数据提出时间
“大数据”这个词是由维克托·迈尔-舍恩伯格及肯尼斯·库克耶于2008年8月中旬共同提出。
大数据的特点
Volume（大量）、Velocity（高速）、Variety（多样）、Value（低价值密度）、Veracity（真实性）-由IBM提出。
大数据存在的意义和用途是什么？
看似大数据是一个很高大上的感觉，和我们普通人的生活相差甚远，但是其实不然！大数据目前已经存在我们生活中的各种角落里了，举个例子，我们现在目前最关心的疫情情况数据，用的就是大数据的技术，可以实时查看确诊人数以及各种疫情数据。
大数据存在的意义是什么？

1 2 下一页

相似回答

hadoop是干什么用的?答：提供海量数据存储和计算的。需要java语言基础。Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上；而且它提供高吞吐量来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。Hadoop的框架最...

Hadoop是什么,具体有什么用呢?答：Hadoop 的最常见用法之一是 Web 搜索。虽然它不是唯一的软件框架应用程序，但作为一个并行数据处理引擎，它的表现非常突出。Hadoop 最有趣的方面之一是 Map and Reduce 流程，它受到Google开发的启发。这个流程称为创建索引，它将 Web爬行器检索到的文本 Web 页面作为输入，并且将这些页面上的单词的频率...

Hadoop到底是干什么用的?答：用途：将单机的工作任务进行分拆，变成协同工作的集群。用以解决日益增加的文件存储量和数据量瓶颈。通俗应用解释：比如计算一个100M的文本文件中的单词的个数，这个文本文件有若干行，每行有若干个单词，每行的单词与单词之间都是以空格键分开的。对于处理这种100M量级数据的计算任务，把这个100M的文件...

简述hadoop 是什么?它的每个组件分别具有什么作用?答：Hadoop是一个开源的分布式处理框架，它能够处理和存储大规模数据集，是大数据处理的重要工具。Hadoop主要由两个核心组件构成：Hadoop Distributed File System (HDFS) 和 Hadoop MapReduce。1. Hadoop Distributed File System (HDFS)：HDFS是Hadoop的分布式文件系统，设计用来存储和处理大规模的数据集。它运行...

hadoop的作用答：Hadoop是一种用于大规模数据存储和处理的开源软件框架。它具有分布式存储、计算和处理能力，适用于各种场景，如数据仓库、数据挖掘、机器学习等。通过Hadoop，可以将大量数据分散存储在多个节点上，并利用集群的算力进行处理和分析。在实际应用中，Hadoop广泛应用于互联网、金融、医疗等领域，帮助企业处理和分析...

Hadoop是什么?能不能给点具体的解释?怎么用?答：1、Hadoop是一个分布式系统基础架构，由Apache基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem)，简称HDFS。2、Hadoop是一个用于运行应用程序在大型集群的廉价硬件设备上的框架。Hadoop为应用...

大家正在搜

hadoop是用什么开发的 apachehadoop怎么用用什么替代hadoop hadoop集群有什么用 hadoop用什么数据库 hadoop能用python吗 hadoophive怎么用 hadoop怎么用 hadoop一定用java吗