大数据没有java基础能自学吗

如题所述

一、认识大数据

大数据本质其实也是数据,不过也包括了些新的特征,

数据来源广;

数据格式多样化(结构化数据、非结构化数据、Excel文件等);

数据量大(最少也是TB级别的、甚至可能是PB级别);

数据增长速度快。

而针对以上新的特征需要考虑很多问题:

例如,数据来源广,该如何采集汇总?采集汇总之后,又该存储呢?数据存储之后,该如何通过运算转化成自己想要的结果呢?

对于这些问题,我们需要有相对应的知识解决。

二、大数据所需技能要求

Python语言:编写一些脚本时会用到。

Scala语言:编写Spark程序的最佳语言,当然也可以选择用Python。

Ozzie,azkaban:定时任务调度的工具。

Hue,Zepplin:图形化任务执行管理,结果查看工具。

Allluxio,Kylin等:通过对存储的数据进行预处理,加快运算速度的工具。

必须掌握的技能:

Java高级(虚拟机、并发)、Linux 基本操作、hadoop(HDFS+MapReduce+Yarn )、 HBase(JavaAPI操作+Phoenix )、Hive(Hql基本操作和原理理解)、 Kafka、Storm/JStorm、Scala、Python、Spark (Core+sparksql+Spark streaming ) 、辅助小工具(Sqoop/Flume/Oozie/Hue等)

所以没有java基础自学大数据是不太可能的。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2020-10-23
随着大数据越来越热门,很多零基础或者想转行的人也想通过学大数据来实现职业转变或提升。零基础学Java大数据当然是可以的,不过因为大数据课程难度比较大的关系,建议先学习计算机基础以及代码基础后再开始大数据课程的具体学习。
Java大数据课程的主要内容包括:
第一阶段JavaSE-通过学习Java编程基础,掌握JavaSE核心技术、能够熟练应用Java语言进行程序编写、使用MySQL操作和管理数据;
第二阶段学Hadoop生态圈,掌握Hadoop平台核心技术、掌握Hive开发、掌握HBase开发、掌握离线项目开发所需技能;
第三阶段学Spark相关技术,掌握Scala基本编程、掌握Spark架构基本内容及原理、掌握Spark开发及使用、了解Spark机器;
第四阶段学Python,掌握Python基本使用、掌握Python核心库的使用、掌握Python爬虫、Python简单数据分析等;
第五阶段大数据项目开发实战,掌握大数据项目开发流程及相关技术,具备企业真实项目的开发能力;
第六阶段学大数据系统管理优化,掌握处理并解决企业关于集群管理和系统安全方面的问题;
第七阶段学会使用阿里云平台,掌握企业使用阿里云大数据平台开发所需要的技能;
第八阶段就业保障服务;

以上是我们课程的具体内容,你可以了解一下做个参考。
相似回答