①需要理解主流机器学习算法的原理和应用;②需要熟悉至少一门编程语言如(Python、C、C++、Java、Delphi等);③需要理解数据库原理,能够熟练操作至少一种数据库(Mysql、SQL、DB2、Oracle等),能够明白MapReduce的原理操作以及熟练使用Hadoop系列工具更好。