机器学习,数据挖掘在研究生阶段大概要学些什么?

如题所述

如下:

1、编程语言

目前工业界的机器学习编程语言很多,基于个人的一些浅显的工作经验,发现目前比较常用的编程语言是 Python 和 SQL。需要掌握的内容有以下几点:聚合函数,数学函数,字符串函数,表格的连接函数,条件语句等。

2、机器学习

推荐教材《机器学习实战》,作者是 Peter Harrington。阅读这本书需要读者掌握 Python 语言,加上 Numpy,Scipy,matplotlib 函数库的一些基础内容。

3、数理统计

数理统计方面还是有一些东西是蛮常用的。例如时间序列模型 ARMA 模型等。一些数据的指标,例如均值,方差,标准差,变异系数,相关系数,ROC曲线和AUC,召回率和正确率,交叉验证等。

数据挖掘和机器学习的区分

数据挖掘并不那么关心算法的细节,而相对更重视结果的解释及其统计意义;而相反,机器学习似乎更在乎算法的设计、优化,在分类、聚类、或者一些既定问题上的效果,而较少关心统计意义方面的考量。

具体来说,一个数据挖掘专家可能会用线性回归甚至关联分析,这些被机器学习学者认为是上世纪初产物的模型完成一些非常有趣的实际工作,并得到确定的统计意义。



温馨提示:答案为网友推荐,仅供参考
相似回答
大家正在搜