有个问题请教一下,我一直没弄明白,数据挖掘中的建模,他的作用到底是什么?在我的理解中数据挖掘就是一个,从数据中发现规律和知识的一个过程,然后将其结果展现给决策者的过程,那我们在做数据分析的过程中就应该已经将这些东西发现,并输出成实体了,难道我们分析的过程中不是全量数据吗?还只是一部分抽样数据?我们对这些抽样数据分析,在进行建模,去分析全量数据?可能是我还理解的不够深入,希望老师帮忙解答。谢谢!
那我是不是可以这样理解,我得到全量数据后,将数据分成两份或多份,一份用来做分析,另外的用来验证我的分析是否正确?
追答有些时候是这样的,有些时候分析和验证是交叉的
比如我数据量比较少,分一部分出来验证共分析的数据就太少了,准确度会很低
这个时候我可以将数据分成n组,留一组验证 其他都去分析,n次循环后得到n个模型 取平均
方法很多 也很灵活 视情况而定
非常感谢你的解答,那个这模型,是我们写的代码,还是代码跑完后,分析出来的结果了?
追答你的算法实现就是模型 也可以说是代码吧 但是严格来说建模是个过程 代码只能说是模型的的体现或实现 属于模型的一部分