收集数据
数据分析师的工作第一步就是收集数据,如果是内部数据,可以用SQL进行取数,如果是要获取外部数据,数据的可靠真实性和全面性其实很难保证。
2. 数据清洗
数据清洗是整个数据分析过程中不可缺少的一个环节,其结果质量直接关系到模型效果和最终结论。在实际操作中,数据清洗通常会占据分析过程的50%—80%的时间。需要进行处理的数据大概分成以下几种:缺失值、重复值、异常值和数据类型有误的数据。
3. 数据可视化
是为了准确且高效、精简而全面地传递出数据带来的信息和知识。可视化能将不可见的数据现象转化为可见的图形符号,能将错综复杂、看起来没法解释和关联的数据,建立起联系和关联,发现规律和特征,获得更有商业价值的洞见和价值。在利用了合适的图表后,直截了当且清晰而直观地表达出来,实现了让数据说话的目的。
4. 数据方向建设和规划
不同行业和领域的侧重点是不同的,可以是商业策略,也可以是市场营销,是不固定的,要依据公司的战略发展走。
5. 数据报告展示
数据分析师作为业务与IT的桥梁,与业务的需求沟通是其实是数据分析师每日工作的重中之重。在明确了分析方向之后,能够让数据分析师的分析更有针对性。如果没和业务沟通好,数据分析师就开始撸起袖子干活了,往往会是白做了。最后结果的汇总体现也非常重要,不管是PPT、邮件还是监控看板,选择最合适的展示手段,将分析结果展示给业务团队。