数据分析学习路线 技能篇
声明:原创不易,未经授权,严禁转载,违者必究! 广告:扫描关注屏幕右侧公众号,即可向专业数据分析师团队提问,我们将及时回复。您也可以在文章下方评论,提出您的观点或问题。 专业成长路线 从专业技能上来看,数据分析师的成长有4个阶段: 1.业务分析师(熟悉业务|发现问题|预测模型|决策辅助|报表制作) 2.建模分析师(知识发掘|客户画像|精准营销|量化风控) 3.大数据分析师(海量、异构数据的搜集、存储、清洗|知识发掘|报表制作) 4.数据科学家(制定数据发展战略|发掘数据价值|提升企业效率|增加企业价值) 一、业务数据分析师 主要工作内容: 理论基础要求:概率论、统计学理论基础。 专业工具要求:必要:Excel、SQL 可选:Python、SPSS、R等。 分析方法要求:掌握基本数据预处理方法,SQL数据库技术,数据分析方法(描述性统计分析,推断性统计分析,方差分析,线性回归等);市场调研(数据报告),常用数据分析模型(聚类分析、逻辑回归、时间序列等)。 业务分析能力要求:熟知业务,能够根据问题业务指标提取公司数据库中相关数据,进行整理、清洗、处理,通过相应数据分析方法,结合软件平台应用完成对数据的分析和报告。 结果展现能力要求:能够形成逻辑清晰的报告,传递分析结果,对实际业务提出建议和策略。 二、建模分析师 主要工作内容: 理论基础要求:统计学、概率论和数理统计、多元统计分析、时间序列、数据挖掘。 专业工具要求:必要:Excel、SQL 可选:Python、R、SPSS Modeler、Spark等。 分析方法要求:除掌握基本数据处理及分析方法以外,还应掌握高级数据分析及数据挖掘方法(特征工程、贝叶斯、决策树、神经网络、支持向量机、集成方法、关联规则、序列模式等)和可视化技术。 业务分析能力要求:可以将业务目标转化为数据分析目标;熟悉常用算法和数据结构,熟悉企业数据库构架建设;针对不同分析主体,可以熟练的进行维度分析,能够从海量数据中搜集并提取信息;通过相关数据分析方法,结合一个或多个数据分析软件完成对海量数据的处理和分析。 结果展现能力要求:报告体现数据挖掘的整体流程,层层阐述信息的收集、模型的构建、结果的验证和解读,对行业进行评估,优化和决策。 三、大数据分析师 主要工作内容: 理论基础要求:概率论和数理统计、Python基础、Linux基础、数据挖掘和机器学习。 专业工具要求:必要: SQL、Hadoop、HDFS、Mapreduce、Hbase、Hive、Sqoop、Spark 可选:Kafka、Flume、ZooKeeper等。 分析方法要求: 熟练掌握hadoop集群搭建;熟悉nosql数据库的原理及特征,并会运用在相关的场景;熟练运用Spark及Spark MLLib算法库提供的进行大数据分析的数据挖掘算法,包括无监督算法(k-means算法、DBSCAN算法、FP-Growth)、有监督学习算法(决策树、SVM、贝叶斯、集成算法、神经网络、协同过滤)等算法的原理和使用范围。 业务分析能力要求:熟悉hadoop+hive+spark进行大数据分析的架构设计,并能针对不同的业务提出大数据架构的解决思路。掌握hadoop+hive+ Spark+tableau平台上Spark MLlib、SparkSQL的功能与应用场景,根据不同的数据业务需求选择合适的组件进行分析与处理。并对基于Spark框架提出的模型进行对比分析与完善。 结果展现能力要求:报告能体现大数据分析的优势,能清楚地阐述数据采集、大数据处理过程及最终结果的解读,同时提出模型的优化和改进之处,以利于提升大数据分析的商业价值。 四、数据科学家 主要工作内容: 理论基础要求:统计学、大数据、机器学习、数据治理和项目管理 专业工具要求:必要:Excel、SQL、Python、Hadoop、Spark 可选:R、SAS、Tensorflow等 分析方法要求:除掌握数据分析和挖掘的方法之外,还需了解数据治理技术,计算机编程技术,机器学习,人工智能,大数据分析架构以及业务分析方法,包括代码管理、敏捷分析、战略分析,产品管理,风险管理、客户关系管理,项目管理,运营管理等结合具体行业的业务分析方法。 业务分析能力要求: 带领数据团队,能够将企业的数据资产进行有效的整合和管理,建立内外部数据的连接;熟悉数据仓库的构造理论,可以指导ETL工程师业务工作;可以面向数据挖掘运用主题构造数据集市;在人和数据之间建立有机联系,面向用户数据创造不同特性的产品和系统;具有数据规划的能力。 结果展现能力要求:报告形式多样化,图文并茂,逻辑严密。为企业数据资产管理提供详细方案,对企业发展提供数据规划策略。 |
最新评论