大家好,欢迎来到IT知识分享网。
1、什么是数据分析师
进入互联网某大厂一段时间了,目前在DS团队中任职,除了负责业务分析和数据建设工作,也会涉及到一些人员成长和招聘相关的工作,自己在边做边学中沉淀了一些思考,对数据分析师(Data Analyst)的岗位需求也有了一些认知
一个简单的例子
1-3主要是一些基础的岗位要求,包括专业、学历、经验要求等,这些根据岗位所在的行业、部门职能会有不同的要求。从这个描述我们可以看出来这个岗位主要是互联网金融行业,偏向一线业务优化 的数据分析师岗位
4和6是经典的一些数据分析师的技能要求,包括语言技能(SQL、R、Python)、可视化技能(Tableau)
5则是数据分析师的思维逻辑能力要求,包括业务理解度(能快速理解业务)和数据敏感度(业务细节和数据的联系)
从这个岗位要求描述,可以给数据分析师做个简单的定义:
数据分析师是指具有一定编程和可视化能力,熟悉行业逻辑的能够基于业务理解和数据敏感解决问题的高素质人才
由此可以延伸出大家常出现的两个误区:
误区1:数据分析师是埋头搞理论研究的吗?
数据分析师常常也被称为数据科学家,但这里的“科学”,是相较于“工程”而言的。其实数据分析师往往是对业务非常了解的人,无论是偏向一线业务的数据BP,还是偏向战略方向的分析师,都需要至少对一种行业的商业模式、业务特点有充分的理解
误区2:数据分析师≈程序员?
数据分析师的确需要一定的编程能力,但首先它对于数据分析师而言只是一种工具,不需要多精湛的coding能力;其次数据分析师还需要有较强的数据可视化能力,来挖掘数据的特征以及展现自己的分析结果
2、成为数据分析师要具备什么能力
上面的例子只展现了一部分的能力要求,实际大家还常常会看到诸如“数仓” 、“埋点”、“算法模型”等等的一些要求,这里做一个完整的介绍
如果你有兴趣成为数据分析师,希望从现在起学习一些必备的工具和能力,可以从以下几个方面入手
1)埋点设计和数仓建设基础
这是入门的数据分析师必备的技能,熟悉埋点设计的分析师才能了解数据的意义、来源和局限性;而熟悉数仓建设的分析师,能够更加高效的处理和使用数据,并且真正意义上的迈入“大数据”时代
什么是埋点?
埋点其实就是日志(Log),譬如要分析用户活跃的特征,实际是对用户的登录行为(login)进行埋点和分析,通过记录用户登录的日期、时间、设备、入口等信息,分析用户活跃的行为习惯
什么是数仓?有必要学习数仓知识吗?
2)一定的编程基础
– 必备能力:SQL。
它很古老,也很不好理解,但目前它仍然是数据科学领域不可或缺的基础,随着数据量级指数级增长,SQL的高运行效率越来越不可取代,在大多数时候分析师都需要通过SQL进行数据的获取和基础分析
– 加分能力:R/Python。
几乎所有的数据分析课程都会推荐你购买配套的R/Python课程,它们并不是必要的,没有掌握这些技能并不妨碍你成为一个数据分析师。但拥有这些技能的的确确可以显著提高你的工作效率
进阶的话,则是一些常用的统计检验方法的实现,以及各类算法模型包的调用和参数优化,这里其实更多是工具的使用,会在下方的算法模型里面详解
再再再进阶的话,则是学会部署服务,实现一些常用分析的自动化运行、生成报表、可视化;又或是掌握爬虫技能,走向犯罪的道路(不是
– 其他奇奇怪怪的语言
– 切记:语言都只是数据分析师实现分析目的的工具
有一点请记住:所有的语言都只是为了实现分析目的,实际上excel的数据透视表、趋势拟合、函数可以完成分析师90%的工作,所有的语言都不过是在此基础上的拓展罢了,所以语言需要学,但更重要的是多用
3)可视化工具和文档表达能力
什么是数据可视化?
简单来讲就是画图,画各种各样的图,条形图/直方图/折线图/箱线图/小提琴图/桑基图等等等等。但可视化只是工具,最需要学习的是可视化背后的分析逻辑和思维方式:当我们画直方图时,其实我们想要的是了解数据分布;当我们画桑基图时,我们想要了解的是个体的流转变化
数据分析师往往能够通过图表帮助自己快速了解数据,也能通过图表有效表达自己的思路和观点
分析师需要掌握哪些可视化工具?
如果有批量生成图表的需求,可以尝试R/Python的可视化工具包,如常用的matplotlib、seaborn
噢,顺道一提,好的分析师不一定会做很精美的图表,但是会做精美图表的分析师一定是非常受欢迎的人 。 所以,所谓技多不压身,不妨多花时间去学习更多的可视化工具!
文档表达?我们做的不是分析吗?
与数据可视化不可分割的,是文档表达。人们常常会忽视表达的重要性,在是工作中常常遇到一些分析师,明明能力超强思维敏捷,但别人总会觉得他思维混乱不知所云,这其实就是只会分析而不会表达。
分析师只有拥有优秀的文档表达能力,才能够将自己脑海中的观点和论证过程有效地传递给别人,真正实现价值。无论是视频、文档、公众号、还是PPT,其实本质都是用于表达自己观点的媒介
4)算法模型
要掌握哪些算法模型?
要想在算法模型进行学习,可以尝试kaggle上的项目,如果能在非训练项目中拿到Top30%以上的排名,一定要写到简历上!
数据分析师和算法工程师的区别?
比较粗浅的理解的话,数据分析师考虑的是如何应用模型解决实际问题,如何在可接受的成本范围内获得更好的效果;而算法工程师更多的是考虑运行效率、准确度和工程的稳定性
结语
以上是关于“招式”的一些思考和分享,也是自己在面试过程中常常会考察面试者的一些角度
对于已经工作的朋友:
对于即将走进社会的朋友:
最后,除了“招式”,还有一些数据分析师必须掌握的“功法”,是判断一名数据分析师是否有足够的【潜力】的重要依据,敬请期待吧~
有兴趣成为数据分析师的朋友,欢迎用简历砸我的私信!
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/139350.html