从事数据分析师行业必备的8个基本入门技巧
学习数据分析会让人望而生畏,尤其是当你刚刚开始你的旅程的时候。该学习什么软件呢,R还是Python?什么技巧需要重点关注?统计学的知识需要掌握多少?要不要学习编程?回答这些问题是你的数据分析之旅中的一部分。
这就是为什么我认为我应该写这篇指南的原因,我希望可以帮助那些刚刚开始学习数据分析的人。我的初衷是写一篇简单易懂、篇幅不是很长的指南,来指导你们学习数据分析。这篇指南会给你们建立一个框架,用以帮助你们度过这段困难时期。
只要遵循这些提示,你的职业生涯将会有一个好的开始。
那么,让我们开始吧!
Learning data science can be intimidating. Specially so, when you are just starting your journey. Which tool to learn – R or Python? What techniques to focus on? How much statistics to learn? Do I need to learn coding? These are some of the many questions you need to answer as part of your journey.
That is why I thought that I would create this guide, which could help people starting in Analytics or Data Science. The idea was to create a simple, not very long guide which can set your path to learn data science. This guide would set a framework which can help you learn data science through this difficult and intimidating period.
Just follow through these tips and you will get a good head start in your career.
So let’s get started!
1. 选择正确的角色
在数据科学行业有很多不同的角色。比如:数据可视化专家,机器学习专家,数据科学家,数据工程师等。根据不同的背景和工作经验,进入一个角色可能比另一个角色要容易的多。举个例子,如果你是一个软件开发人员,对于你来说从事数据工程师就不是很困难的事情。所以,如果你不清楚你要成为什么角色,那么如何开始和怎么提升技能对于你来说就更困难了。
如果你不清楚他们之间的差别或者你不确定自己可以成为什么时,应该怎么办呢?下面是我的几条建议:
向行业内的人士了解每一个角色承担的工作是什么。
向别人请教。向他们请求一点时间,并提出相关的问题,我相信没有人会拒绝一个需要帮助的人的。
找出你想要的和你擅长的,选择适合你的研究领域的角色。
在选择角色时要记住一点:不要盲目的进入一个角色。你应该首先清楚地了解这个领域需要什么,并为之做好准备。
2. 完整地学习一门课程
既然您已经决定了一个角色,接下来要做的事情就是投入精力去理解这个角色。这意味着不仅仅是要完成角色的需求。数据科学家具有巨大的需求,所以成千上万的课程和研究都在等着你去探索,你可以学习任何你想要的东西。找到学习的材料并不是一件很难的事,但是如果你不为之付出努力的话,学习的过程可能会变得很困难。
你可以参加一个免费的MOOC课程,或者加入一个认证项目,这个项目会让你经历所有的曲折和转变。免费和付费的选择不是问题,主要的目标应该是课程是否能帮你夯实基础,达到一个合适的水平,从可以进一步推进。
当你上一门课的时候,要积极地按照课程的安排、作业和所有的讨论进行。例如,如果你想成为一名机器学习工程师,你可以学习Andrew Ng的机器学习。现在你必须努力学习课程中提供的所有课程材料,当然也包括课程中的作业,这和看视频一样重要。从头到尾完整的学习一门课程,你就能更清楚地了解这一领域。
一些优秀的mooc课程包括:
Analytics Edge on edX
Machine Learning rom Andrew NG
3. 选择一个工具/语言并坚持下去
正如我之前提到的,对于你来说,无论你选择哪一个角色,从一而终是很重要的。那么你将要面对一个很难的问题,你应该选择哪种语言/工具?
这可能是初学者最需要问的问题。最直接的答案是选择任何主流工具/语言都可以。毕竟,工具只是实现的手段,理解这一概念更为重要。
不过,问题仍然存在,选择哪一个更好一些呢?网上有各种各样的指南在讨论这个问题。你可以从最简单的语言开始,或者你最熟悉的语言。如果您不精通编程,那么您可能更适合基于GUI的工具。当你掌握了这些概念之后,你就可以着手编写代码了。
4. 加入一个兴趣小组
既然你已经知道了你想要选择的角色并为之做好了准备,接下来你要做的一件重要的事情就是加入一个兴趣小组。为什么这个很重要?这是因为一个兴趣小组能让你保持动力。当你进入一个新领域的时候,可能有点令人生畏,但是当你和志同道合的朋友在一起的时候,这个事情就简单多了。
加入兴趣小组的好处是你可以跟小伙伴们进行互动,另外你们可以通过互联网分享心得,比如加入一个庞大的在线课程并与小伙伴进行互动。
即使你没有这样的兴趣小组,你仍然可以在互联网上进行一场有意义的技术讨论。有一些在线论坛可以提供这样的平台。我将列举其中的一些:
Analytics Vidhya
StackExchange
5. 关注实际应用而不仅仅是理论
在进行课程和培训的同时,你应该把重点放在你正在学习的东西的实际应用上。这不仅能帮助你理解这个概念,还能让你更深入地了解它在现实中的应用。
以下是几个在参加课程时的几个小贴士:
确保你做了所有的练习和作业来理解这些应用。
使用一些开放的数据集进行实践。即使你不理解一项技术背后的数学原理,也要理解它的假设、目的以及如何解释结果。后期你将会有更深层次的理解。
看看那些在这个领域工作过的人的解决方案,他们能够帮助你用正确的方法更快地进行准确的描述。
6. 选择恰当的资源
永远不要停止学习,你必须将你能找到的每一种知识都吸收。这些信息最有用的来源是由最有影响力的数据科学家所管理的博客。这些数据科学家非常活跃,他们会在博客上更新他们的研究成果,并经常发布关于这一领域最近的进展情况。
每天阅读有关数据科学的书,让它成为一种习惯,以更新最近发生的事情。但是可能有很多资源,有影响力的数据科学家要遵循,你必须确保你没有循错误的做法。因此,遵循正确的资源是非常重要的。
下面是你可以追随的数据科学家的名单。以下是几本可以让你保持忙碌的时事通讯:
WildML
NYU
KDnuggets News
7. 注意你的沟通技巧
人们通常不会把沟通技巧和数据科学求职遭到拒绝联系在一起。他们认为,如果他们的技术过硬,他们将会在面试中获得高分。这其实是一种错误观念。你是不是曾经在面试中被拒绝,面试官在听了你的介绍后说谢谢?
请尝试这样一个活动:让你的具有良好的沟通技巧的朋友听你的介绍并向他寻求最真实的反馈,他会向你展示出你的真实写照。
当你在这个领域工作的时候,沟通技巧非常重要。为了更好地和同事分享你的想法,或者在会议上证明你的观点,你应该知道如何有效地沟通。
8. 建立人际关系网,但是不要浪费太多的时间在这上面
最初,你的全部注意力都应该集中在学习上,在初始阶段做太多的事情让你很容易放弃。
慢慢地,一旦你掌握了这个领域的窍门,你就可以参加行业活动和会议,参加行业聚会,参加你所在地区的黑客马拉松——即使你只知道一点点。因为你永远不知道谁会在什么时候,什么地方帮助你!
实际上,聚会对于你在数据科学社区留下标记是非常有利的。你可以与你所在的研究领域里那些比较活跃的人接触,这会为你提供社交机会,并与他们建立联系,这反过来会对你的事业有很大的帮助。人际关系网将会带给你下面这些东西:
为你提供关于你感兴趣领域内发生的事情的内部信息
帮助你获得辅导支持
帮你找一份工作,这要么是求职的小贴士要么是直接找工作的机会
结束语
数据科学的需求是巨大的,雇主们在数据科学家身上投入了大量的时间和金钱。因此,采取正确的步骤将会事半功倍。这个指南提供了一些技巧,可以帮助你入门并帮助你避免一些代价高昂的错误。