Skip to content

Latest commit

 

History

History
50 lines (27 loc) · 7.48 KB

the-journey-to-data-science-is-a-marathon-not-a-sprint-c82ec7a102e.md

File metadata and controls

50 lines (27 loc) · 7.48 KB

数据科学之旅是一场马拉松,而不是短跑

原文:https://pub.towardsai.net/the-journey-to-data-science-is-a-marathon-not-a-sprint-c82ec7a102e?source=collection_archive---------1-----------------------

数据科学之旅可以比作马拉松的 5 个原因

彼得罗·拉姆帕佐Unsplash 上拍摄的照片

我在 4 周或一年内看到了大量关于学习数据科学的帖子、书籍或广告。虽然在短时间内学习数据科学的基础知识(黑盒知识)是可能的,但真正掌握数据科学的理论和实践方面需要更多的时间。也就是说,成为数据科学家的旅程类似于马拉松,而不是短跑。以下是 5 个原因:

1。学术知识固然好,但更多的实践知识是必不可少的

数据科学项目的激增,无论是来自知名大学还是来自大规模开放的在线平台,都意味着在决定如何获取数据科学的基础知识时,有许多选项可供选择。然而,请记住,仅有学术培训是不够的。由于数据科学是一个实践领域,您需要继续将您的学术知识应用到现实世界的项目中。存在几个可用于数据科学项目的开放数据集。例如雅虎财经、谷歌股票数据、R 数据集、UCI 数据集、kaggle 数据集等。随着您不断将您的学术知识应用于现实世界的问题,您将在数据科学方面获得更多的能力。

2。全球范围内产生的数据正以惊人的速度增长

这意味着必须开发新的技术和算法,必须开发检索、处理和存储数据的新方法。例如,使用 AWS 或 MS Azure 等平台处理存储在云中的数据集。学术培训项目通常教授基础知识,但任何有抱负的数据科学家都应该在自学中脱颖而出,以获得额外的技术技能。这将使他们始终处于游戏的顶端。

3。由于技术发展,数据科学领域正在发生变化

数据科学和机器学习中的新算法、软件和库正在不断开发。为了在游戏中处于领先地位,数据科学从业者必须继续学习这些新技术,以便跟上新的发展。创建一个与其他数据科学家合作的网络将使你始终处于游戏的顶端。以下平台是建立关系网和继续学习的绝佳资源。

  • 中级: 中级现在被认为是学习数据科学和网络方面发展最快的平台之一。如果您有兴趣使用该平台进行数据科学自学,第一步将是创建一个中型帐户。您可以创建一个免费帐户或会员帐户。对于免费帐户,每月可以访问的会员文章数量是有限制的。会员账户需要 5 美元或 50 美元/年的月订阅费。从这里了解更多关于成为灵媒会员的信息:https://medium.com/membership。有了会员帐号,你将可以无限制地访问媒体文章和出版物。Medium 有几个数据科学出版物,可以帮助您了解该领域的新发展,并与其他数据科学家或有志之士建立联系。媒体上排名前两位的数据科学出版物是面向数据科学的和面向人工智能的。每天都有新的文章发表在 medium 上,涵盖数据科学、机器学习、数据可视化、编程、人工智能等主题。使用 medium 网站上的搜索工具,您可以访问大量文章和教程,涵盖数据科学中的各种主题,从基本概念到高级概念。
  • ***LinkedIn:***LinkedIn 是一个优秀的社交平台。LinkedIn 上有几个数据科学小组和组织可以加入,例如,走向 AI、DataScienceHub、走向数据科学、KDnuggets 等。你也可以在这个平台上关注该领域的顶级领导者。
  • KD nuggets:KD nuggets是一个关于**人工智能、分析、大数据、数据挖掘、数据科学和机器学习的领先网站。**在这个网站上,您可以找到数据科学方面的重要教育工具和资源以及职业发展工具:博客/新闻观点教程热门故事公司课程数据集教育事件(在线)工作
  • ***GitHub:***GitHub 包含几个关于数据科学和机器学习的教程和项目。除了作为数据科学教育的优秀资源,GitHub 还是项目组织和项目组合构建的优秀平台。有关在 GitHub 上创建数据科学投资组合的更多信息,请参见以下文章:使用这些平台构建脱颖而出的投资组合

4。采用不同数据科学方法的几个部门

数据科学跨越多个领域,如医疗保健、政府、教育、技术、金融等。每个部门都有不同的数据科学方法。例如,为 facebook 工作的数据科学家可能需要使用用户的实时反馈或帖子来构建一个推荐系统,该系统可以根据用户在 facebook 上的活动向他们推荐商业产品。或者,金融部门的数据科学家可能正在分析各种股票或共同基金的历史数据,以便建立可用于预测未来表现的模型。或者,数据科学家可能不得不从一个组织跳槽到另一个组织,因此他们必须了解数据科学在新组织中是如何实践的。

5。由于数据科学是一生的旅程,耐心是关键

一个对参加马拉松感兴趣的运动员必须花几年时间为这个大日子做准备,这需要很大的耐力和耐心。同样,要完全胜任数据科学家的工作,需要花费数年的时间和精力来学习该领域的本质。重要的是,数据科学的有志之士必须具备强大的基础数据科学概念的理论基础,这样他们才不会获得黑箱知识。由于所涉及的时间长度,将数据科学之旅比作马拉松是有意义的。事实上,通向数据科学的旅程是终生的。

关键要点

我们已经讨论了将数据科学之旅比作马拉松的 5 个重要原因。作为一个不断变化的领域,终身学习是对数据科学从业者的要求。

对于对进入数据科学领域感兴趣的初学者来说,花一些时间掌握数据科学的基本学术知识是很重要的。一旦获得这些知识,他们就可以将这些知识应用到现实世界的数据科学项目中。

下图是获得基本背景知识能力(基于个人经验)的典型时间表,取决于个人背景。具有更多分析背景(物理、数学、统计、计算机科学、工程等)的个人有额外的优势,可以在更短的时间内学习基础知识。下面给出的推荐时间表是针对自学途径的。数据科学或商业分析硕士学位课程通常需要 15 到 24 个月。

获取数据科学基础知识的典型时间表。Benjamin O. Tayo 拍摄的图片