回顾过去,我想它已经在我的脑海里萦绕了很长时间,但成为一名企业家并创建一个我真正可以称之为自己的企业的愿望在过去几年变得越来越明显。
如果不是因为 COVID 疫情的经济和社会影响——如果我足够幸运,没有丢掉工作——我可能仍然会发现自己在我的前雇主那里工作。毕竟;辞去全职工作去开创自己的事业需要你走出舒适区,放弃我认为是生活中的安全感。2020 年夏天,我决定投身于未知领域。我辞掉了工作,决定全力以赴。但是到底为了什么?我知道我必须开始做一些具有挑战性、鼓舞人心和满足感的事情。一些我真正热爱的事情。毕竟他们说;选择一份你热爱的工作,你这辈子就一天都不用工作了!
我工作过的公司提供了很好的机会;一家大型国际公司使我能够不时地换工作;在职业阶梯上平步青云。跌跌撞撞地从一个有趣又有挑战性的项目跳到另一个项目,却从来没有想过我正在做的事情是否是我真正喜欢做的事情。现在是我问自己这个问题的时候了。没过多久,答案自然就出来了。
“做你热爱的事情,对你正在做的事情充满热情。”
我总是在仔细检查大型 Excel 文件并旋转它们以便从我当时认为是大量的数据中获取有意义的信息中找到乐趣。我是视觉导向型的,我喜欢可视化数据。我习惯于在会议记录上涂鸦,更喜欢在演示中使用视觉效果。通常用更容易理解的图片来描绘相当复杂的流程、IT 架构和数据流,这些图片通常比文字更能讲述故事。
在对前面提到的内容进行抽象后,结合我天生的好奇心、创造力、专业兴趣和经验,我很快就明白了我的 Ikigai 是数据管理,于是我决定开始学习数据科学!
“我决定花至少一年时间学习数据科学的基础知识。”
现在的算法在无数的开源库中都很容易找到。弄清楚如何使用它们并不需要太多的努力。但是我很快了解到这不是实践数据科学的本质;它是关于知道用什么算法来应对即将到来的特殊挑战。它是关于知道算法如何工作以及如何解释它们的输出。而是能够针对特定任务优化它们。只有这样,人们才能应用它们成功地执行描述性和预测性分析,只有这样,人们才能从大量结构化和非结构化数据中获取有意义的信息。这是使用数据科学解决问题和增加价值的必要条件。在做了案头研究后,我得出结论,从事数据科学职业需要深厚的基础知识,包括统计、数学和编程技能。
我觉得听起来很复杂。但是我愿意开始学习。幸运的是,我也可以,因为我有一些存款,可以让我暂时不用工作。所以我决定投资自己的发展,花至少一年的时间学习数据科学的基础知识。
“四门在线课程和一次虚拟监考,其进度和严格程度与麻省理工学院的校园课程相似。有挑战性!”
由于 COVID 疫情造成的限制,我被迫寻找在线资源开始学习。在 Kaggle、Udemy 和 Udacity 上尝试 Python 编程课程后,我意识到这并不是我想要的。我有商业信息学学士学位和商业经济学和商业研究的研究生教育,我一直在寻找更具挑战性的东西。缩小我对高质量在线 MOOC 的搜索范围后,我选择了 Coursera 和 Edx。这两个在线学习平台都是由知名大学发起的,提供价格合理、高质量的内容。我从 Edx 上的 IBM 数据科学开始,但对这个课程感觉像是在看一个蓝色巨人的大广告感到失望,所以我停下来寻找其他东西。最后;我发现麻省理工学院(MIT)在 Edx 上提供微主统计和数据科学。这是面向在线学习者的专业和学术证书。它包括四门在线课程和一个虚拟监考考试,与麻省理工学院的校园课程进度和严格程度相似。具有挑战性!
"我没能获得足够高的及格分数,感到灰心丧气。"
2020 年 9 月,我创办了统计学和数据科学微型硕士。第一个模块是关于概率论和不确定性与数据的科学。经过三个月的努力,我没有成功。我没能获得足够高的分数通过考试,感到灰心丧气。我下定决心要成功,过了一会儿,我意识到这激励我学得更多更努力。由于下一个关于机器学习和算法的模块还有两个月才开始,我决定利用剩下的时间来提高我的编程技能。我同时通过 Edx 在麻省理工学院开设了“使用 Python 的计算机科学和编程”和“计算思维和数据科学导论”课程,并通过 Coursera 在密歇根大学开设了“应用数据科学与 Python 专门化”课程。前两个提供了编写面向对象程序代码的坚实的介绍,并将教你计算思维的基础。介绍了递归编程、类和继承、深度优先搜索与广度优先搜索、调试和 big-O 符号等概念。以及贪婪算法、随机漫步和蒙特卡罗模拟。Python 专业的应用数据科学向您介绍如何使用 Pandas 处理数据帧,以便开始数据争论和应用正则表达式等技术。此外,它还使用 NetworkX 对各种机器学习算法、文本挖掘和网络分析的应用进行了温和的介绍。它还涉及数据可视化的主题;不仅向您介绍了 Matplotlib 和相关的库,还涵盖了像 Edward Tuftes principals 这样的主题,用于创建良好的数据可视化。众多的实践练习和同行评议评分使 Coursera 专业化成为一个非常实用的专业。
“当你想真正理解机器学习和人工智能 T2 算法的工作时,掌握数学,特别是向量、矩阵和微积分知识是最重要的。”
2021 年初,我开始全日制学习,同时学习三到四门课程。自从我开始顺利完成课程以来,我的努力得到了回报。我缓慢但稳定地取得了一个又一个证书。这增强了我的自信,更增加了我的学习兴趣。在机器学习模块中,我决定重温我的数学技能。当你想真正理解机器学习概念如聚类、分类、回归、正则化的工作时,掌握数学,特别是向量、矩阵和微积分知识是必不可少的。或者像强化学习、反向传播、主成分分析、前馈神经网络和随机梯度下降这样的概念。通过 Coursera 从伦敦帝国理工学院获得的机器学习专业数学是一个救星。线性代数,多元微积分和主成分分析以直观和非常容易理解的方式解释。此外,关于积分和多变量微积分、向量和导数的 Edx 课程非常有助于内在化潜在的数学理论,并巩固了我的知识。
"使用数据块和分布式计算环境查询十亿条记录."
2021 年仲春,是我再次尝试概率课程的时候了。我重新申请了这门课程,并与统计学基础模块一起学习。我以为我已经对统计学略知一二;直到我学了这门课。它提供了推理和估计,假设检验和贝叶斯统计,线性回归和线性模型推广的深入教学。也许这是我学过的最难的课程之一!努力工作和坚持不懈得到了回报,我成功了。初夏,我开始刷新我的 SQL 技能;使用数据块和分布式计算环境查询大数据——字面意思是十亿条记录,同时我还通过成为 Tableau 认证的作者、分析师和数据科学家来提高我的数据分析和可视化技能。
在写这篇文章的时候,树叶正在落下。现在是 2021 年的秋天,我正忙于 Micromasters 项目的最后一个模块(应用中的统计建模和计算),也是密歇根大学体育表现分析专业总共五门课程中的第四门,我是在夏天开始的,只是为了好玩。
“虽然我专攻数据科学,但我意识到我本质上并不是真正的专家。”
在我学习的 15 个月里,我开始意识到一些事情。我对数据科学了解得越多,就越意识到我还有很多东西需要学习。我相信最好的方法之一就是在实践中运用我新获得的技能,并开始做项目。
当应用数据科学与数据工程技能以及数据架构和数据管理知识相结合时,它甚至更有价值。虽然我专攻数据科学,但我意识到我本质上并不是一个真正的专家。最终,我喜欢在上下文中使用这些知识,并且我相信,当我将我的数据科学、人工智能和机器学习知识与我已经拥有的 IT 和数据知识和经验相结合时,我会增加更多的价值。因此,我决定作为一名自雇的数据管理顾问提供服务。
“继续我的‘在职’数据管理学习之旅。”
甚至在我有机会按计划开始收购项目之前,我的专业关系网就已经领先我一步了。业务关系部得知了我的抱负,我现在为两家大公司提供数据管理咨询服务,继续我的“在职”学习之旅。
当你决定开始学习数据科学时,我所选择的课程有望激发一些想法,甚至可能提供灵感。在我看来,学习数据科学没有一个固定的蓝图。相反,这往往是一个漫长的实验、学习和实践的过程。我非常喜欢它,而且我才刚刚开始…
请随意联系。我在 LinkedIn 上。
■ 6.419x:数据分析:应用中的统计建模和计算,edX(麻省理工学院)。
■ 18.6501x:统计学基础,edX(麻省理工学院)。
■ 6.86x:用 Python 进行机器学习——从线性模型到深度学习,edX(麻省理工学院)。
■ 6.431x:概率——不确定性和数据的科学,edX(麻省理工学院)。
■ 18.02.1x:多变量微积分 1:向量和导数,edX(麻省理工学院)。
■ 18.01.1x:微积分 1A:微分,edX(麻省理工学院)。
■ 6.00.2x:计算思维与数据科学导论,edX(麻省理工学院)。
■ 6.00.1x:计算机科学与使用 Python 编程导论,edX(麻省理工学院)。
■用于数据科学的 SQL,Coursera(加州大学戴维斯分校)。
Spark SQL 分布式计算,Coursera(加州大学戴维斯分校)。
■机器学习的数学:PCA,Coursera(伦敦帝国理工学院)。
■机器学习的数学:多元微积分,Coursera(伦敦帝国理工学院)。
■机器学习的数学:线性代数,Coursera(伦敦帝国理工学院)。
■可穿戴技术和体育分析,Coursera(密歇根大学)。
■带有运动数据的预测模型,Coursera(密歇根大学)。
■ Moneyball and Beyond,Coursera(密歇根大学)。
■体育分析基础:体育中的数据、表示和模型,Coursera(密歇根大学)。
Python 中的应用社交网络分析,Coursera(密歇根大学)。
Python 中的应用文本挖掘,Coursera(密歇根大学)。
Python 中的应用机器学习,Coursera(密歇根大学)。
■用 Python、Coursera(密歇根大学)应用绘图、制图和数据表示。
■用 Python 介绍数据科学,Coursera(密歇根大学)。
■ Tableau 数据科学家(Tableau 学习中心)。
■ Tableau 分析师(Tableau 学习中心)。
■ Tableau 作者(Tableau 学习中心)。
■机器学习介绍(Kaggle)。
■ Python (Kaggle)。