全文共2229字,预计学习时长7分钟
图源:unsplash
作为近年来的大热领域,数据科学是许多人正在付出巨大努力想要进入的行业。他们通过大学课堂,上网课或者自学来提升自己的相应技能。
但是,现实世界的数据科学不同于你在课程中学到的那些,有很多业务问题需要处理与解决,软技能对于成为一个数据科学家是同等重要的。本文中,笔者将分享一些作为一名数据科学家的个人经历。
懂得业务问题
现实社会中的很多难题是大学里不会遇到的。在学校里,学生常常是通过一个结构化的问题和一个常见的数据集,最终得到精确的答案。
然而,该行业的问题往往是非结构化且复杂的。对这个问题的任何假设在现实世界中都会适得其反。在深入分析之前,最好先完全了解业务问题。理解业务问题包括对问题及其领域进行更多的研究规划,向客户提出正确的问题并与团队成员进行讨论。
做好记录
数据科学和人工智能发展十分迅速,总有一些全新知识需要学习。想要记住所有的事情十分困难,做记录有助于克服这个难题。同时,做记录也帮助我明确了自己的思维过程。
过去,我常常记录自己的学习,分析过程、建模过程、实验过程和编码过程。我还会详细地记下了失败的实验和失败原因,从长远来看,这有助于提升自己的思维模式,它还提升了我的沟通能力以及对概念的详细理解。
你甚至可以记录一些小事,或者是你所学到或遇到的也许未来会有用的东西,用自己觉得方便的工具来记录下来就好。
团队合作
数据科学需要逻辑思维,在解决问题的同时还需要有更多的想法和创造力,因此,团队协作在数据科学中扮演着重要的角色,你需要从多角度思考问题而不是单一维度思考。
团队成员可能有着不同的文化背景,掌握的技能各有千秋,认清每个成员的强项并根据其强项分配工作,有助于用不同的方式解决问题并学习新东西。
图源:unsplash
成为好的倾听者
另一个关键点就是成为一个好的倾听者。数据科学是关于共享和协作的,人们需要理解团队中其他人的观点。很多时候,其他团队成员会提出很好的独特想法,为了在项目中成功地实施这些想法,你有必要倾听和理解它们。
正如我前面所说,数据科学不是一个人的单打独斗,它是团队协作的结果。
打造灵活的办公环境
灵活的工作环境让我在每个工作周期开始时都有明确的计划、优先级和方向,敏捷思维有助于应对变化和处理不确定性。如果遇到了不确定性,试着去选择,收集反馈,反复改进,这也给了我一个与不同团队合作的机会。
在每个工作周期结束时,以机器学习模型的形式向大家展示一个最小可行的产品(MVP),能够帮助我以更好的形式塑造项目。另外,每次工作周期结束后的反馈也能帮助我改正错误,高效地交付项目。
版本控制
版本控制在每个人的工作流中都是很重要的事情。它有助于集中管理代码,而不是保存到PC/笔记本电脑或外部驱动器中。这样一来,你就可以在任何位置执行新项目时参考代码或文档。
讲故事
讲好故事是数据科学的重要任务。我们正对数据进行处理,创建一个模型,并找到其中的奥秘。但从商业角度来说,这个模型说明了什么?这种模型是如何为公司赚钱或解决问题的?
利益相关者和管理层并不在意对p值或任何其他统计数据,你得以一种引人入胜的方式向非技术受众简单地解释模型。学会通过一则短篇故事来解释模型的方法,是我去年最大的收获之一。很好地具象化有助于以故事的形式传达信息,讲故事是一门艺术,需要时间和大量的练习。
创新输出形式
过去,我们总是使用传统的PPT向客户或利益相关者展示我们的工作,为什么不试着创建一个web应用程序或仪表板来解释我们的模型输出呢?创建一个web应用程序或仪表板显示了对项目的投入,同时也与利益相关者和客户建立了联系。
编程
在过去的8个月里,我的编程技能有了明显提高。我在工作和竞赛中学到了如何编写函数式或面向对象的代码,以获得最大的代码实用性。这不仅有助于在将来的项目中使用这些代码,还能减少当前项目所需时间。
文章来源:《探索科学》 网址: http://www.tskxzzs.cn/zonghexinwen/2020/0726/459.html