现在的位置:主页 > 综合新闻 >

走出幻想:探索真实世界中的数据科学

来源:探索科学 【在线投稿】 栏目:综合新闻 时间:2020-07-26

【作者】网站采编

【关键词】

【摘要】全文共2229字,预计学习时长7分钟 图源:unsplash 作为近年来的大热领域,数据科学是许多人正在付出巨大努力想要进入的行业。他们通过大学课堂,上网课或者自学来提升自己的相应技

全文共2229字,预计学习时长7分钟

图源:unsplash

作为近年来的大热领域,数据科学是许多人正在付出巨大努力想要进入的行业。他们通过大学课堂,上网课或者自学来提升自己的相应技能。

但是,现实世界的数据科学不同于你在课程中学到的那些,有很多业务问题需要处理与解决,软技能对于成为一个数据科学家是同等重要的。本文中,笔者将分享一些作为一名数据科学家的个人经历。

懂得业务问题

现实社会中的很多难题是大学里不会遇到的。在学校里,学生常常是通过一个结构化的问题和一个常见的数据集,最终得到精确的答案。

然而,该行业的问题往往是非结构化且复杂的。对这个问题的任何假设在现实世界中都会适得其反。在深入分析之前,最好先完全了解业务问题。理解业务问题包括对问题及其领域进行更多的研究规划,向客户提出正确的问题并与团队成员进行讨论。

做好记录

数据科学和人工智能发展十分迅速,总有一些全新知识需要学习。想要记住所有的事情十分困难,做记录有助于克服这个难题。同时,做记录也帮助我明确了自己的思维过程。

过去,我常常记录自己的学习,分析过程、建模过程、实验过程和编码过程。我还会详细地记下了失败的实验和失败原因,从长远来看,这有助于提升自己的思维模式,它还提升了我的沟通能力以及对概念的详细理解。

你甚至可以记录一些小事,或者是你所学到或遇到的也许未来会有用的东西,用自己觉得方便的工具来记录下来就好。

团队合作

数据科学需要逻辑思维,在解决问题的同时还需要有更多的想法和创造力,因此,团队协作在数据科学中扮演着重要的角色,你需要从多角度思考问题而不是单一维度思考。

团队成员可能有着不同的文化背景,掌握的技能各有千秋,认清每个成员的强项并根据其强项分配工作,有助于用不同的方式解决问题并学习新东西。

图源:unsplash

成为好的倾听者

另一个关键点就是成为一个好的倾听者。数据科学是关于共享和协作的,人们需要理解团队中其他人的观点。很多时候,其他团队成员会提出很好的独特想法,为了在项目中成功地实施这些想法,你有必要倾听和理解它们。

正如我前面所说,数据科学不是一个人的单打独斗,它是团队协作的结果。

打造灵活的办公环境

灵活的工作环境让我在每个工作周期开始时都有明确的计划、优先级和方向,敏捷思维有助于应对变化和处理不确定性。如果遇到了不确定性,试着去选择,收集反馈,反复改进,这也给了我一个与不同团队合作的机会。

在每个工作周期结束时,以机器学习模型的形式向大家展示一个最小可行的产品(MVP),能够帮助我以更好的形式塑造项目。另外,每次工作周期结束后的反馈也能帮助我改正错误,高效地交付项目。

版本控制

版本控制在每个人的工作流中都是很重要的事情。它有助于集中管理代码,而不是保存到PC/笔记本电脑或外部驱动器中。这样一来,你就可以在任何位置执行新项目时参考代码或文档。

讲故事

讲好故事是数据科学的重要任务。我们正对数据进行处理,创建一个模型,并找到其中的奥秘。但从商业角度来说,这个模型说明了什么?这种模型是如何为公司赚钱或解决问题的?

利益相关者和管理层并不在意对p值或任何其他统计数据,你得以一种引人入胜的方式向非技术受众简单地解释模型。学会通过一则短篇故事来解释模型的方法,是我去年最大的收获之一。很好地具象化有助于以故事的形式传达信息,讲故事是一门艺术,需要时间和大量的练习。

创新输出形式

过去,我们总是使用传统的PPT向客户或利益相关者展示我们的工作,为什么不试着创建一个web应用程序或仪表板来解释我们的模型输出呢?创建一个web应用程序或仪表板显示了对项目的投入,同时也与利益相关者和客户建立了联系。

编程

在过去的8个月里,我的编程技能有了明显提高。我在工作和竞赛中学到了如何编写函数式或面向对象的代码,以获得最大的代码实用性。这不仅有助于在将来的项目中使用这些代码,还能减少当前项目所需时间。

文章来源:《探索科学》 网址: http://www.tskxzzs.cn/zonghexinwen/2020/0726/459.html

上一篇:中方抢夺太空主导权?外交部:太平洋大到能容下
下一篇:探秘青岛海信科学探索中心:内藏无数奥秘 亲子

探索科学投稿 | 探索科学编辑部| 探索科学版面费 | 探索科学论文发表 | 探索科学最新目录
Copyright © 2018 《探索科学》杂志社 版权所有
投稿电话: 投稿邮箱: