当前位置: 新豪天地登录网址 > www.3559.com > 正文

数据科学新人需要知道的13个雷区,13个顶级的机

时间:2019-12-22 02:28来源:www.3559.com
引言看来你已经决定要进入数据科学这个领域了。数据正在驱动越来越多的业务,世界的联系正在变得越来越紧密,似乎每个业务都需要数据科学实践。因此,对数据科学家的需求是巨

引言看来你已经决定要进入数据科学这个领域了。数据正在驱动越来越多的业务,世界的联系正在变得越来越紧密,似乎每个业务都需要数据科学实践。因此,对数据科学家的需求是巨大的。更好的是,所有人都承认这个行业的人才短缺。 然而成为一名数据科学家并不容易。需要拥有解决问题的能力、结构化思维、编码和各种技术技能才能真正获得成功。如果您并非技术或数学背景,那么通过书籍和视频课程来学习是很好的方式。但是大多数这类资源不会教你行业内需要什么样的数据科学家。

人工智能和机器学习技术在2017年风靡全球。看看微软在牛津的项目,IBM的沃森,谷歌的Deep Mind和百度的超级计算机Minwa,你就会明白现在的趋势。

一个初学者应该如何开始学习机器学习?这里有份3个月的课程,能帮助你从初学者到精通机器学习。这是一个快速学习计划,本课程将涵盖所有数学概念、机器学习理论和深度学习理论,让你能够尽快跟上该领域的发展。

这就是胸怀抱负的数据科学家努力缩小自我教育与实际工作之间差距的原因之一。

2015年,Gartner引入了机器学习(ML)的概念,当时,他预测ML将在2 ~ 5年内达到高峰。现在,Facebook和亚马逊这些大公司正在越来越多地利用机器学习,从大量的数据中提取有价值的信息。

www.3559.com 1

www.3559.com 2

研究预测,到2025年,人工智能市场将增长到约370亿美元,而在2015年,它仅有约6.45亿美元!

第一个月

本文将讨论数据科学爱好者常犯的一些错误(包括我自己都曾经犯过),我也会提供一些资源帮助你避开数据科学之旅上的陷阱。只学习理论概念,但不应用

www.3559.com 3

第1周 线性代数

“线性代数”,同微积分一样,是高等数学中两大入门课程之一,不仅是一门非常好的数学课程,也是一门非常好的工具学科,在很多领域都有广泛的用途。

本文推荐的是麻省理工学院的一门课程,课程讲述了矩阵理论及线性代数的基本知识,侧重于那些与其他学科相关的内容,包括方程组、向量空间、行列式、特征值、相似矩阵及正定矩阵。

本课程包含一系列视频讲座,感兴趣的可以前往网易公开课获取,这一部分掌握扎实的同学可以直接pass!

课程链接:

视频讲座:

www.3559.com 4

“机器学习是一个核心,是转变的方式,让我们重新思考我们正在做的一切。”——Sundar Pichai,谷歌首席执行官

第2周 微积分

此处推荐3Blue1Brown的《微积分的本质》系列视频。该系列一共有10个视频,总时长大约3小时。

3Blue1Brown的视频非常风趣,深入浅出,该系列视频的目的就是:让你感觉自己也能发明微积分!是不是心动了呢?

B站地址:

图片来源:cognitive class-YouTube

机器学习或人工智能广泛商业化的成功是无处不在的,从亚马逊推荐你可能喜欢看的电影到能够区分行人和树的谷歌自驾车。数据驱动的AI / ML已经帮助商业领袖做出决定,衡量业务,研究人类行为和进行预测分析。如果你的组织想要涉足这个非凡的领域,你需要考虑清楚。

第3周 概率

本周推荐edX的一门课程。这门课程主要介绍了概率模型,包括随机过程和统计推断的基本要素。

就像我之前提到过的一样,掌握机器学习技术背后的理论是非常好的,但是如果你不去应用它们,它们就仅仅是理论概念。当我开始学习数据科学的时候犯了同样的错误,我学习书本知识和在线课程,但却没有应用它们去解决问题。 所以当我有机会应用我所学的知识去解决挑战或问题时,几乎一大半我都不记得了!要学的东西太多了,算法、推导、研究论文等等等等。你有很高的几率失去动力然后半途放弃。我本人见证过许许多多想进入这个领域的人都是这样。如何避免?学习过程中保持理论和实践之间健康的平衡是非常必要的。只要学习了一个概念,请立即 Google一下找到可以应用它的数据集或问题。你会发现你比以前更好地吸收了这种概念。

随着并行计算的成本降低,大数据的改进和算法的突破,应用型人工智能是当今世界发展的方向。处理大量数据需求以及物联网连接设备数量的增加都大大增加了机器学习的重要性。

课程涵盖了所有基本概率概念,包括

多个离散或连续的随机变量,期望值和条件分布

大数量的法则

贝叶斯推理方法的主要工具

随机过程介绍(泊松过程和马尔可夫链)

你必须承认所有东西是不可能一次性学完的。一边练习一边填补空白,将会学到更多东西!

AI / ML具有很大潜力,对于工程师或数据挖掘、模式识别的爱好者来说,这是一个不错的职业选择。此外,机器学习是数据科学不可分割的一部分,被哈佛商业评论评为21世纪最性感的工作  。

本周,你会学到这些东西:

概率模型的基本结构和要素

随机变量及其分布、均值和差异

概率计算

推理方法

www.3559.com ,大数定律及其应用

随机过程

课程链接:

www.3559.com 5

不了解原理或概念直接进行机器学习

埃文斯数据公司的一项研究发现,接受调查的500名开发人员中,有36%在其大数据或其他分析项目中使用ML元素。首席执行官Janel Garvin表示:“机器学习与许多目前正在迅速采用的AI技术,已经使大数据和高级分析方面的开发人员处于领先地位。”

第4周 算法

算法是计算机科学的核心,它有着无数的实际应用和知识深度。coursera有上百个算法教学视频供你挑选,弥补自己欠缺的地方。本文推荐的就是一份学习算法的集合。

课程链接:

www.3559.com 6

她补充说:“我们看到越来越多的开发人员对各种形式的认知计算产生兴趣,包括模式识别、自然语言识别和神经网络,我们充分期待明天的计划将基于今天这些新兴的技术。”

第二个月

图片来源:伦敦帝国理工学院 – YouTube

www.3559.com 7

第1周 Python、数学、TensorFlow

大部分想成为数据科学家的人是看到了机器学习的相关视频,或一个超级棒的预测模型,抑或是高薪的吸引,然而,想要成为你看到的样子,还需要走很长的路。

因此,对于拥有计算机科学、机器学习、运筹学或统计学学位的人来说,在未来的一段时间内,世界可能就是他们的囊中之物。

数据科学中的Python

这个视频将同时教你Python和数据科学!

视频链接:

在将技术应用到问题之前,你应该先了解它的工作原理。这将有助于了解算法的工作原理,以及做些什么可以对其进行微调,还可以帮助你构建现有技术。数学在这里发挥着重要作用,因此了解某些概念总是有帮助的。在日常的企业数据科学家角色中,您可能不需要了解高级微积分,但有高级的整体认识肯定是有帮助的。线性代数微积分统计概率

本文整理了一些免费的顶级ML和AI课程,这些课程将帮助你成为下一个ML专家。当然,这是一项艰苦的工作,但是如果你在该领域有所追求,你会发现通过这种方式,可以取得成功。

智力数学入门

本视频是YouTube网红技术达人Siraj Raval的智力数学系列视频的入门介绍,视频介绍了一种非常流行的优化技术——梯度下降。

Siraj Raval是一位思维很敏捷的深度学习者,上课喜欢乱放表情包,中间还有歌舞,非常有趣,课堂效果很不错。

视频链接:

想要更多,附赠系列视频地址:

1.吴恩达:机器学习

Coursera联合创始人吴恩达的为期11周的课程。作为一个偏应用的机器学习课程,它讲述了最好的机器学习和统计模式识别技术,并教你如何实现学习的算法。

广泛地讲,它包括有监督和无监督学习,线性和逻辑回归,正则化和朴素贝叶斯。他使用Octave和MatLab。该课程还有丰富的案例研究和一些实际应用。要求学生了解概率、线性代数和计算机科学的基础知识。该课程广受用户好评。

课程链接:

TensorFlow简介

这段视频大约5分钟,在这5分钟里将教会你TensorFlow入门,如何在40行代码(不包括空格和注释)下用Python构建手写数字图像分类器。

视频链接:

www.3559.com 8

2. Udacity:机器学习介绍

作为Udacity数据分析师纳米学位的一部分,这个大约为期10周的课程教授了使用机器学习处理数据集所需的所有知识,以提取有用的见解。教师Sebastian Thrun和Katie Malone要求初学者了解Python和基本的统计概念。

本课程教授从聚类到决策树,从Adaboost到SVM等ML算法。此外,许多用户还建议参加数据科学基础课程,包括数据操作、数据分析、信息可视化、数据通信以及大规模数据处理等内容。

课程链接:

第2周 机器学习入门 

机器学习将计算机科学和统计学结合起来,以利用这种预测能力。对于所有有抱负的数据分析师和数据科学家,或者任何想将所有原始数据转化为精确趋势和预测的人来说,这都是必备技能。

本周推荐的是udacity的“机器学习入门”课程,该课程将教你从机器学习角度调查数据的端到端流程,教你如何提取和识别最能代表数据的有用特征、一些最重要的机器学习算法,以及如何评估你的机器学习算法的性能。

课程链接:

3. 加州理工:从数据中学习(介绍性机器学习)

加州理工大学电子工程与计算机科学教授Yaser S. Abu-Mostafa将向你介绍机器学习的基本理论原理、算法和应用。

课程需要每周花费10到20小时,持续10周。他们还有5周的课程,基于数据科学和分析的机器学习,新手可以学习更多的算法。

课程链接:

www.3559.com 9

第3、4周 N个深度学习项目创意

这是GitHub上关于深度学习的一个开源项目,内容包括四个方面:文本、自然语言理解、预测、推荐系统、视觉。其中每个部分又有许多分类,每个分类下包括一个深度学习的创意,并提供数据集。跟着该项目的脉络学习,相信你能越来越熟练。

4.卡内基梅隆:统计机器学习

这是YouTube上一个高级机器学习视频系列讲座,教师Larry Wasserman是卡内基梅隆大学统计系和机器学习系教授。

本课程是他为博士生准备的中级统计和机器学习讲座。如果你想理解这些课程,需要确保自己有一定的数学、计算机科学和统计基础。

课程链接:

文本

堆栈溢出问题的自动标记

关键词/概念识别

主题标识

5. Hinton:机器学习神经网络

多伦多大学名誉教授Gregory Hinton也在谷歌山景城工作,他教这个由Coursera提供的为期16周的高级课程。

作为深度学习领域的先驱,Hinton在YouTube上的演讲视频讲述了神经网络在图像分割、人体运动、建模语言、语音和物体识别等方面的应用。本课程希望学生熟练掌握微积分,并具有Python编程经验。

课程链接:

自然语言理解

作文自动评分

句子间的语义相似性

开放域问题回答

自动文本摘要

仿猫机器人

情感分析

去匿名化

6. Google:深度学习

Udacity提供了这个让机器学习更上一层楼的免费课程。Google的3个月课程不适合初学者。它讨论了深度学习的动机,深度神经网络,卷积网络以及文本和序列的深层模型。

课程负责人Vincent Vanhoucke和Arpan Chakraborty希望学习者具有Python编程经验和一些GitHub经验,并了解机器学习、统计学、线性代数和微积分的基本概念。其中TensorFlow(谷歌自己的深度学习库)课程还有一个额外的优势,那就是可以自己掌握进度。

课程链接:

www.3559.com 10

预测

单变量时间序列预测

多变量时间序列预测

需求/负载预测

预测献血量

7. DataCamp:基于 R的机器学习教程

DataCamp提供这种交互式的学习体验,将帮助你在Kaggle竞赛中获得高分。他们还有免费的介绍R的课程。

课程链接:

推荐系统

电影推荐器

搜索 推荐系统

你能预测社交网络中的影响者吗?

8. 微软:机器学习原理

微软数据科学专业计划证书的一部分,这是一个为期6周的中级课程。它教你如何使用Python、R和Azure云平台来构建和使用机器学习模型。

教师Steve Elston和Cynthia Rudin博士在课程中介绍了机器学习中的分类、回归、监督模型、非线性建模、聚类和推荐系统。如果想要获得认证证书,就需要付款了。

课程链接:

视觉

图像分类

图像标题

图像分割/对象检测

大规模视频理解

视频汇总

风格转移

人脸识别

临床诊断:图像识别、分类和分割

社会经济分析的卫星图像处理

自动标记的卫星图像处理

项目链接:

www.3559.com 11

9. 亚马逊:机器学习专业化

华盛顿大学已经创建了五门课程,通过实际案例研究,介绍机器学习的基础知识。这个为期6周的课程,每周需要5到8小时的学习时间,包括ML基础、分类、聚类、回归、推荐系统、降维以及介绍一些使用深度学习的项目。

亚马逊的Emily Fox和Carlos Guestrin是指导老师,他们要求学习者掌握基本的数学和编程技巧,并掌握Python的相关知识。课程学习是免费的,获得有效的证书需要付费。

课程链接:

www.3559.com 12

第三个月 

10. EdX的人工智能

EdX的这个激动人心的课程讲述了AI应用,例如机器人学和NLP,机器学习(AI分支)算法,数据结构,游戏和约束满足问题。它持续12周,是哥伦比亚大学的高级教程。

课程链接:

第1周 深度学习入门

此次推荐的还是YouTube网红老师的课。本视频是其深度学习系列视频的入门篇,适用于任何一位想成为深度学习工程师同学。这个视频将通过10行Python代码使用线性回归预测动物的体重。

该系列视频是Siraj Raval和Udacity合作开发的深度学习纳米学位基础课程。如果你想提高深度学习的水平,可以去系统地学习。

视频链接:

11. Udacity:人工智能介绍

该课程介绍AI的“代表性应用程序”。它是“机器学习工程师纳米学位计划”的一部分。教师Sebastian Thrun和Peter Norvig带你了解AI的基础知识,包括贝叶斯网络,统计数据和机器学习以及AI应用,如NLP、机器人技术和图像处理的应用。课程要求学生知道线性代数和概率论。

课程链接:

第2周 fast.ai的深度学习课

此处推荐fast.ai的深度学习课程,由Jeremy Howard(Enlitic创始人)授课。在这里不需要有研究生的水平就可以了解如何建立最先进的模型。这个课程是完全免费的!还有一个由数千名其他学习者组成的论坛,随时准备为你提供帮助。

课程链接:

12.斯坦福:人工智能(原理和技术)

这个斯坦福大学的课程讲述了AI如何使用数学工具来处理机器翻译、语音、人脸识别以及自动驾驶等方面的复杂问题。课程大纲包括:机器学习概念,树搜索、动态规划、启发式,AI玩游戏,马尔可夫决策过程,约束满足问题,贝叶斯网络,逻辑和任务。

课程链接:

第3、4周 关注这些

13.佐治亚理工学院:机器人与人工智能

这个课程由Udacity提供,讲述了如何模仿斯坦福和谷歌的做法来编程一个机器人汽车。它是深度学习纳米学位基础课程的一部分。Sebastian Thrun将教授定位,卡尔曼和粒子滤波器,PID控制和SLAM等内容。课程要求学生对线性代数和概率等数学概念,Python知识以及编程经验有一定的掌握。

课程链接:

本文列出的一些课程旨在帮助你快速进入机器学习和人工智能这个令人兴奋和快速发展的领域。这些专注于特定学习领域的世界级课程,是你在机器学习、数据科学等领域获得璀璨职业生涯的极好基石。

所以一旦你确定了自己的学习目标,并具备一定的技术能力,那么,请制定一份学习计划,给自己设定一个时间限制,然后,请自律,并按时完成计划;尝试与他人有效地合作,最重要的是找到方法,并始终保持动力。

来源:TechyHealth

作者:Kate Bolduan

智能观 编译

—完—

想知道AI加教育领域有哪些最新研究成果?

想要AI领域更多的干货?

想了解更多专家的“智能观”?

请在对话界面点击“找找看”,去获取你想要的内容吧。

www.3559.com 13

在GitHub上重新实现深度学习项目

这里有YouTube网红Siraj Raval老师的GitHub大本营,资源非常多,好好学吧!

链接:

资源

这是问答网站quora上的一个问题:“我应该在Twitter上关注哪些人以获取有用和可靠的机器学习信息?”

这是不是你的心声?你是不是也跃跃欲试了?当然底下的回答也会让你十分满意的,快去看看吧!

链接:

(本文参考Siraj Raval的视频整理)

—完—

亲爱的朋友:

又到了周三的充电时间。

经常有同学在后台问:想自学人工智能,有什么建议?

今天送给你一份机器学习路径,希望对你有所帮助。

祝安!

                                    智能观  一米

2018-3-14 于北京中关村

想知道AI加教育领域有哪些最新研究成果?

想要AI领域更多的干货?

想了解更多专家的“智能观”?

请在对话界面点击“找找看”,去获取你想要的内容吧。

声明:

编译文章旨在帮助读者了解行业新思想、新观点及新动态,为原作者观点,不代表智能观观点。

www.3559.com 14

编辑:www.3559.com 本文来源:数据科学新人需要知道的13个雷区,13个顶级的机

关键词: www.3559.com