前言:人工智能作为计算机相关的一个领域,有相关基础那是再好不过了,计算机专业的知识将很大程度上决定你能在人工智能领域走多远,当然没有基础也不是不可以,但你至少还是要学门程序语言,比如说Python或R语言。
如何自学人工智能技术,人工智能自学可以吗,如何自学人工智能技术才能成功呢?
不少同学跃跃欲试,想投入 AI 的怀抱,但苦于不知如何下手。其中,人工智能的核心就是机器学习(Machine Learning),它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。
自学人工智能可行吗?
可以很肯定的说,是可行的,只是这个领域的门槛相对较高,想要入门甚至入职这个行业还是比较有难度的。
怎么学人工智能编程:http://qh.itpxw.cn/ai/python/201839581.html
学人工智能10本必看书:http://qh.itpxw.cn/ai/python/201839580.html
人工智能属于什么专业:http://qh.itpxw.cn/ai/python/201839579.html
如果你擅长以下几个方面中的一个或几个,成功的机会会大很多,如果。
1.数学知识(统计学背景也行):人工智能虽然不要求你数学多么厉害,但还是需要一些数学基础的(理解算法原理需要,其实程序员应用人工智能方面的技术有很多成熟的框架,不一定需要你深入理解底层原理),如果你本科期间是数学专业的,入门将会比较容易,当然不是数学专业也没关系,因为对数学的要求也不是很高,相关知识一般理工科的本科生都学过(线性代数、概率论、简单微积分)。
2.计算机基础:人工智能作为计算机相关的一个领域,有相关基础那是再好不过了,计算机专业的知识将很大程度上决定你能在人工智能领域走多远,当然没有基础也不是不可以,但你至少还是要学门程序语言,比如说Python或R语言。
3.英语能力:同上面两点一样,英语能力不是必须的,但具备相关能力将锦上添花。人工智能兴起于欧美,目前大多数学术研究和商业应用也在欧美,所以如果你英语很好,这对资料阅读将会非常有利。
4.惊人的毅力:这个不用多说。学习一门前沿技术不是三两天的事,主要还是看你能坚持多久,如果你完全零基础,要想入门人工智能(更具体点说应该是机器学习或者深度学习吧),保守估计得半年,如果你一边工作一边学习可能会更久,所以要做好心理准备不要半途而废。
以下是一些建议:
1.有条件的还是报个班全力学吧(如果是在校学生其实也可以自学,毕竟学生有充足的可支配时间而且数学没落下)
2.多在网上找资源,推荐吴恩达的机器学习课程和深度学习课程(国内MOOC平台网易云课堂上有他的课,国外的Coursera上也有,语言英语,免费),适合入门,国内很多MOOC平台上有计算机专业的课程,学程序语言可以在上面找,中文授课英文授课的都有,完全免费。
3.台湾学校的一些课程也不错,比如说机器学习基石,机器学习技法,从数据中学习(这个系列也是适合入门的)。
4.多看看相关大牛的技术博客,多上一些代码托管平台,开源网站逛逛。
总而言之,没基础想学习入门完全是可以的,只是想要有所建树比较难,但是也要正式现实,想要零基础转行一定要慎重(风险太大,尤其是年龄偏大的),如果你是在校生,那真的很鼓励你学一学,人工智能正开始兴起(如同零几年的互联网),哪怕你最终没有掌握,了解一下也是可以的,毕竟这是将来的趋势。
我们今天就来分享一篇来自 EliteDataScience 上专门讲给机器学习入门自学者的教程,一步步教你如何从基础小白进阶为 ML 大拿。快上车吧,别找硬币了,这趟车不要钱!

你是否正在准备自学机器学习,但又不知道怎么去学、还被那些贵的要命的培训课程吓得不行?
今天我们在这篇文章里就教你怎样免费获得世界级的机器学习教育,你既不需要有博士学位,也不必是技术大牛,更不必卖好几个肾去买一份很贵的培训课程。不管你是想成为数据科学家还是在开发中使用机器学习算法,其实你都能比想象中更快地学习和应用机器学习。
本文告诉你在机器学习之路上的几个步骤,保你不会迷路,下面开始我们的表演。
第一步:先搞懂什么是机器学习
在闷头学习机器学习之前,最好先把什么是机器学习搞清楚,了解机器学习的基本概念。
简单来说,机器学习就是教电脑怎样从数据中学习,然后做出决策或预测。对于真正的机器学习来说,电脑必须在没有明确编程的情况下能够学习识别模型。
机器学习属于计算机科学与统计学的交叉学科,在多个领域会以不同的面目出现,比如你应该听过这些名词:数据科学、大数据、人工智能、预测型分析、计算机统计、数据挖掘······
虽然机器学习和这些领域有很多重叠的地方,但也不能将它们混淆。例如,机器学习是数据科学中的一种工具,也能用于处理大数据。
机器学习自身也分为多个类型,比如监督式学习、非监督式学习、增强学习等等。例如:
邮件运营商将垃圾广告信息分类至垃圾箱,应用的是机器学习中的监督式学习;电商公司通过分析消费数据将消费者进行分类,应用的是机器学习中的非监督式学习;而无人驾驶汽车中的电脑合摄像头与道路及其它车辆交互、学习如何导航,就是用到了增强学习。
第二步:预备知识
如果没有基本的知识储备,机器学习的确看起来很吓人。要学习机器学习,你不必是专业的数学人才,或者程序员大牛,但你确实需要掌握这些方面的核心技能。
好消息是,一旦完成预备知识,剩下的部分就相当容易啦。实际上,机器学习基本就是将统计学和计算机科学中的概念应用在数据上。
这一步的基本任务就是保证自己在编程和统计学知识上别掉队。
2-1:用于数据科学中的Python编程
如果不懂编程,是没法使用机器学习的。幸好,这里有份免费教程,教你如何学习应用于数据科学中的Python语言:
注:景略集智再补充三个资源:
[Python入门] 01 基本法则 - 集智专栏:
从零学习数据科学中Python的完全指南:
2-2:用于数据科学的统计学知识
了解统计学知识,特别是贝叶斯概率,对于许多机器学习算法来说都是基本的要求。
这里有份学习数据学习中统计学知识的教程
2-3:需要学习的数学知识
研究机器学习算法需要一定的线性代数和多元微积分知识作为基础。点这里,获取一份免费学习教程:
第三步:开启“海绵模式”,学习尽可能多的原理知识

所谓“海绵模式”,就是像海绵吸水一样,尽可能多地吸收机器学习的原理和知识,这一步和第一步有些相似,但不同的是,第一步是对机器学习有个初步了解,而这一步是要掌握相关原理知识。
可能有些同学会想:我又不想做基础研究,干嘛要掌握这些原理,只要会用机器学习工具包不就行了吗?
有这个疑问也很正常,但是对于任何想将机器学习应用在工作中的人来说,学习机器学习的基础知识非常重要。比如你在应用机器学习中可能会遇到这些问题:
数据收集是个非常耗时耗力的过程。你需要考虑:我需要收集什么类型的数据?我需要多少数据?等此类的问题。
数据假设和预处理。不同的算法需要对输入数据进行不同的假设。我该怎样预处理我的数据?我的模型对缺失的数据可靠吗?
解释模型结果。说机器学习就是“黑箱”的观点明显是错误的。没错,不是所有的模型结果能直接判读,但你需要能够判断模型的状况,进而完善它们。我怎么确定模型是过度拟合还是不充分拟合?模型还有多少改进空间?
优化和调试模型。很少有人刚开始就得到一个最佳模型,你需要了解不同参数之间的细微差别和正则化方法。如果我的模型过度拟合,该怎么修正?我应该将几个模型组合在一起吗?
要想在机器学习研究中解答这些问题,掌握机器学习的知识原理必不可少。这里推荐两个世界级的机器学习课程,一定会让你受益良多:
哈佛大学的机器学习课程,让你了解从数据收集到数据分析的整个流程:
(提示:这个课程和吴恩达教授的课程配合食用,效果更加)
斯坦福大学的机器学习课程,清楚地讲解了机器学习的核心概念:
还有两部值得读的参考书籍:《统计学习导论》和《统计学习基础》
注:看不惯英文原版的同学,可以去读这两本书的中文版。
逛论坛不容易看到高阶知识,你不能一直停留在菜鸟阶段不是,要升级就有必要看看专业的论文。arXive是个好去处,是个收集物理学、数学、计算机科学与生物学的论文预印本的网站。
第四步:针对性实际练习
在开启“海绵模式”后,你应该掌握了机器学习的基础理念知识,接着就该实际操作了。
实际操作主要是通过具体的、深思熟虑的实践操作增强你的技能。本步目标有三个:
练习机器学习的整个流程:收集数据,预处理和清理数据,搭建模型,训练和调试模型,评估模型。
在真正的数据集上实践操作:对于什么样的数据适合用什么类型的模型,自己应逐渐建立这方面的判断能力。
深度探究:例如在上一步,你学习了很多机器学习算法知识,在这一步就要将不同类型的算法应用在数据集中,看看哪个效果最好。
完成这一步后,就可以进行更大规模的项目了。
4-1 九个基本部分
机器学习是一个非常广泛和丰富的领域,几乎在每个行业都有应用。因为要学习的东西太多,初学者很容易发慌,而且在面对很多个模型时也很容易迷失,看不到大局。
因此,我们把机器学习大概划分为九个部分:
ML整体学习:
基本的机器学习原理,比如方差权衡这些知识。

优化:
为模型发现最优参数的算法。

数据预处理:
处理缺失数据、偏态分布、异常值等。

取样和拆分
怎样拆分数据集来调整参数和避免过度拟合。

监督式学习
使用分类和回归模型从标记数据中学习。

非监督式学习
使用因素和集群分析模型从非标记数据中学习。

模型评估
根据不同的性能度量做出决策。

集成学习
将不同模型相结合,达到更好的性能。

商业应用
机器学习如何帮助不同类型的商业业务。

4-2 实践工具
对于初学者,我们建议采用现成可用的算法,这样可以把时间用在熟悉机器学习流程上,而不是写算法。根据你使用的编程语言,有两个不错的工具(链接为使用教程):
Python的Scikit-Learn、R语言的Caret
4-3 利用数据集实践操作
在这步需要用数据集进行搭建和调试模型的实际操作,也就是将你在“海绵模式”阶段学到的理论转变为代码。我们建议你选择UCI Machine Learning Repo,Kaggle和http://Data.gov上的数据集开始入手:
UCI Machine Learning Repo、Kaggle
第五步:机器学习项目
终于到了最后一步,也是很有意思的一步。目前为止,我们已经完成了:知识储备、掌握基本原理、针对性练习等阶段,现在我们准备探究更大的项目:
这一步的目标就是练习将机器学习技术应用于完整的端到端分析。
任务:完成下面的项目,依次从易到难。
5-1:“泰坦尼克号”幸存者预测
“泰坦尼克号”幸存者预测是练习机器学习时相当流行的选择。而且有非常多的教程可供参考。

5-2 从零开始写算法
我们建议你先以一些简单的方面写起:逻辑回归、决策树、k 最近邻算法等。
如果中间卡住了,这里有些小技巧可以参考:
维基百科是个不错的资源库,提供了一些常见算法的伪代码。
可以看看一些现成ML工具包的源代码,获得灵感。
将算法分为几部分。写出取样、梯度下降等的分离函数。
在开始写整个算法前,先写一个简单的决策树。
5-3 选个有趣的项目或自己感兴趣的领域
其实这应该是机器学习最棒的部分了,可以利用机器学习实现自己的想法。
如果实在没想到好点子,这里有6个有趣的初学者机器学习实践项目:
结语:
如果你按照这个步骤一步步扎实学习的话,相信你最终一定在机器学习方面小有成就!
我们对初学机器学习的人还有10个小小的tips:
为自己设定学习目标和期限,尽力完成。
打好学习基础,掌握基本理论。
将实践理论相结合,不要只关注某一个方面。
试着自己从头写几个算法。
多角度思考问题,找到自己感兴趣的实践项目。
多想想每个算法能产生什么价值。
不要相信科幻电影中对ML的胡吹。
别过度理会网上关于ML知识的争论。
多想想数据的“输入/输出”,多问问“为什么”。
上集智,第一时间将自己升级。→→ 集智 - 通向智能时代的引擎
最后,祝同学们学有所成!
文章出自:http://qh.itpxw.cn/ai/python/201839582.html
文章标题:如何自学人工智能
免责声明:本站文章均由入驻起航学习网的会员所发或者网络转载,所述观点仅代表作者本人,不代表起航学习网立场。如有侵权或者其他问题,请联系举报,必删。侵权投诉
IT培训网 访问该机构站点 报名留言 加为好友 用户等级:注册会员
用户级别:10
机构名称:IT培训网
联 系 人:罗老师
联系电话:13783581536
联系手机:13783581536
在线客服:
在 线 QQ:
电子邮件:
网站域名:http://www.itpxw.cn
注册时间:2016-07-18 11:07
最后登录:2021-09-13 16:09
如此一来,随着时间推移,2040 年之后,感觉程序员迟早会被 人...
AI时代人类会不会丢饭碗,之前已经有很多讨论,大部分人都表...
人工智能作为新的用户界面不再是一个片面的方法。我们需要理...
过去的 20 年里,许多互联网公司有幸积累了大量的数据,因此在...