PS: 做了多年的后台开发,近来又想再学习一下人工智能方面的内容。虽然在18年初人工智能正火时,由于当时公司要做人工智能方面的规划,因此也看了一些人工智能方面的书籍(注:主要是数学理论方面)。但由于部门本身并不涉及人工智能方向,也没有牛人指引,所看的人工智能理论方面的书籍因难度较大也是似懂非懂,所以一直感觉没有真正入门。另外,由于后续自身本职工作繁忙,以及生活身体方面的一些问题,也没有真正再投入过多的时间来了解人工智能。

直至最近,在自身后台开发技术栈方面逐渐完备,为顺应时代及个人发展,又一次想要自学一下人工智能。回顾以前学习路径,总感觉自己不得要领,于是在网上查找了大量关于人工智能学习路线方面的文章,觉得浅析人工智能入门简易学习路线(附资料和数据一文较好,一方面是因为作者本身系计算机博士;另一方面是在众多的学习路径上,作者也给出了指引,在自学的实际操作层面也对新人较为友好。因此,把文章转载于此,防止原文丢失,并期望自己按此路径也能真正入门人工智能。

注: 下文中“我”均为黄海广博士,并非鄙人。除文章格式略有调整之外,其他均为黄海广博士原文内容

本文为AI入门提供了一个简易的学习路线,并提供了代码和数据集下载。

1. 前言

AI以及机器学习入门,初学者遇到的问题非常多,但最大的问题就是:资料太多!!!看不完!!!不知道如何取舍!!!人的精力有限!!!

我结合已经发过的文章,以及自己的学习过程,整理出一个AI的入门路线,并整合到一个github仓库,所有代码和数据集都提供了下载方式。

本路线适合本科、硕士以及刚接触机器学习的博士。

根据这个github仓库学完以后,就基本入门了。

入门以后,遇到问题能上网搜索解决了,也知道接下来应该学什么。

2. 学习路线的github

该仓库由我创建,希望能帮助机器学习初学者入门,帮助学习者更好地成长。仓库一部分内容由我编写和整理,另一部分由其他公益组织创作。

仓库链接:

https://github.com/fengdu78/Data-Science-Notes

3. 仓库目录及概述

1)math:数学基础

2) python-basic:python基础

3) numpy:numpy基础

4)pandas:pandas基础

5)scipy:scipy基础

6)data-visualization:数据可视化基础

7)scikit-learn:scikit-learn基础

8) machine-learning:机器学习入门

9)deep-learning:深度学习入门

10)feature-engineering:特征工程入门

4. 学习路线说明

这个目录其实是一个学习路线:

0——>1——>2——>3——>4——>5——>6——>7——>8——>9

1-5是个整体,6和7的顺序可以交换也可以同时学习,8属于选学部分(深度学习),9放在最后学习。

5. 学习路线和内容

第一部分: 数学基础学习

目录名称:0.math

数学基础:数学基础内容太多,很容易把人劝退,其实先把高等数学、概率论与数理统计和线性代数这三门课学熟了,大部分机器学习问题是能解决的。数学基础部分我放了三个资料。

第一个是当时考研和考博士复习的。数学基础,我把机器学习的部分,提炼出来。

第二、三个是今年刚翻译的CS229的线性代数和概率论,这部分是斯坦福所有人工智能有关的课程的数学基础复习材料,非常实用。

这部分内容曾经有文章介绍(查看文章)

第二部分: python学习

1) 目录名称:1.python-basic

python基础:这里有个代码练习:两天入门python

2) 目录名称: 2.numpy

numpy基础:这里有2个代码练习

  • 一、适合初学者快速入门的Numpy实战全集

  • 二、Numpy练习题100题-提高你的数据分析技能

3) 目录名称: 3.pandas

pandas基础:这里有3个代码练习

  • 一、《十分钟搞定pandas》:10-Minutes-to-pandas,这是十分钟搞定pandas 10 minutes in pandas的中文翻译。

  • 二、《pandas练习题》:Pandas_Exercises,这个是pandas的练习题。

  • 三、《pandas入门教程-2天学会pandas》:pandas_beginner

4) 目录名称: 4.scipy

scipy基础:scipy的示例代码

5) 目录名称: 5.data-visualization

数据可视化基础:这里有2个代码练习

  • 一、matplotlib学习之基本使用

  • 二、数据可视化的利器-Seaborn简易入门

第三部分: 机器学习基础

1) 目录名称:6.scikit-learn

scikit-learn基础:PyParis 2018: Machine learning using scikit-learn的代码翻译(截图如下:)

ai-learning-roadmap

2) 目录名称:7.machine-learning

机器学习入门,推荐4份教程,着重推荐1、2部分。

  • 一、斯坦福大学2014(吴恩达)机器学习教程中文笔记及资源

内容介绍(点击查看文章

黄海广:吴恩达老师的机器学习和深度学习笔记更新了!(附PDF下载)

  • 二、李航《统计学习方法》的代码实现

内容介绍(点击查看文章

  • 三、周志华老师的《机器学习》的解答–南瓜书PumpkinBook

内容介绍(点击查看文章

  • 四、台大林轩田《机器学习基石》系列课程教材的习题解答

内容介绍(点击查看文章

3) 目录名称:8.deep-learning

深度学习入门,推荐3份教程

  • 一、深度学习教程中文笔记

内容介绍(点击查看文章

  • 二、《python深度学习》的代码翻译版

内容介绍(点击查看文章

  • 三、 强烈推荐的TensorFlow、Pytorch和Keras的样例资源

内容介绍(点击查看文章

4) 目录名称:9.feature-engineering

特征工程入门,这个是项目实战部分。

  • 一、面向机器学习的特征工程

内容介绍(点击查看文章

6. 总结

本文提供了适合初学者入门AI的路线及资料下载,以上内容都整合到一个仓库:

仓库链接:fengdu78/Data-Science-Notes



[参考书目]:

  1. 浅析人工智能入门简易学习路线(附资料和数据

  2. Data-Science-Notes