【转载声明】

本文转载自互联网,原作者:Jay Alammar,译者:苏南下
原文链接:https://jalammar.github.io/visual-numpy/

推荐理由:
学 Python 尤其是数据科学和机器学习,最基础的 NumPy 用法必须得熟悉。网上这方面的教程不少,但基本都千篇一律,枯燥罗列代码,而数组和矩阵本身是有些抽象的,这样难以理解。本文生动形象的介绍了数据科学中常用库NumPy的使用方法,基于可视化的方式更助于理解和记忆NumPy库各功能的应用。话不多说,让我们一睹为快。

数组

先来介绍最基础的一维数组。

创建数组

np.array() 直接创建:

1565893709057

使用 np.ones()、np.zeros() 等方法:

1565893727094

我们在写数组的时候是横着写的,而其实数组是列向量,这样很直观。

数组运算

加减乘除

1565893765396

数组乘以数值

1565893783530

数组索引

1565894501837

数组聚合

1565893810888

上面是一维数组,下面介绍二维维数组也就是矩阵的使用技巧。

矩阵

创建矩阵

直接创建:

1565893823617

使用 np.ones()、np.zeros() 等方法:

1565893840961

这样就很容易理解括号里 (3,2) 的含义。

矩阵运算

1565893869140

矩阵点积

矩阵点积跟线性代数基本一样,有些抽象,借助示意图能很好理解:

1565893884352

进一步拆分解释:

1565893895992

矩阵索引

1565893909157

矩阵聚合

求最值

1565893922492

按行 / 列聚合

1565893932766

矩阵转置

1565893946037

矩阵重塑

reshape() 用法:

1565893968093

高维数组

Numpy 不仅可以处理上述的一维数组和二维矩阵,还可以处理任意 N 维的数组,方法也大同小异。

创建多维数组

1565893997794

掌握了以上基础后,我们可以做个小练习,计算概率论中的一个常见量——均方误差 MSE:

1565894034073

可以看到有减法、平方、求和等运算:

1565894050807

分别假设相应的预测值和真实值:

1565894074284

□全文终.