李飞飞 CS231n 官方笔记授权翻译正式发布

来源：互联网编辑：wan玩得好手游小编更新：2026-06-28 05:58:54 人气:

想入门深度学习，CS231N课程非常好的学习资源，这里面所有的内容讲的都比较细，唯一不太友好的是英文教学，当然网易公开课已经有翻译过的视频了，本课程的笔记也是非常好的学习资料，官方笔记终于翻译出来了。

CS231n 简介

CS231n的全称是CS231n: Convolutional Neural Networks for Visual Recognition，即面向视觉识别的卷积神经网络。课程地址：

http://vision.stanford.edu/teaching/cs231n/index.html

该课程是斯坦福大学计算机视觉实验室推出的课程。需要注意的是，目前大家说CS231n，大都指的是2016年冬季学期（一月到三月）的最新版本。

课程描述：请允许我们引用课程主页上的官方描述如下：

计算机视觉在社会中已经逐渐普及，并广泛运用于搜索检索、图像理解、手机应用、地图导航、医疗制药、无人机和无人驾驶汽车等领域。而这些应用的核心技术就是图像分类、图像定位和图像探测等视觉识别任务。近期神经网络（也就是“深度学习”）方法上的进展极大地提升了这些代表当前发展水平的视觉识别系统的性能。本课程将深入讲解深度学习框架的细节问题，聚焦面向视觉识别任务（尤其是图像分类任务）的端到端学习模型。在10周的课程中，学生们将会学习如何实现、训练和调试他们自己的神经网络，并建立起对计算机视觉领域的前沿研究方向的细节理解。最终的作业将包括训练一个有几百万参数的卷积神经网络，并将其应用到最大的图像分类数据库（ImageNet）上。我们将会聚焦于教授如何确定图像识别问题，学习算法（比如反向传播算法），对网络的训练和精细调整（fine-tuning）中的工程实践技巧，指导学生动手完成课程作业和最终的课程项目。本课程的大部分背景知识和素材都来源于ImageNet Challenge竞赛。

课程内容：官方课程安排及资源获取请看下方链接：

http://vision.stanford.edu/teaching/cs231n/syllabus.html

通过查看官方课程表，我们可以看到 CS231n 课程资源主要由授课视频与PPT，授课知识详解笔记和课程作业三部分组成。其中：

授课视频15课。每节课时约1小时左右，每节课一份PPT。
授课知识详解笔记共9份。光看课程视频是不够的，深入理解课程笔记才能比较扎实地学习到知识。
课程作业3次。其中每次作业中又包含多个小作业，完成作业能确保对于课程关键知识的深入理解和实现。
课程项目1个。这个更多是面向斯坦福的学生，组队实现课程项目。
拓展阅读若干。课程推荐的拓展阅读大多是领域内的经典著作节选或论文，推荐想要深入学习的同学阅读。

课程评价：我们觉得赞！很多人都觉得赞！当然也有人觉得不好。具体如何，大家搜搜 CS231n 在网络，在知乎上的评价不就好了嘛！个人认为：入门深度学习的一门良心课。适合绝大多数想要学习深度学习知识的人。

课程不足：课程后期从RCNN开始就没有课程笔记。

课程学习方法

三句话总结：

看授课视频形成概念，发现个人感兴趣方向。
读课程笔记理解细节，夯实工程实现的基础。
码课程作业实现算法，积累实验技巧与经验。

引用一下学习金字塔的图，意思大家都懂的：

我们的工作

一、完成了CS231n全部9篇课程知识详解笔记的翻译：

1. Python Numpy Tutorial

原文：

http://cs231n.github.io/python-numpy-tutorial/

翻译：

https://zhuanlan.zhihu.com/p/20894041?refer=intelligentunit

https://zhuanlan.zhihu.com/p/20900216?refer=intelligentunit

我们将使用 Python 编程语言来完成本课程的所有作业。Python 是一门伟大的通用编程语言，在一些常用库（numpy, scipy, matplotlib）的帮助下，它又会变成一个强大的科学计算环境。我们期望你们中大多数人对于 Python 语言和 Numpy 库比较熟悉，而对于没有 Python 经验的同学，这篇教程可以帮助你们快速了解 Python 编程环境和如何使用 Python 作为科学计算工具。

2. Image Classification

原文：

http://cs231n.github.io/classification/

翻译：

https://zhuanlan.zhihu.com/p/20894041?refer=intelligentunit

https://zhuanlan.zhihu.com/p/20900216?refer=intelligentunit

该笔记是一篇介绍性教程，面向非计算机视觉领域的同学。教程将向同学们介绍图像分类问题和数据驱动方法，内容列表：

图像分类、数据驱动方法和流程
Nearest Neighbor分类器
k-Nearest Neighbor 译者注：上篇翻译截止处
验证集、交叉验证集和超参数调参
Nearest Neighbor的优劣
小结
小结：应用kNN实践
拓展阅读

3. Linear Classification

原文：

http://cs231n.github.io/linear-classify/

翻译：

https://zhuanlan.zhihu.com/p/20918580?refer=intelligentunit

https://zhuanlan.zhihu.com/p/20945670?refer=intelligentunit

https://zhuanlan.zhihu.com/p/21102293?refer=intelligentunit

我们将要实现一种更强大的方法来解决图像分类问题，该方法可以自然地延伸到神经网络和卷积神经网络上。这种方法主要有两部分组成：一个是评分函数（score function），它是原始图像数据到类别分值的映射。另一个是损失函数（loss function），它是用来量化预测分类标签的得分与真实标签之间一致性的。该方法可转化为一个最优化问题，在最优化过程中，将通过更新评分函数的参数来最小化损失函数值。内容列表：