教程演示🔗
你会学到什么
-
理解和实现word2vec
-
理解word2vec中的CBOW方法
-
理解word2vec中的skip-gram方法
-
理解word2vec中的负采样优化
-
使用梯度下降和交替最小二乘法理解和实现 GloVe
-
使用递归神经网络进行词性标注
-
使用递归神经网络进行命名实体识别
-
理解和实施用于情感分析的递归神经网络
-
理解和实现用于情感分析的递归神经张量网络
-
使用Gensim获取预训练词向量并计算相似度和类比度
要求
-
安装 Numpy、Matplotlib、Sci-Kit Learn 和 Theano 或 TensorFlow(现在应该非常容易)
-
了解反向传播和梯度下降,能够自己推导和编写方程式
-
使用 Theano(或 Tensorflow)中的基本原语编写循环神经网络,尤其是扫描函数
-
在 Theano(或 Tensorflow)中编写前馈神经网络
-
有助于有树算法的经验
描述
在本课程中,我们将通过深度学习研究NLP(自然语言处理)。
之前,您了解了一些基础知识,例如有多少 NLP 问题只是变相的常规机器学习和数据科学问题,以及简单实用的方法,例如词袋和术语文档矩阵。
这让我们可以做一些很酷的事情,比如检测垃圾邮件、写诗、编造文章,以及将相似的词组合在一起。
在本课程中,我将向您展示如何做更棒的事情。在本课程中,我们将学习的不仅仅是 1 个,而是4 个新架构。
首先是 word2vec。
在本课程中,我将向您展示 word2vec 从理论到实现的确切工作原理,您会发现它只是应用您已经掌握的技能。
Word2vec 很有趣,因为它神奇地将单词映射到一个向量空间,您可以在其中找到类比,例如:
- 国王 – 男人 = 王后 – 女人
- 法国 – 巴黎 = 英国 – 伦敦
- 十二月 – 十一月 = 七月 – 六月
对于那些觉得算法难,只想使用库的初学者,我们将演示如何使用Gensim库获取预训练的词向量,计算相似度和类比,并将这些词向量应用于构建文本分类器。
我们还将研究GloVe方法,它也可以找到词向量,但使用了一种称为矩阵分解的技术,这是推荐系统的一种流行算法。
令人惊讶的是,GLoVe 生成的词向量与 word2vec 生成的词向量一样好,而且更容易训练。
我们还将研究一些经典的 NLP 问题,例如词性标注和命名实体识别,并使用递归神经网络来解决它们。您会发现几乎任何问题都可以使用神经网络来解决,但您也会了解到过于复杂的危险。
最后,你将学习递归神经网络,最终帮助我们解决情感分析中的否定问题。递归神经网络利用了句子具有树形结构这一事实,我们终于可以摆脱天真地使用词袋。
本课程所需的所有材料都可以免费下载和安装。我们将在Numpy、 Matplotlib和 Theano中完成大部分工作 。我随时可以回答您的问题,并在您的数据科学之旅中为您提供帮助。
本课程着重于“如何构建和理解”,而不仅仅是“如何使用”。阅读一些文档后,任何人都可以在 15 分钟内学会使用 API。这不是关于“记住事实”,而是关于 通过实验“亲眼所见”。它将教您如何可视化模型内部发生的情况。如果您想要的 不仅仅是 粗略地了解机器学习模型,那么本课程适合您。
我们在课室见!
“如果你不能执行它,你就不会理解它”
- 或者正如伟大的物理学家理查德·费曼所说:“我无法创造的东西,我不明白”。
- 我的课程是您将学习如何从头开始实施机器学习算法的唯一课程
- 其他课程会教您如何将数据插入库,但您真的需要 3 行代码的帮助吗?
- 在对 10 个数据集做了同样的事情之后,你意识到你没有学到 10 个东西。你学到了 1 件事,并且只是将相同的 3 行代码重复了 10 次……
建议先决条件:
- 微积分(求导数)
- 矩阵加法、乘法
- 概率(条件分布和联合分布)
- Python 编码:if/else、循环、列表、字典、集合
- Numpy编码:矩阵和向量运算,加载CSV文件
- 神经网络和反向传播,能够自己推导和编写梯度下降算法
- 可以用 Theano 或 TensorFlow 编写前馈神经网络
- 可以使用基本原语在 Theano 或 TensorFlow 中编写递归神经网络/LSTM/GRU,尤其是扫描函数
- 有助于有树算法的经验
我应该按什么顺序上你们的课程?:
- 查看讲座“机器学习和 AI 先决条件路线图”(可在我的任何课程的常见问题解答中找到,包括免费的 Numpy 课程)
独特的功能
- 每行代码都有详细解释 – 如果您不同意,请随时给我发电子邮件
- 不会像其他课程那样浪费时间在键盘上“打字”——老实说,没有人能在短短 20 分钟内从头开始真正编写出值得学习的代码
- 不惧怕大学水平的数学——了解其他课程遗漏的有关算法的重要细节
本课程适合谁:
- 想要为各种 NLP 任务创建词向量表示的学生和专业人士
- 对递归神经网络等最先进的神经网络架构感兴趣的学生和专业人士
- 不应该:任何对先决条件不满意的人。
2022/12 课程主题

课程先决条件
安装 Numpy、Matplotlib、Sci-Kit Learn 和 Theano 或 TensorFlow(现在应该非常容易) 了解反向传播和梯度下降,能够自己推导和编写方程式 从 Theano 中的基本基元编写递归神经网络(或 Tensorflow),尤其是扫描函数 在 Theano(或 Tensorflow)中编写前馈神经网络 有助于获得树算法的经验
图片





