目录
理 论 篇
第1章 你必须知道的一些基础知识………………………………………3
1.1 概率论 ……………………………………………………………3
1.2 信息论 ……………………………………………………………4
1.3 贝叶斯法则 ………………………………………………………7
1.4 问题与思考 ………………………………………………………10
第2章 我们生活在一个寻求最优解的世界里……………………………11
2.1 最优化问题 ………………………………………………………11
2.2 最大似然估计/最大后验估计 …………………………………15
2.3 梯度下降法 ………………………………………………………17
2.4 问题与思考 ………………………………………………………22
第3章 让机器可以像人一样学习…………………………………………23
3.1 何谓机器学习 ……………………………………………………23
3.2 逻辑回归/因子分解机 …………………………………………29
3.3 最大熵模型/条件随机场 ………………………………………34
3.4 主题模型 …………………………………………………………40
3.5 深度学习 …………………………………………………………50
3.6 其他模型 …………………………………………………………88
3.7 问题与思考 ………………………………………………………97
应 用 篇
第4章 如何计算得更快…………………………………………………101
4.1 程序优化 ………………………………………………………101
4.2 分布式系统 ……………………………………………………105
4.3 Hadoop …………………………………………………………107
4.4 问题与思考 ……………………………………………………114
第5章 你要知道的一些术语……………………………………………115
5.1 tf/df/idf …………………………………………………………115
5.2 IG/CHI/MI ………………………………………………………116
5.3 PageRank ………………………………………………………118
5.4 相似度计算 ……………………………………………………119
5.5 问题与思考 ……………………………………………………125
第6章 搜索引擎是什么玩意儿…………………………………………126
6.1 搜索引擎原理 …………………………………………………126
6.2 搜索引擎架构 …………………………………………………129
6.3 搜索引擎核心模块 ……………………………………………130
6.4 搜索广告 ………………………………………………………148
6.5 问题与思考 ……………………………………………………153
第7章 如何让机器猜得更准……………………………………………155
7.1 基于协同过滤的推荐算法 ……………………………………156
7.2 基于内容的推荐算法 …………………………………………158
7.3 混合推荐算法 …………………………………………………159
7.4 问题与思考 ……………………………………………………163
第8章 理解语言有多难…………………………………………………164
8.1 自然语言处理 …………………………………………………164
8.2 对话系统 ………………………………………………………176
8.3 语言的特殊性 …………………………………………………186
8.4 问题与思考 ……………………………………………………190
结语…………………………………………………………………………191
参考文献……………………………………………………………………193
第1章 你必须知道的一些基础知识………………………………………3
1.1 概率论 ……………………………………………………………3
1.2 信息论 ……………………………………………………………4
1.3 贝叶斯法则 ………………………………………………………7
1.4 问题与思考 ………………………………………………………10
第2章 我们生活在一个寻求最优解的世界里……………………………11
2.1 最优化问题 ………………………………………………………11
2.2 最大似然估计/最大后验估计 …………………………………15
2.3 梯度下降法 ………………………………………………………17
2.4 问题与思考 ………………………………………………………22
第3章 让机器可以像人一样学习…………………………………………23
3.1 何谓机器学习 ……………………………………………………23
3.2 逻辑回归/因子分解机 …………………………………………29
3.3 最大熵模型/条件随机场 ………………………………………34
3.4 主题模型 …………………………………………………………40
3.5 深度学习 …………………………………………………………50
3.6 其他模型 …………………………………………………………88
3.7 问题与思考 ………………………………………………………97
应 用 篇
第4章 如何计算得更快…………………………………………………101
4.1 程序优化 ………………………………………………………101
4.2 分布式系统 ……………………………………………………105
4.3 Hadoop …………………………………………………………107
4.4 问题与思考 ……………………………………………………114
第5章 你要知道的一些术语……………………………………………115
5.1 tf/df/idf …………………………………………………………115
5.2 IG/CHI/MI ………………………………………………………116
5.3 PageRank ………………………………………………………118
5.4 相似度计算 ……………………………………………………119
5.5 问题与思考 ……………………………………………………125
第6章 搜索引擎是什么玩意儿…………………………………………126
6.1 搜索引擎原理 …………………………………………………126
6.2 搜索引擎架构 …………………………………………………129
6.3 搜索引擎核心模块 ……………………………………………130
6.4 搜索广告 ………………………………………………………148
6.5 问题与思考 ……………………………………………………153
第7章 如何让机器猜得更准……………………………………………155
7.1 基于协同过滤的推荐算法 ……………………………………156
7.2 基于内容的推荐算法 …………………………………………158
7.3 混合推荐算法 …………………………………………………159
7.4 问题与思考 ……………………………………………………163
第8章 理解语言有多难…………………………………………………164
8.1 自然语言处理 …………………………………………………164
8.2 对话系统 ………………………………………………………176
8.3 语言的特殊性 …………………………………………………186
8.4 问题与思考 ……………………………………………………190
结语…………………………………………………………………………191
参考文献……………………………………………………………………193
【展开】
【收起】
内容简介
本书结合作者多年学习和从事自然语言处理相关工作的经验,力图用生动形象的方式深入浅出地介绍自然语言处理的理论、方法和技术。本书抛弃掉繁琐的证明,提取出算法的核心,帮助读者尽快地掌握自然语言处理所必备的知识和技能。本书主要分两大部分。第一部分是理论篇,包含前3章内容,主要介绍一些基础的数学知识、优化理论知识和一些机器学习的相关知识。第二部分是应用篇,包含第4章到第8章,分别针对计算性能、文本处理的术语、相似度计算、搜索引擎、推荐系统、自然语言处理和对话系统等主题展开介绍和讨论。本书适合从事自然语言处理相关研究和工作的读者参考,尤其适合想要了解和掌握机器学习或者自然语言处理技术的读者阅读。
【展开】
【收起】
下载说明
1、追日是作者栎年创作的原创作品,下载链接均为网友上传的的网盘链接!
2、相识电子书提供优质免费的txt、pdf等下载链接,所有电子书均为完整版!
下载链接
热门评论
-
[已注销]的评论概要总结。不适合入门,适合有实际经验的阅读。不够深入
-
此间的少年的评论3.5星,前几章不行,后面渐入佳境,看得出来作者是有搜索和推荐领域实际经验又没有放松对业界论文学习的
-
Mihai的评论感觉写的比较散乱。。。都是蜻蜓点水
-
子莒的评论同行衬托,阿里的几个工程师也出了一套书,至少文风上,腾讯的nlp系列略胜一筹。
-
一只黑眼睛看着大千世界的评论涉及数学基础、机器学习基础、搜索、推荐、广告、对话。全书结构不太好,内容有些偏博客,内容覆盖全而新,讲解视角更高。完整读书笔记https://zhuanlan.zhihu.com/p/63783079
-
RUIM的评论全书知识点零散不成系统,但部分知识点简单扼要,涉及深度学习相关;了解到联合概率/条件概率 生成模型/判别模型等等
-
江南的大熊猫的评论看了前2章,如果相关的知识点懂的话,这本书是一个很好的梳理和总结,如果不懂的话呢,那就要去看“更原理性”的其他书了。与周志华的《机器学习》和《统计学习方法》这样的书比起来呢,本书不是通过公式讲算法/模型的原理,而是讲大概的流程及具体的实际应用示例,毕竟这本书不厚,哈哈。
-
Seal Huang的评论通俗易懂
-
续意生的评论还不错吧
-
小基基的评论偏理论,代码少,没python代码。