您好,欢迎光临有路网!
机器阅读理解:算法与实践
QQ咨询:
有路璐璐:

机器阅读理解:算法与实践

  • 作者:朱晨光
  • 出版社:机械工业出版社
  • ISBN:9787111649502
  • 出版日期:2020年04月01日
  • 页数:244
  • 定价:¥79.00
  • 分享领佣金
    手机购买
    城市
    店铺名称
    店主联系方式
    店铺售价
    库存
    店铺得分/总交易量
    发布时间
    操作

    新书比价

    网站名称
    书名
    售价
    优惠
    操作

    图书详情

    内容提要
    微软**研究员撰写,剖析机器阅读理解支撑技术、模型架构、前沿算法、模型SDNet源码与落地应用。 全书分为三篇,共8章内容。基础篇(第1~3章),介绍机器阅读理解的基础知识和关键支撑技术,涵盖机器阅读理解任务的定义,阅读理解模型中常用的自然语言处理技术和深度学习网络模块,例如如何让计算机表示文章和问题、做多项选择题及生成回答等。架构篇(第4~6章),介绍解决各类机器阅读理解任务的基本模型架构和前沿算法,并剖析对机器阅读理解研究有着重要影响的预训练模型(如BERT和GPT)。实战篇(第7~8章),包括笔者在2018年获得CoQA对话阅读理解竞赛*名时所用的模型SDNet的代码解读,机器阅读理解在各种工业界应用中的具体落地过程和挑战,以及笔者对于机器阅读理解未来发展方向的思考。 作者亲授“机器阅读理解”直播课,搭配图书学习效果更佳! 回放&PPT获取方式 1、微信关注“华章计算机” 2、在后台回复关键词:机器阅读理解
    文章节选
    序 一 智能可以分为两个层次。一是感知智能,即让计算机可以看见、听见和触摸。在这些领域,人工智能取得了许多突破,包括语音识别、语音合成、计算机视觉等。而更高的层次是认知智能,它需要计算机能够真正理解和分析各种概念、关系、逻辑等。在这个层次,人工智能的进展还处于起步阶段。 语言作为人类进行交流和传播思想的重要媒介,集中承载了*高层级的智能水平。从20世纪50年代提出的图灵测试开始,到深度学习方兴未艾的今天,理解和应用自然语言一直是全世界人工智能研发同行们梦寐以求想解决的共同课题。语音和语言技术是镶在AI皇冠上的明珠。如果计算机在未来的某**可以完全理解人类的语言,我们就实现了强人工智能。 近年来,机器阅读理解成为语言处理研究中*热门、*前沿的方向之一。利用计算机建立模型,使计算机能像人类一样阅读文章、分析语义和回答问题,有着重要的科研价值和实用价值。从智能客服到搜索引擎,从作文自动评分到智能金融,机器阅读理解技术可以将大量耗时费力的人工分析自动化,极大地提高了社会的生产力。 随着深度学习技术的不断发展,机器阅读理解研究有了长足的进步。在一些特定的任务中,计算机模型的回答已经可以媲美人类的水平,一些媒体也对这些成果冠以“计算机的阅读理解能力已超人类”的标题。但是,现有的模型能力离真正智能的阅读还有很大距离。大多数情况下,模型仍然简单依赖于局部词句的匹配,而并非基于对篇章结构和语义的理解。 一般来说,人工智能如果要在某个领域获得成功,3个因素缺一不可:平台、数据和算法。而随着硬件算力的不断提升和大数据的爆炸式增长,对算法的探索与改进就成为人工智能研究的必争之地。 现在市面上完整介绍机器阅读理解算法研究与应用现状的书籍非常少见,相关的中文资料更是少之又少。我们团队的朱晨光博士在机器阅读理解领域深耕多年,并曾在多项国际竞赛中带领团队夺得**。他写这本书的目的就是将机器阅读理解的真实面貌展现给读者。书中既有对*新研究成果的详细介绍,也有他对机器阅读理解未来发展方向的思考。希望本书能够启发各位读者为实现人类水平的机器阅读理解共同努力。 黄学东博士 微软公司人工智能**技术官 序 二 朱晨光博士现在(美国)微软公司担任**研究员,主要从事自然语言处理方面的研究,包括机器阅读理解、任务驱动对话和文本摘要等。他在CCCF(《中国计算机学会通讯》)上写的一篇特约专稿《机器阅读理解:如何让计算机读懂文章》很受欢迎。机械工业出版社的编辑看到后,特邀他写书。近期,他完成了专著《机器阅读理解:算法与实践》,让我写一段序言。 自然语言处理旨在解决对自然语言的理解和生成问题。自然语言问题是人工智能皇冠上的明珠,是计算机重要的能力之一,也是研究难度很大的一个领域。人类常用的每一种自然语言都有其语法,但由于使用语言的人的风格不同,加上地方话和习惯用语等因素,所产生的语言千变万化。人和人之间的交流和理解一般是没有障碍的,但让计算机理解就非常困难。这是因为,目前的冯·诺依曼计算机体系结构处理有明确规则的事务比较容易,但处理规则多变的事务就显得有些力不从心。 多少年来,研究者提出和发展了很多方法,有基于语言学规则的技术,也有基于统计机器学习的模型。*近一段时间以来,研究者发展了端到端训练的深度学习自然语言处理体系,包括词嵌入、句子嵌入、注意力机制、编码/解码方法以及*近的预训练模型等,大幅提升了模型处理各项任务的能力,给自然语言理解带来了新的、有趣的思路。 机器(就是计算机)阅读理解是自然语言处理中*热门、*前沿的研究课题之一。阅读是人们获得信息的基本手段,没有阅读就没有理解,没有理解就无法交流。市面上已有很多聊天机器人产品,但人们发现这些机器人往往答非所问。究其原因,就是目前采用的技术是“文本比对”的黑盒方式,而实际上机器人并不理解人类在和它说什么。大家知道,人们在交流时是有语境(即上下文)的,通过联想,人们可以方便地理解对方在说什么,但是让机器了解语境确实是一件非常困难的事。为了解决这些问题,研究者提出了许多改进方法,不断提高模型理解对话与文章的能力。而且,一大批阅读理解数据集的发布强有力地推动了技术的发展。 机器阅读除了研究价值以外,还有许多很有意义的应用,比如文本摘要可以省去人们阅读全文的时间,问答系统可以从海量文档中**地找到用户问题的答案。机器阅读也是翻译和对话的基础,这对计算机辅助人工服务有重大价值。 晨光的这本书系统地介绍了这个领域的关键技术、取得的进展,以及存在的问题。相信读者读完本书后,会对这一领域的研究及应用有一个比较清晰的认识。 晨光在上中学时参加了CCF主办的信息学奥林匹克竞赛,曾获得全国竞赛的**,也是国际赛IOI中国队的候选队员。因我是主席,那时就认识他了。他后来被保送到清华大学计算机系读书,毕业后又去斯坦福大学攻读博士学位,然后在微软从事自然语言处理方面的研究,造诣很高。我们很少见面,但一直保持联系。我认为他是一个天资聪颖、学风严谨而又非常通达事理的青年学者,因此非常乐意和他讨论问题。他提出让我写篇序,看到他的新的研究进展,我深感高兴,于是欣然提笔,也借此向他表示祝贺。 杜子德 原中科院计算所研究员,现任中国计算机学会秘书长
    目录
    序一 序二 前言 **篇 基础篇 第1章 机器阅读理解与关键支撑技术 2 1.1 机器阅读理解任务 2 1.1.1 机器阅读理解模型 3 1.1.2 机器阅读理解的应用 4 1.2 自然语言处理 5 1.2.1 研究现状 5 1.2.2 仍需解决的问题 6 1.3 深度学习 7 1.3.1 深度学习的特点 7 1.3.2 深度学习的成果 10 1.4 机器阅读理解任务的测评方式 11 1.4.1 机器阅读理解的答案形式 11 1.4.2 自由回答式答案评分标准ROUGE 12 1.5 机器阅读理解数据集 14 1.5.1 单段落式数据集 14 1.5.2 多段落式数据集 19 1.5.3 文本库式数据集 22 1.6 机器阅读理解数据的生成 23 1.6.1 数据集的生成 23 1.6.2 标准答案的生成 24 1.6.3 如何设计高质量的数据集 26 1.7 本章小结 30 第2章 自然语言处理基础 31 2.1 文本分词 31 2.1.1 中文分词 32 2.1.2 英文分词 33 2.1.3 字节对编码BPE 35 2.2 语言处理的基石:词向量 37 2.2.1 词的向量化 37 2.2.2 Word2vec词向量 39 2.3 命名实体和词性标注 42 2.3.1 命名实体识别 42 2.3.2 词性标注 44 2.4 语言模型 48 2.4.1 N元模型 49 2.4.2 语言模型的评测 52 2.5 本章小结 53 第3章 自然语言处理中的深度学习 54 3.1 从词向量到文本向量 54 3.1.1 利用RNN的*终状态 55 3.1.2 利用CNN和池化 55 3.1.3 利用含参加权和 58 3.2 让计算机做选择题:自然语言理解 59 3.2.1 网络模型 59 3.2.2 实战:文本分类 60 3.3 让计算机写文章:自然语言生成 62 3.3.1 网络模型 62 3.3.2 实战:生成文本 63 3.3.3 集束搜索 65 3.4 让计算机专心致志:注意力机制 67 3.4.1 注意力机制的计算 68 3.4.2 实战:利用内积函数计算注意力 69 3.4.3 序列到序列模型 69 3.5 本章小结 70 第二篇 架构篇 第4章 机器阅读理解模型架构 72 4.1 总体架构 72 4.2 编码层 74 4.2.1 词表的建立和初始化 74 4.2.2 字符编码 75 4.2.3 上下文编码 77 4.3 交互层 79 4.3.1 互注意力 79 4.3.2 自注意力 81 4.3.3 上下文编码 82 4.4 输出层 83 4.4.1 构造问题的向量表示 83 4.4.2 多项选择式答案生成 84 4.4.3 区间式答案生成 85 4.4.4 自由式答案生成 87 4.5 本章小结 93 第5章 常见机器阅读理解模型 94 5.1 双向注意力流模型 94 5.1.1 编码层 94 5.1.2 交互层 95 5.1.3 输出层 98 5.2 R-net 99 5.2.1 基于注意力的门控循环神经网络 100 5.2.2 网络架构 101 5.3 融合网络 104 5.3.1 单词历史 104 5.3.2 全关注注意力 105 5.3.3 总体架构 106 5.4 关键词检索与阅读模型 109 5.4.1 检索器 110 5.4.2 阅读器 112 5.5 本章小结 115 第6章 预训练模型 116 6.1 预训练模型和迁移学习 116 6.2 基于翻译的预训练模型CoVe 118 6.2.1 机器翻译模型 119 6.2.2 上下文编码 120 6.3 基于语言模型的预训练模型ELMo 121 6.3.1 双向语言模型 122 6.3.2 ELMo的使用 123 6.4 生成式预训练模型GPT 125 6.4.1 Transformer 125 6.4.2 GPT模型架构 129 6.4.3 GPT使用方法 129 6.5 划时代的预训练模型BERT 131 6.5.1 双向语言模型 131 6.5.2 判断下一段文本 132 6.5.3 BERT预训练细节 133 6.5.4 BERT在目标任务中的使用 133 6.5.5 实战:在区间答案型机器阅读理解任务中微调BERT 137 6.6 本章小结 138 第三篇 实战篇 第7章 机器阅读理解模型SDNet代码解析 140 7.1 多轮对话式阅读理解模型SDNet 140 7.1.1 编码层 141 7.1.2 交互层与输出层 142 7.2 SDNet代码介绍与运行指南 143 7.2.1 代码介绍 143 7.2.2 运行指南 143 7.2.3 配置文件 145 7.3 预处理程序 147 7.3.1 初始化函数 148 7.3.2 预处理函数 149 7.4 训练程序 154 7.4.1 训练基类 154 7.4.2 训练子类 155 7.5 批次数据产生器 159 7.5.1 掩码 160 7.5.2 准备BERT数据 164 7.6 SDNet模型 166 7.6.1 网络模型类 166 7.6.2 计算层 171 7.6.3 生成BERT编码 177 7.7 本章小结 178 第8章 机器阅读理解的应用与未来 179 8.1 智能客服 179 8.1.1 建立产品客服知识库 180 8.1.2 理解用户意图 181 8.1.3 答案生成 183 8.1.4 智能客服中的其他模块 183 8.2 搜索引擎 184 8.2.1 搜索引擎技术 185 8.2.2 搜索引擎中的机器阅读理解 187 8.2.3 未来与挑战 188 8.3 **卫生 189 8.4 法律 190 8.4.1 智能审判 191 8.4.2 确定适用条款 192 8.5 金融 193 8.5.1 股价预测 193 8.5.2 新闻摘要 195 8.6 教育 196 8.7 机器阅读理解的未来 196 8.7.1 机器阅读理解研究面临的挑战 197 8.7.2 机器阅读理解的产业化 202 8.8 本章小结 203 附录A 机器学习基础 205 附录B 深度学习基础 208

    与描述相符

    100

    北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 台湾 香港 澳门 海外