《Python中文自然语言处理基础与实战》 - 台灣·大書城 - 肖刚，张良均 - 人民邮电出版社

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台(0)　\|　在線留言板　 \|　付款方式　 \|　聯絡我們　 \|　運費計算　 \|　幫助中心　\|　加入書簽
		會員登入新用戶註冊

HOME

新書上架

暢銷書架

好書推介

2024年度TOP

香港／國際用戶

最新/最熱/最齊全的簡體書網

品種：超過100萬種書，正品正价，放心網購，悭钱省心

送貨：速遞 / 物流，時效：出貨後2-4日

『簡體書』Python中文自然语言处理基础与实战

書城自編碼： 3706028
分類：簡體書→大陸圖書→教材→高职高专教材
作者：肖刚，张良均
國際書號(ISBN)： 9787115566881
出版社：人民邮电出版社
出版日期： 2022-01-01

頁數/字數： /
書度/開本： 16开釘裝：平装

售價：NT$ 305

我要買件

** 我創建的書架 **
未登入.

新書推薦：

《海外中国研究·宋代文人的精神生活（经典收藏版）--重构宋代文人的精神内核》
售價：NT$ 500.0

《埃勒里·奎因悲剧四部曲》
售價：NT$ 1426.0

《今天我想要什么：海豹的女性漫画》
售價：NT$ 347.0

《日常的金字塔：写诗入门十一阶》
售價：NT$ 347.0

《税的荒唐与智慧：历史上的税收故事》
售價：NT$ 500.0

《图式疗法的刻意练习》
售價：NT$ 408.0

《人间游戏：人际关系心理学（500万册畅销书《蛤蟆先生》理论原典，帮你读懂人际关系中那些心照不宣的“潜规则”）》
售價：NT$ 203.0

《伟大的遗址（亲历100座人类文明考古奇迹）》
售價：NT$ 959.0

編輯推薦：

欢迎加入人邮大数据教师服务群：6698198711.内容契合“1+X”证书制度试点工作中的大数据应用开发（Python）职业技能高级证书考核标准2.全书与真实案例相结合，方便读者系统学习并动手实践3.全书紧扣任务需求展开，不堆积知识点，着重于思路的启发与解决方案的实施

內容簡介：

本书以Python自然语言处理的常用技术与真实案例相结合的方式，深入浅出地介绍Python自然语言处理的重要内容。全书共12章，内容包括绪论、语料库、正则表达式、中文分词技术、词性标注与命名实体识别、关键词提取、文本向量化、文本分类与文本聚类、文本情感分析、NLP中的深度学习技术、智能问答系统，以及基于TipDM大数据挖掘建模平台实现垃圾短信分类。本书包含实训和课后习题，帮助读者通过练习和操作实践，巩固所学内容。本书可作为“1+X”证书制度试点工作中“大数据应用开发（Python）”职业技能等级证书的教学和培训用书，也可以作为高校数据科学或人工智能相关专业的教材，还可作为机器学习爱好者的自学用书。

關於作者：

肖刚(1968-)，博士，教授。韩山师范学院数学与统计学院院长、广东省中小型企业大数据与智能化工程研究中心主任，华南师范大学、广州大学兼职硕士生导师。中国医学装备协会磁共振成像装备与技术专业委员会委员、广东省生物医学工程学会医学信息工程分会委员、广东省工业与应用数学学会、广东省现场统计学会和广东省计算数学学会理事，“泰迪杯”全国数据挖掘挑战赛专家组成员。主要从事应用数学、数据挖掘和医学影像学的研究工作以及创新创业竞赛、数学建模竞赛、数据挖掘挑战赛的教学与指导工作。主持广东省自然科学基金项目2项，主持广东省教育厅项目4项。2016年广东省科学技术进步奖三等奖、2018年汕头科学技术奖一等奖、2019年广东省科学技术进步奖优秀奖以及2019年广东省教学成果（基础教育）一等奖主要成员。张良均。高级信息系统项目管理师，泰迪杯全国大学生数据挖掘竞赛（www.tipdm.org）的发起人。华南师范大学、广东工业大学兼职教授，广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历，主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格（水平）考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数二十余篇，已取得国家发明专利12项，主编图书《神经网络实用教程》、《数据挖掘:实用案例分析》、《MATLAB数据分析与挖掘实战》等9本图书，主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书，具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。

第 1章绪论　11.1　自然语言处理概述　11.1.1　NLP的发展历程　21.1.2　NLP研究内容　31.1.3　NLP的几个应用场景　41.1.4　NLP与人工智能技术　51.1.5　学习NLP的难点　61.2　NLP基本流程　61.2.1　语料获取　61.2.2　语料预处理　71.2.3　文本向量化　71.2.4　模型构建　71.2.5　模型训练　71.2.6　模型评价　81.3　NLP的开发环境　81.3.1　Anaconda安装　81.3.2　Anaconda应用介绍　9小结　14课后习题　14第　2章语料库　162.1　语料库概述　162.1.1　语料库简介　162.1.2　语料库的用途　172.2　语料库的种类与构建原则　172.2.1　语料库的种类　172.2.2　语料库的构建原则　182.3　NLTK　192.3.1　NLTK简介　192.3.2　安装步骤　192.3.3　NLTK中函数的使用　212.4　语料库的获取　232.4.1　获取NLTK语料库　232.4.2　获取网络在线语料库　302.5　任务：语料库的构建与应用　322.5.1　构建作品集语料库　322.5.2　武侠小说语料库分析　33小结　35实训　35实训1　构建语料库　35实训2　《七剑下天山》语料库分析　36课后习题　36第3章　正则表达式　383.1　正则表达式的概念　383.1.1　正则表达式函数　383.1.2　正则表达式的元字符　403.2　任务：正则表达式的应用　433.2.1　《西游记》字符过滤　433.2.2　自动提取人名与电话号码　443.2.3　提取网页标签信息　45小结　46实训　46实训1　过滤《三国志》中的字符　46实训2　提取地名与邮编　46实训3　提取网页标签中的文本　46课后习题　47第4章　中文分词技术　484.1　中文分词简介　484.2　基于规则分词　484.2.1　正向匹配法　494.2.2　逆向匹配法　494.2.3　双向匹配法　504.3　基于统计分词　514.3.1　n元语法模型　514.3.2　隐马尔可夫模型相关概念　554.4　中文分词工具jieba　624.4.1　基本步骤　634.4.2　分词模式　634.5　任务：中文分词的应用　644.5.1　HMM中文分词　644.5.2　提取新闻文本中的高频词　68小结　69实训　70实训1　使用HMM进行中文分词　70实训2　提取文本中的高频词　70课后习题　70第5章　词性标注与命名实体识别　725.1　词性标注　725.1.1　词性标注简介　725.1.2　词性标注规范　735.1.3　jieba词性标注　745.2　命名实体识别　775.2.1　命名实体识别简介　775.2.2　CRF模型　785.3　任务：中文命名实体识别　825.3.1　sklearn-crfsuite库简介　835.3.2　命名实体识别流程　83小结　90实训　中文命名实体识别　90课后习题　91第6章　关键词提取　926.1　关键词提取技术简介　926.2　关键词提取算法　936.2.1　TF-IDF算法　936.2.2　TextRank算法　946.2.3　LSA与LDA算法　966.3　任务：自动提取文本关键词　103小结　109实训　109实训1　文本预处理　109实训2　使用TF-IDF算法提取关键词　109实训3　使用TextRank算法提取关键词　110实训4　使用LSA算法提取关键词　110课后习题　110第7章　文本向量化　1127.1　文本向量化简介　1127.2　文本离散表示　1137.2.1　独热表示　1137.2.2　BOW模型　1137.2.3　TF-IDF表示　1147.3　文本分布式表示　1147.3.1　Word2Vec模型　1147.3.2　Doc2Vec模型　1187.4　任务：文本相似度计算　1207.4.1　Word2Vec词向量的训练　1217.4.2　Doc2Vec段落向量的训练　1227.4.3　计算文本的相似度　124小结　128实训　128实训1　实现基于Word2Vec模型的新闻语料词向量训练　128实训2　实现基于Doc2Vec模型的新闻语料段落向量训练　128实训3　使用Word2Vec模型和Doc2Vec模型计算新闻文本的相似度　129课后习题　129第8章　文本分类与文本聚类　1318.1　文本挖掘简介　1318.2　文本分类常用算法　1328.3　文本聚类常用算法　1338.4　文本分类与文本聚类的步骤　1358.5　任务：垃圾短信分类　1368.6　任务：新闻文本聚类　141小结　144实训　144实训1　基于朴素贝叶斯的新闻分类　144实训2　食品种类安全问题聚类分析　145课后习题　145第9章　文本情感分析　1479.1　文本情感分析简介　1479.1.1　文本情感分析的主要内容　1479.1.2　文本情感分析的常见应用　1489.2　情感分析的常用方法　1499.2.1　基于情感词典的方法　1499.2.2　基于文本分类的方法　1509.2.3　基于LDA主题模型的方法　1519.3　任务：基于情感词典的情感分析　1519.4　任务：基于文本分类的情感分析　1549.4.1　基于朴素贝叶斯分类的情感分析　1549.4.2　基于SnowNLP库的情感分析　1569.5　任务：基于LDA主题模型的情感分析　1579.5.1　数据处理　1579.5.2　模型训练　1589.5.3　结果分析　159小结　160实训　160实训1　基于词典的豆瓣评论文本情感分析　160实训2　基于朴素贝叶斯算法的豆瓣评论文本情感分析　160实训3　基于SnowNLP的豆瓣评论文本情感分析　161实训4　基于LDA主题模型的豆瓣评论文本情感分析　161课后习题　161第　10章 NLP中的深度学习技术　16310.1　循环神经网络概述　16310.2　RNN结构　16410.2.1　多对一结构　16410.2.2　等长的多对多结构　16410.2.3　非等长结构（Seq2Seq模型）　16910.3　深度学习工具　17110.3.1　TensorFlow简介　17110.3.2　基于TensorFlow的深度学习库Keras　17210.4　任务：基于LSTM的文本分类与情感分析　17210.4.1　文本分类　17210.4.2　情感分析　18110.5　任务：基于Seq2Seq的机器翻译　18510.5.1　语料预处理　18510.5.2　构建模型　18810.5.3　定义优化器和损失函数　19110.5.4　训练模型　19110.5.5　翻译　194小结　195实训　195实训1　实现基于LSTM模型的新闻分类　195实训2　实现基于LSTM模型的携程网评论情感分析　196实训3　实现基于Seq2Seq和GPU的机器翻译　196课后习题　197第　11章智能问答系统　19811.1　智能问答系统简介　19811.2　智能问答系统的主要组成部分　19811.2.1　问题理解　19911.2.2　知识检索　19911.2.3　答案生成　20011.3　任务：基于Seq2Seq模型的聊天机器人　20111.3.1　读取语料库　20111.3.2　文本预处理　20211.3.3　模型构建　20611.3.4　模型训练　21111.3.5　模型评价　218小结　218实训　基于Seq2Seq模型的聊天机器人　218课后习题　219第　12章基于TipDM大数据挖掘建模平台实现垃圾短信分类　22012.1　平台简介　22012.1.1　实训库　22112.1.2　数据连接　22212.1.3　实训数据　22212.1.4　我的实训　22312.1.5　系统算法　22312.1.6　个人算法　22512.2　实现垃圾短信分类　22612.2.1　数据源配置　22712.2.2　文本预处理　22912.2.3　朴素贝叶斯分类模型　234小结　235实训　实现基于朴素贝叶斯的新闻分类　235课后习题　236

書城介紹　 \|　合作申請　\|　索要書目　 \|　新手入門　\|　聯絡方式　 \|　幫助中心　\|　找書說明　 \|　送貨方式　\|　付款方式	台灣用户　\|　香港/海外用户

megBook.com.tw
Copyright (C) 2013 - 2025 （香港）大書城有限公司　All Rights Reserved.