文本挖掘:基于R语言的整洁工具

作者:

出版时间:

版权:

ISBN:

Julia Silge , David Robinson

2018年04月01日

机械工业出版社

9787111588559

全本定价:¥ 25.00

开通电子书会员可免费阅读本书,首月特惠1.00元

本书由tidytext创建者亲笔撰写,系统阐述如何使用基于R的整洁工具来进行文本分析。书中首先介绍整洁文本的格式,以及如何获取整洁文本数据集;并通过tidytext中的情感数据集来进行情绪分析;接着介绍如何根据tf-idf统计量来识别特定文档中的重要单词,以及如何利用n-gram来分析文本中的文字网络;之后介绍如何将整洁文本转换为文档词项矩阵和Corpus对象格式,并给出了主题建模的概念;最后通过整合多种已知的整洁文本挖掘方法,给出了一些研究案例,这些案例涉及Twitter归档文件、NASA数据集以及来自新闻组的即时通讯信息。总的来说,本书侧重于分析文学、新闻和社交媒体方面的文本,非常适合从事相关文本挖掘的工作人员,也适合自然语言的初学者。与此同时,使用书中提供的大量针对性编程例子,不但可以提高工程实战能力,而且可以在本书提到的整洁框架上建立自己的分析任务。

热门推荐

Redis使用手册
黄健宏
¥ 65.00
微课/翻转课堂设计制作与应用
李会功
¥ 19.50
神经网络:R语言实现
Balaji Venkateswaran
¥ 25.00
从零开始学Scrapy网络爬虫(视频教学版)
张涛
¥ 49.00
Redis入门指南
李子骅
¥ 24.96
书名: 文本挖掘:基于R语言的整洁工具
全本定价:¥ 25.00
热门标签