机读格式显示(MARC)
- 000 01622nam0 2200289 450
- 010 __ |a 978-7-5766-0941-7 |d CNY78.00
- 100 __ |a 20231218d2023 em y0chiy50 ea
- 200 1_ |a R自然语言处理导论 |A R zi ran yu yan chu li dao lun |d = Introduction to natural language processing with R |f 鲍贵, 莫俊华, 陆俊花编著 |z eng
- 210 __ |a 南京 |c 东南大学出版社 |d 2023
- 215 __ |a 307页 |c 图 |d 26cm
- 320 __ |a 有书目 (第304-307页)
- 330 __ |a 本书系统介绍R语言在自然语言处理中的应用, 包括十一章内容, 遵循由易到难、循序渐进的原则。第一章是R语言入门, 第二章介绍字符串处理。第三章介绍常见的文本统计方法, 包括统计文本词数、句子数和平均长、绘制词频表以及词频分布图。第四章依据R数据包koRpus介绍与讨论文本词汇多样性测量方法, 包括传统的类符形符比和平均分段类符形符比等。第五章同第四章一样利用R数据包koRpus。第六章聚焦于n元组和关键词提取方法。第七章介绍两种特殊形式的n元组, 即搭配和搭配构式。第八章介绍文档或文本相似度和距离测量。第九章着重介绍基于整洁文本的自然语言处理技术。第十章介绍中文自然语言处理技术。第十一章是本书的最后一章, 介绍如何对文本词汇开展词类标注和句法成分依存分析, 包括数据包udpipe的安装与初试、词语共现和快速自动关键词提取等。
- 510 1_ |a Introduction to natural language processing with R |z eng
- 606 0_ |a 程序语言 |A cheng xu yu yan |x 自然语言处理
- 610 0_ |a R语言 |A R yu yan
- 701 _0 |a 鲍贵 |A bao gui |4 编著
- 701 _0 |a 莫俊华 |A mo jun hua |4 编著
- 701 _0 |a 陆俊花 |A lu jun hua |4 编著
- 801 _0 |a CN |b WFKJXY |c 20240821
- 905 __ |a WFKJXY |d TP312.8/537