R语言corpustools包说明文档(版本 0.4.2)

返回R语言所有包列表

add_collocation_label 根据搭配类别选择和添加搭配字符串
agg_tcorpus 聚合令牌数据
as.tcorpus 强制对象成为tCorpus类
as.tcorpus.default 强制对象成为tCorpus类
as.tcorpus.tCorpus 强制对象成为tCorpus类
backbone_filter 提取网络的主干。
browse_hits 在浏览器中查看点击
browse_texts 创建和查看全文浏览器
calc_chi2 矢量化计算chi&82包含值$a,b¥$c,d的2x2交叉表的统计信息¥
code_dictionary 字典查找
code_features 基于搜索字符串的tCorpus中的代码特性
compare_corpus 将tCorpus词汇表与另一个(参考)tCorpus词汇表进行比较
compare_documents 计算文档的相似性
compare_subset 比较tCorpus子集与tCorpus其余部分的词汇表
context 获取上下文向量
corenlp_tokens coreNLP例句
count_tcorpus 计算搜索命中数或令牌中给定功能的结果
create_tcorpus 创建tCorpus
create_tcorpus.character 创建tCorpus
create_tcorpus.corpus 创建tCorpus
create_tcorpus.data.frame 创建tCorpus
create_tcorpus.factor 创建tCorpus
deduplicate 重复数据消除文档
delete_columns 从数据和元数据中删除列
delete_meta_columns 从数据和元数据中删除列
docfreq_filter 子集法的支持函数
dtm_compare 比较两个文档术语矩阵
dtm_wordcloud 从dtm绘制单词云
ego_semnet 建立自我网络
emoticon_dict 带有常见ASCII表情符号的词典
feats_to_columms 将UDpipe标记中的“专长”列投射到列
feature_associations 在给定查询或查询命中数的情况下获取常见的附近特性
feature_stats 特征统计
feature_subset 过滤器功能
freq_filter 子集法的支持函数
get 从tCorpus访问数据
get_dfm 创建文档术语矩阵。
get_dtm 创建文档术语矩阵。
get_global_i 计算全局特征位置
get_kwic 在上下文(KWIC)字符串中获取关键字
get_meta 从tCorpus访问数据
get_stopwords 获取stopwords的字符向量
laplace 拉普拉斯(即加常数)平滑
lda_fit 评估LDA主题模型
melt_quanteda_dict 将quanteda字典转换为long数据表格式
merge_tcorpora 合并tCorpus对象
plot.contextHits contextHits类的S3绘图
plot.featureAssociations 可视化要素关联
plot.featureHits S3 featureHits类的绘图
plot.vocabularyComparison 可视化词汇比较
plot_semnet 可视化semnet网络
plot_words 绘制一个单词云,单词按维度(x)排列并着色
preprocess 预处理功能
preprocess_tokens 预处理字符向量中的标记
print.contextHits S3打印contextHits类
print.featureHits S3 featureHits类打印
print.tCorpus S3打印tCorpus类
refresh_tcorpus 使用当前版本的corpustools刷新tCorpus对象
replace_dictionary 用字典匹配替换标记
require_package 检查给定版本的包是否存在
search_contexts 使用布尔查询搜索文档或句子
search_dictionary 字典查找
search_features 使用类似Lucene的搜索查询查找令牌
search_recode 基于搜索字符串在tCorpus中重新编码特征
semnet 基于文档中标记的共现性创建语义网络
semnet_window 基于令牌窗口中令牌的共现创建语义网络
set 修改令牌和元数据表一个tCorpus的
set_levels 更改因子列的级别
set_meta 修改令牌和元数据表一个tCorpus的
set_meta_levels 更改因子列的级别
set_meta_name 更改数据和元数据的列名
set_name 更改数据和元数据的列名
set_network_attributes 设置一些默认的网络属性
set_special 将列指定为具有特殊含义的列(token、引理、POS、relation、parent)
sgt 简单良好的图灵平滑
show_udpipe_models 显示管道模型的名称
sotu_texts 国情咨文
stopwords_list 基本非索引词列表
subset 子集合a tCorpus
subset.tCorpus tCorpus类的S3子集
subset_meta 子集合a tCorpus
subset_query 使用查询的tCorpus令牌数据子集
summary.contextHits contextHits类的S3摘要
summary.featureHits S3 featureHits类摘要
summary.tCorpus tCorpus对象的摘要
tCorpus tCorpus:一个用于标记化文本的语料库类
tcorpus tCorpus:一个用于标记化文本的语料库类
tCorpus$code_dictionary 字典查找
tCorpus$code_features 基于搜索字符串的tCorpus中的代码特性
tCorpus$compare_corpus 将tCorpus词汇表与另一个(参考)tCorpus词汇表进行比较
tCorpus$compare_documents 计算文档的相似性
tCorpus$compare_subset 比较tCorpus子集与tCorpus其余部分的词汇表
tCorpus$context 获取上下文向量
tCorpus$deduplicate 重复数据消除文档
tCorpus$delete_columns 从数据和元数据中删除列
tCorpus$delete_meta_columns 从数据和元数据中删除列
tCorpus$dfm 创建文档术语矩阵。
tCorpus$dtm 创建文档术语矩阵。
tCorpus$feats_to_columns 将UDpipe标记中的“专长”列投射到列
tCorpus$feature_associations 获取给定功能查询的常用术语
tCorpus$feature_stats 特征统计
tCorpus$feature_subset 过滤器功能
tCorpus$get 从tCorpus访问数据
tCorpus$get_meta 从tCorpus访问数据
tCorpus$kwic 在上下文(KWIC)字符串中获取关键字
tCorpus$lda_fit 评估LDA主题模型
tCorpus$preprocess 预处理功能
tCorpus$replace_dictionary 用字典匹配替换标记
tCorpus$search_contexts 使用布尔查询搜索文档或句子
tCorpus$search_features 使用类似Lucene的搜索查询查找令牌
tCorpus$search_recode 基于搜索字符串在tCorpus中重新编码特征
tCorpus$semnet 基于文档中标记的共现性创建语义网络
tCorpus$semnet_window 基于令牌窗口中令牌的共现创建语义网络
tCorpus$set 修改令牌和元数据表一个tCorpus的
tCorpus$set_levels 更改因子列的级别
tCorpus$set_meta 修改令牌和元数据表一个tCorpus的
tCorpus$set_meta_levels 更改因子列的级别
tCorpus$set_meta_name 更改数据和元数据的列名
tCorpus$set_name 更改数据和元数据的列名
tCorpus$set_special 将列指定为具有特殊含义的列(token、引理、POS、relation、parent)
tCorpus$subset 子集合a tCorpus
tCorpus$subset_meta 子集合a tCorpus
tCorpus$subset_query 使用查询的tCorpus令牌数据子集
tCorpus$top_features 显示主要功能
tCorpus_compare 语料库比较
tCorpus_create 创建tCorpus
tCorpus_data 查看、修改和子集tCorpus数据的方法和功能
tCorpus_docsim 文档相似性
tCorpus_features 特征的预处理、子集和分析
tCorpus_modify_by_reference 通过引用修改tCorpus
tCorpus_querying 使用布尔查询来分析tCorpus
tCorpus_semnet 基于特征共现的语义网络分析
tCorpus_topmod 主题建模
tokens_to_tcorpus 基于令牌(即预处理文本)创建tcorpus
tokenWindowOccurence 给出矩阵中出现术语的窗口。
top_features 显示主要功能