add_collocation_label | 根据搭配类别选择和添加搭配字符串 | ||
agg_tcorpus | 聚合令牌数据 | ||
as.tcorpus | 强制对象成为tCorpus类 | ||
as.tcorpus.default | 强制对象成为tCorpus类 | ||
as.tcorpus.tCorpus | 强制对象成为tCorpus类 | ||
backbone_filter | 提取网络的主干。 | ||
browse_hits | 在浏览器中查看点击 | ||
browse_texts | 创建和查看全文浏览器 | ||
calc_chi2 | 矢量化计算chi&82包含值$a,b¥$c,d的2x2交叉表的统计信息¥ | ||
code_dictionary | 字典查找 | ||
code_features | 基于搜索字符串的tCorpus中的代码特性 | ||
compare_corpus | 将tCorpus词汇表与另一个(参考)tCorpus词汇表进行比较 | ||
compare_documents | 计算文档的相似性 | ||
compare_subset | 比较tCorpus子集与tCorpus其余部分的词汇表 | ||
context | 获取上下文向量 | ||
corenlp_tokens | coreNLP例句 | ||
count_tcorpus | 计算搜索命中数或令牌中给定功能的结果 | ||
create_tcorpus | 创建tCorpus | ||
create_tcorpus.character | 创建tCorpus | ||
create_tcorpus.corpus | 创建tCorpus | ||
create_tcorpus.data.frame | 创建tCorpus | ||
create_tcorpus.factor | 创建tCorpus | ||
deduplicate | 重复数据消除文档 | ||
delete_columns | 从数据和元数据中删除列 | ||
delete_meta_columns | 从数据和元数据中删除列 | ||
docfreq_filter | 子集法的支持函数 | ||
dtm_compare | 比较两个文档术语矩阵 | ||
dtm_wordcloud | 从dtm绘制单词云 | ||
ego_semnet | 建立自我网络 | ||
emoticon_dict | 带有常见ASCII表情符号的词典 | ||
feats_to_columms | 将UDpipe标记中的“专长”列投射到列 | ||
feature_associations | 在给定查询或查询命中数的情况下获取常见的附近特性 | ||
feature_stats | 特征统计 | ||
feature_subset | 过滤器功能 | ||
freq_filter | 子集法的支持函数 | ||
get | 从tCorpus访问数据 | ||
get_dfm | 创建文档术语矩阵。 | ||
get_dtm | 创建文档术语矩阵。 | ||
get_global_i | 计算全局特征位置 | ||
get_kwic | 在上下文(KWIC)字符串中获取关键字 | ||
get_meta | 从tCorpus访问数据 | ||
get_stopwords | 获取stopwords的字符向量 | ||
laplace | 拉普拉斯(即加常数)平滑 | ||
lda_fit | 评估LDA主题模型 | ||
melt_quanteda_dict | 将quanteda字典转换为long数据表格式 | ||
merge_tcorpora | 合并tCorpus对象 | ||
plot.contextHits | contextHits类的S3绘图 | ||
plot.featureAssociations | 可视化要素关联 | ||
plot.featureHits | S3 featureHits类的绘图 | ||
plot.vocabularyComparison | 可视化词汇比较 | ||
plot_semnet | 可视化semnet网络 | ||
plot_words | 绘制一个单词云,单词按维度(x)排列并着色 | ||
preprocess | 预处理功能 | ||
preprocess_tokens | 预处理字符向量中的标记 | ||
print.contextHits | S3打印contextHits类 | ||
print.featureHits | S3 featureHits类打印 | ||
print.tCorpus | S3打印tCorpus类 | ||
refresh_tcorpus | 使用当前版本的corpustools刷新tCorpus对象 | ||
replace_dictionary | 用字典匹配替换标记 | ||
require_package | 检查给定版本的包是否存在 | ||
search_contexts | 使用布尔查询搜索文档或句子 | ||
search_dictionary | 字典查找 | ||
search_features | 使用类似Lucene的搜索查询查找令牌 | ||
search_recode | 基于搜索字符串在tCorpus中重新编码特征 | ||
semnet | 基于文档中标记的共现性创建语义网络 | ||
semnet_window | 基于令牌窗口中令牌的共现创建语义网络 | ||
set | 修改令牌和元数据表一个tCorpus的 | ||
set_levels | 更改因子列的级别 | ||
set_meta | 修改令牌和元数据表一个tCorpus的 | ||
set_meta_levels | 更改因子列的级别 | ||
set_meta_name | 更改数据和元数据的列名 | ||
set_name | 更改数据和元数据的列名 | ||
set_network_attributes | 设置一些默认的网络属性 | ||
set_special | 将列指定为具有特殊含义的列(token、引理、POS、relation、parent) | ||
sgt | 简单良好的图灵平滑 | ||
show_udpipe_models | 显示管道模型的名称 | ||
sotu_texts | 国情咨文 | ||
stopwords_list | 基本非索引词列表 | ||
subset | 子集合a tCorpus | ||
subset.tCorpus | tCorpus类的S3子集 | ||
subset_meta | 子集合a tCorpus | ||
subset_query | 使用查询的tCorpus令牌数据子集 | ||
summary.contextHits | contextHits类的S3摘要 | ||
summary.featureHits | S3 featureHits类摘要 | ||
summary.tCorpus | tCorpus对象的摘要 | ||
tCorpus | tCorpus:一个用于标记化文本的语料库类 | ||
tcorpus | tCorpus:一个用于标记化文本的语料库类 | ||
tCorpus$code_dictionary | 字典查找 | ||
tCorpus$code_features | 基于搜索字符串的tCorpus中的代码特性 | ||
tCorpus$compare_corpus | 将tCorpus词汇表与另一个(参考)tCorpus词汇表进行比较 | ||
tCorpus$compare_documents | 计算文档的相似性 | ||
tCorpus$compare_subset | 比较tCorpus子集与tCorpus其余部分的词汇表 | ||
tCorpus$context | 获取上下文向量 | ||
tCorpus$deduplicate | 重复数据消除文档 | ||
tCorpus$delete_columns | 从数据和元数据中删除列 | ||
tCorpus$delete_meta_columns | 从数据和元数据中删除列 | ||
tCorpus$dfm | 创建文档术语矩阵。 | ||
tCorpus$dtm | 创建文档术语矩阵。 | ||
tCorpus$feats_to_columns | 将UDpipe标记中的“专长”列投射到列 | ||
tCorpus$feature_associations | 获取给定功能查询的常用术语 | ||
tCorpus$feature_stats | 特征统计 | ||
tCorpus$feature_subset | 过滤器功能 | ||
tCorpus$get | 从tCorpus访问数据 | ||
tCorpus$get_meta | 从tCorpus访问数据 | ||
tCorpus$kwic | 在上下文(KWIC)字符串中获取关键字 | ||
tCorpus$lda_fit | 评估LDA主题模型 | ||
tCorpus$preprocess | 预处理功能 | ||
tCorpus$replace_dictionary | 用字典匹配替换标记 | ||
tCorpus$search_contexts | 使用布尔查询搜索文档或句子 | ||
tCorpus$search_features | 使用类似Lucene的搜索查询查找令牌 | ||
tCorpus$search_recode | 基于搜索字符串在tCorpus中重新编码特征 | ||
tCorpus$semnet | 基于文档中标记的共现性创建语义网络 | ||
tCorpus$semnet_window | 基于令牌窗口中令牌的共现创建语义网络 | ||
tCorpus$set | 修改令牌和元数据表一个tCorpus的 | ||
tCorpus$set_levels | 更改因子列的级别 | ||
tCorpus$set_meta | 修改令牌和元数据表一个tCorpus的 | ||
tCorpus$set_meta_levels | 更改因子列的级别 | ||
tCorpus$set_meta_name | 更改数据和元数据的列名 | ||
tCorpus$set_name | 更改数据和元数据的列名 | ||
tCorpus$set_special | 将列指定为具有特殊含义的列(token、引理、POS、relation、parent) | ||
tCorpus$subset | 子集合a tCorpus | ||
tCorpus$subset_meta | 子集合a tCorpus | ||
tCorpus$subset_query | 使用查询的tCorpus令牌数据子集 | ||
tCorpus$top_features | 显示主要功能 | ||
tCorpus_compare | 语料库比较 | ||
tCorpus_create | 创建tCorpus | ||
tCorpus_data | 查看、修改和子集tCorpus数据的方法和功能 | ||
tCorpus_docsim | 文档相似性 | ||
tCorpus_features | 特征的预处理、子集和分析 | ||
tCorpus_modify_by_reference | 通过引用修改tCorpus | ||
tCorpus_querying | 使用布尔查询来分析tCorpus | ||
tCorpus_semnet | 基于特征共现的语义网络分析 | ||
tCorpus_topmod | 主题建模 | ||
tokens_to_tcorpus | 基于令牌(即预处理文本)创建tcorpus | ||
tokenWindowOccurence | 给出矩阵中出现术语的窗口。 | ||
top_features | 显示主要功能 |