chinese.misc-package | 用于中文文本挖掘等的杂项工具 | ||
as.character2 | 的增强版本作为角色 | ||
as.numeric2 | 的增强版本作为数字 | ||
chinese.misc | 用于中文文本挖掘等的杂项工具 | ||
corp_or_dtm | 创建一行语料库或文档术语矩阵 | ||
create_ttm | 创建术语矩阵(术语共现矩阵) | ||
csv2txt | 将CSV中的文本写入许多TXT/RTF文件 | ||
DEFAULT_control1 | filename_points_covered_by_landmarks的默认值 | ||
DEFAULT_control2 | filename_points_covered_by_landmarks2的默认值 | ||
DEFAULT_cutter | 默认切割器 | ||
dictionary_dtm | 对词组进行DTM/TDM | ||
dir_or_file | 从目录和文件的混合中收集完整的文件名 | ||
get_tag_word | 通过词性标注提取特定标签的单词 | ||
get_tmp_chi_locale | 检查Locale函数的假设 | ||
is_character_vector | 方便的版本是。性格 | ||
is_positive_integer | 方便的版本是整数 | ||
m2doc | 将术语和频率重写到许多文件中 | ||
m3m | 在matrix、dgCMatrix、filename_points_covered_by_landmarks、DocumentTermMatrix、TermDocumentMatrix之间转换对象 | ||
make_stoplist | 输入一个文件名并返回一个停止词向量 | ||
match_pattern | 用正则表达式快速提取字符串 | ||
output_dtm | 快速转换或写入DTM/TDM对象 | ||
scancn | 通过自动检测编码读取文本文件 | ||
seg_file | 方便的中文文本分割工具 | ||
slim_text | 通过语音标记删除单词 | ||
sort_tf | 查找高频项 | ||
sparse_left | 检查在某些稀疏值下还剩多少单词 | ||
tf2doc | 将术语和频率转换为文本 | ||
topic_trend | 几年的简单涨跌趋势 | ||
txt2csv | 将多个分离的文件写入CSV | ||
V | 从类似Excel的文件复制和粘贴 | ||
VC | 从类似Excel的文件复制和粘贴 | ||
VCR | 从类似Excel的文件复制和粘贴 | ||
VR | 从类似Excel的文件复制和粘贴 | ||
VRC | 从类似Excel的文件复制和粘贴 | ||
word_cor | DTM/TDM中的词相关 |