dlookr-package | dlookr:用于数据诊断、探索和转换的工具 | ||
binning | 组合数值数据 | ||
binning_by | 评分模型的最优分格 | ||
compare_category | 比较分类变量 | ||
compare_category.data.frame | 比较分类变量 | ||
compare_numeric | 比较数值变量 | ||
compare_numeric.data.frame | 比较数值变量 | ||
correlate | 计算两个数值数据之间的相关系数 | ||
correlate.data.frame | 计算两个数值数据之间的相关系数 | ||
correlate.tbl_dbi | 计算两个数值数据之间的相关系数 | ||
describe | 计算描述性统计 | ||
describe.data.frame | 计算描述性统计 | ||
describe.tbl_dbi | 计算描述性统计 | ||
diagnose | 诊断变量的数据质量 | ||
diagnose.data.frame | 诊断变量的数据质量 | ||
diagnose.tbl_dbi | 数据库管理系统中变量的数据质量诊断 | ||
diagnose_category | 分类变量的数据质量诊断 | ||
diagnose_category.data.frame | 分类变量的数据质量诊断 | ||
diagnose_category.tbl_dbi | 数据库管理系统中分类变量的数据质量诊断 | ||
diagnose_numeric | 数值变量的数据质量诊断 | ||
diagnose_numeric.data.frame | 数值变量的数据质量诊断 | ||
diagnose_numeric.tbl_dbi | 数据库管理系统中数值变量的数据质量诊断 | ||
diagnose_outlier | 诊断数值变量的异常值 | ||
diagnose_outlier.data.frame | 诊断数值变量的异常值 | ||
diagnose_outlier.tbl_dbi | 数据库管理系统中数值变量离群点的诊断 | ||
diagnose_report | 数据诊断信息上报 | ||
diagnose_report.data.frame | 数据诊断信息上报 | ||
diagnose_report.tbl_dbi | 数据库表数据诊断信息的上报 | ||
dlookr | dlookr:用于数据诊断、探索和转换的工具 | ||
eda_report | 报告EDA信息 | ||
eda_report.data.frame | 报告EDA信息 | ||
eda_report.tbl_dbi | 数据库管理系统表的EDA信息上报 | ||
find_class | 提取特定类的变量名或索引 | ||
find_na | 查找包含缺失值的变量 | ||
find_outliers | 寻找包含异常值的变量 | ||
find_skewness | 寻找扭曲变量 | ||
get_class | 提取一类变量 | ||
get_column_info | 描述数据库管理系统中表的列 | ||
get_os | 查找用户计算机的操作系统 | ||
imputate_na | 插补缺失值 | ||
imputate_outlier | 估算异常值 | ||
kurtosis | 数据峰度 | ||
normality | 执行夏皮罗-威尔克正态性检验 | ||
normality.data.frame | 执行夏皮罗-威尔克正态性检验 | ||
normality.tbl_dbi | 执行夏皮罗-威尔克正态性检验 | ||
plot.bins | 可视化“bin”对象的分布 | ||
plot.compare_category | 可视化filename_points_covered_by_landmarks对象的信息 | ||
plot.compare_numeric | 可视化filename_points_covered_by_landmarks对象的信息 | ||
plot.imputation | 可视化“插补”对象的信息 | ||
plot.optimal_bins | 可视化filename_points_covered_by_landmarks对象的分布 | ||
plot.relate | 可视化“关联”对象的信息 | ||
plot.transform | 可视化“变换”对象的信息 | ||
plot.univar_category | 可视化filename_points_covered_by_landmarks对象的信息 | ||
plot.univar_numeric | 可视化filename_points_covered_by_landmarks对象的信息 | ||
plot_correlate | 可视化数值数据的相关图 | ||
plot_correlate.data.frame | 可视化数值数据的相关图 | ||
plot_correlate.tbl_dbi | 可视化数值数据的相关图 | ||
plot_na_hclust | 缺失值组合图 | ||
plot_na_intersect | 绘制包含缺失值的组合变量 | ||
plot_na_pareto | 缺失值的帕累托图 | ||
plot_normality | 数值数据的分布信息 | ||
plot_normality.data.frame | 数值数据的分布信息 | ||
plot_normality.tbl_dbi | 数值数据的分布信息 | ||
plot_outlier | 数值数据诊断中离群点信息的绘制 | ||
plot_outlier.data.frame | 数值数据诊断中离群点信息的绘制 | ||
plot_outlier.tbl_dbi | 在DBMS中绘制数值数据诊断的离群点信息 | ||
print.bins | 汇总装箱变量 | ||
print.compare_category | 总结filename_points_covered_by_landmarks信息 | ||
print.compare_numeric | 总结filename_points_covered_by_landmarks信息 | ||
print.relate | 汇总相关信息 | ||
print.univar_category | 总结filename_points_covered_by_landmarks信息 | ||
print.univar_numeric | 总结filename_points_covered_by_landmarks信息 | ||
relate | 目标变量与感兴趣变量之间的关系 | ||
skewness | 数据偏斜 | ||
summary.bins | 汇总装箱变量 | ||
summary.compare_category | 总结filename_points_covered_by_landmarks信息 | ||
summary.compare_numeric | 总结filename_points_covered_by_landmarks信息 | ||
summary.imputation | 插补信息汇总 | ||
summary.transform | 汇总转换信息 | ||
summary.univar_category | 总结filename_points_covered_by_landmarks信息 | ||
summary.univar_numeric | 总结filename_points_covered_by_landmarks信息 | ||
target_by | 以一个变量为目标 | ||
target_by.data.frame | 以一个变量为目标 | ||
target_by.tbl_dbi | DBMS中的一列目标 | ||
transform | 数据转换 | ||
transformation_report | 上报改造信息 | ||
univar_category | 一元范畴变量的统计量 | ||
univar_category.data.frame | 一元范畴变量的统计量 | ||
univar_numeric | 一元数值变量的统计量 | ||
univar_numeric.data.frame | 一元数值变量的统计量 |