您好,欢迎光临有路网!
R语言(第2版)
QQ咨询:
有路璐璐:

R语言(第2版)

  • 作者:刘鹏、程显毅、孙丽丽、林道荣
  • 出版社:清华大学出版社
  • ISBN:9787302610229
  • 出版日期:2022年07月01日
  • 页数:223
  • 定价:¥59.00
  • 分享领佣金
    手机购买
    城市
    店铺名称
    店主联系方式
    店铺售价
    库存
    店铺得分/总交易量
    发布时间
    操作

    新书比价

    网站名称
    书名
    售价
    优惠
    操作

    图书详情

    内容提要
    本书通过Titanic 数据分析案例,深入浅出地介绍了R 语言在大数据分析应用中的相关知识,包括:数据准备、数据清洗、数据探索、数据变换、特征工程、数据建模、模型评估、模型部署等。全书共13章,第1~3 章介绍R 语言的开发环境和基本语法;第4~8 章按数据分析生命周期讨论R语言的实现;第9 章**编程相对独立,主要解决复杂问题可能用到的程序结构;第10、11 章与机器学习有关,内容偏难,但通过Rattle 包回避了算法底层技术的难点;第12、13 章通过两个实际项目,让读者体验数据处理的全过程以及业务对分析的重要性。本书力求以简洁、精练、理论与实践相结合的方式,让读者快速掌握R 语言。 本书既可作为数据分析相关课程的教材,也可作为数据分析爱好者的参考资料。
    目录
    第1 章 绪论 1.1 R 语言概述 1 1.1.1 R 语言现状 1 1.1.2 R 语言主要优势 2 1.1.3 学R 语言的理由 3 1.2 新手上路 4 1.3 R 语言开发环境部署 5 1.3.1 安装R 5 1.3.2 安装RStudio 6 1.4 获取帮助 8 1.5 工作空间 8 1.6 脚本 9 1.7 R 包 9 习题 10 第2 章 基本语法 2.1 变量 11 2.1.1 变量及其作用 11 2.1.2 变量命名 12 2.1.3 变量赋值 12 2.1.4 变量值输出 12 2.2 常量 13 2.2.1 逻辑常量 13 2.2.2 符号常量 13 2.2.3 标量 13 2.3 向量 15 2.3.1 向量产生 15 2.3.2 向量引用 16 2.3.3 向量化运算 16 XII R 语言(第2 版) 2.3.4 向量排序 17 2.4 运算符 18 2.4.1 算术运算符 18 2.4.2 关系运算符 18 2.4.3 逻辑运算符 19 2.4.4 其他运算符 20 2.5 命令 20 2.6 重要内置函数 21 习题 23 第3 章 数据类型 3.1 基本数据类型 27 3.2 结构数据类型 28 3.2.1 矩阵 28 3.2.2 数组 30 3.2.3 数据框 32 3.2.4 因子 33 3.2.5 列表 34 3.3 字符串操作 35 3.3.1 分割 35 3.3.2 拼接 35 3.3.3 正则表达式 36 3.3.4 替换 39 3.3.5 提取 42 3.3.6 测定字符串长度 42 3.3.7 匹配 43 3.4 数据类型判断和转换 43 3.5 日期和时间数据操作 44 3.5.1 日期数据基本操作 44 3.5.2 时间数据基本操作 45 习题 45 第4 章 数据导入导出 4.1 数据导入 49 4.1.1 键盘输入数据 49 目 录 XIII 4.1.2 导入文本文件 50 4.1.3 导入csv 文件 51 4.1.4 导入Excel 文件 51 4.1.5 导入数据库文件 51 4.2 数据导出 52 4.2.1 导出文本文件 52 4.2.2 保存图片 53 习题 53 第5 章 数据可视化 5.1 一图胜千言 55 5.2 低水平绘图命令 56 5.2.1 点图 56 5.2.2 线图 58 5.2.3 面图 60 5.3 高水平绘图命令 63 5.3.1 认识ggplot2 63 5.3.2 几何对象 63 5.3.3 映射 64 5.3.4 统计对象 66 5.3.5 标度 67 5.3.6 分面 68 5.3.7 其他修饰 69 5.4 交互式绘图命令 72 5.4.1 rCharts 包 72 5.4.2 plotly 包 74 5.4.3 Shiny 76 5.5 数据可视化图形选择建议 83 习题 84 第6 章 数据清洗 6.1 缺失值分析 87 6.1.1 缺失值检测 87 6.1.2 缺失数据处理 88 6.2 异常值分析 89 XIV R 语言(第2 版) 6.2.1 箱线图检测离群点 89 6.2.2 点图检测离群点 90 6.3 数据去重 91 6.4 规范化 92 6.4.1 数据的**化 92 6.4.2 数据标准化 92 6.5 格式转换 93 习题 95 第7 章 数据探索 7.1 单一变量分析 97 7.1.1 定量变量 97 7.1.2 定性变量 99 7.2 双变量分析 100 7.2.1 一个定性变量和一个定量变量 100 7.2.2 两个定性变量 100 7.2.3 两个定量变量 101 7.3 多变量分析 102 7.3.1 集中趋势度量 102 7.3.2 离中趋势度量 103 7.4 相关分析 104 7.4 1 相关系数 104 7.4.2 直接绘制点图 105 7.4.3 绘制点图矩阵 106 习题 106 第8 章 数据变换 8.1 数据集划分与选择 109 8.1.1 数据集划分 109 8.1.2 数据集选择 110 8.2 特征工程 110 8.2.1 特征工程概述 110 8.2.2 特征构建 111 8.2.3 特征选择 112 8.2.4 特征抽取 115 8.2.5 自动化特征工程 117 8.3 数据整合 118 8.3.1 通过向量化重构数据 119 8.3.2 为数据添加新变量 119 8.3.3 变形与融合 120 8.3.4 列联表 123 8.3.5 分组汇总 123 8.3.6 连接表 125 习题 127 第9 章 **编程 9.1 条件表达式 131 9.2 选择结构 132 9.3 循环结构 135 9.4 用户自定义函数 138 习题 139 第10 章 数据建模 10.1 Rattle 包 141 10.2 变量的类别 143 10.3 聚类分析 145 10.3.1 背景 145 10.3.2 K-means 聚类 146 10.3.3 层次聚类 148 10.4 关联规则挖掘 150 10.4.1 背景 150 10.4.2 基本术语 151 10.4.3 关联规则的分类 152 10.4.4 Apriori 算法 153 10.4.5 实验指导 154 10.5 传统决策树模型 156 10.5.1 背景 156 10.5.2 ID3 算法 157 10.5.3 C4.5 算法 158 10.5.4 实验指导 159 XVI R 语言(第2 版) 10.6 随机森林决策树模型 161 10.6.1 背景 161 10.6.2 随机森林算法 161 10.6.3 实验指导 163 10.7 自适应选择决策树模型 166 10.7.1 背景 166 10.7.2 Boosting 算法 166 10.7.3 adaboost 算法 167 10.7.4 实验指导 167 10.8 SVM 171 10.8.1 背景 171 10.8.2 SVM 算法 171 10.8.3 实验指导 173 10.9 线性回归模型 174 10.9.1 背景 174 10.9.2 一元线性回归方法 174 10.9.3 实验指导 176 10.10 神经网络模型 177 10.10.1 背景 177 10.10.2 人工神经网络模型 178 10.10.3 实验指导 179 习题 181 第11 章 模型评估 11.1 Rattle 模型评估选项卡 185 11.2 混淆矩阵 186 11.2.1 二分类混淆矩阵 186 11.2.2 模型评价指标 187 11.2.3 多分类混淆矩阵 188 11.3 风险图 188 11.3.1 风险图的作用 188 11.3.2 实验指导 188 11.4 ROC 曲线 190 11.4.1 ROC 曲线概述 190 11.4.2 ROC 曲线的作用 190 11.4.3 实验指导 190 11.5 交叉验证 192 习题 193 第12 章 影响大学平均录取分数线因素分析 12.1 背景与目标 195 12.2 数据说明 195 12.3 描述性分析 196 12.4 数据建模 199 12.5 总结 201 第13 章 收视率分析 13.1 背景介绍 202 13.2 数据说明 202 13.3 描述性分析 203 13.4 数据建模 209 13.5 总结 212 参考文献 附录A 附录B

    与描述相符

    100

    北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 台湾 香港 澳门 海外