章引言/1 1.1什么是大数据/2 1.2什么是数据科学/2 1.3教学内容和目的/3 第二章因果推断/4 2.1观察性数据/5 2.2随机化双盲试验/9 2.3随机化试验的其他例子/13 2.4结论/14 第三章Python入门/15 3.1Python安装指南/15 3.2表达式/16 3.3数值类型/19 3.4字符串/23 3.5赋值语句/28 3.6其他运算符/35 3.7调用函数/42 3.8结论/47 第四章复杂数据类型/48 4.1列表/49 4.2元组/56 4.3字典/57 4.4数组/60 第五章复杂代码组/66 5.1条件语句/69 5.2循环语句/73 5.3函数/85 第六章表格处理/92 6.1模拟数据/96 6.2案例1:1812年俄法战争数据/107 6.3案例2:2010年中国人口普查资料/111 第七章数据可视化/118 7.1基础语法/118 7.2散点图和折线图/119 7.3柱状图、饼图、箱线图和概率图/140 第八章概率、条件概率及贝叶斯公式/149 8.1概率/149 8.2条件概率/151 8.3贝叶斯公式/155 8.4随机变量和概率分布/158 第九章经验分布/166 9.1总体概率分布的直方图/166 9.2经验分布的直方图/167 9.3大数定律/171 9.4总体/174 9.5从总体中抽样及样本的经验分布/177 9.6参数/179 9.7模拟统计量/180 9.8案例1���NBA周明星球员的年龄/182 9.9案例2:估计敌军飞机的数量/185 第十章假设检验/191 10.1案例1:第十二届全国人民代表大会少数民族人大代表比例问题/191 10.2案例2:孟德尔的豌豆花/199 10.3案例3:某附属中学学生的平均分数/202 10.4错误概率/204 10.5简单的假设检验/206 第十一章参数估计/216 11.1百分位数/216 11.2自助法/222 11.3置信区间/233 第十二章均值与**极限定理/239 12.1均值的定义/239 12.20/1数据的均值是数据中1的比例/240 12.3均值和直方图/241 12.4一些例子/244 12.5数据波动性/247 12.6标准差和正态曲线/252 12.7**极限定理/258 12.8样本均值的波动/263 12.9样本均值的**极限定理/268 第十三章预测/271 13.1相关性/272 13.2回归直线/279 13.3均方根误差/287 第十四章回归中的统计推断/290 14.1回归模型/290 14.2对于真实斜率的推断/292 14.3对于散点图的重抽样/295 14.4预测的波动性/304 14.5总结/306 第十五章机器学习常用方法/308 15.1回归模型/308 15.2分类方法/321 15.3非监督学习——聚类/325