基于R语言的社会统计分析
基于R语言的社会统计分析
5万+ 人选课
更新日期:2025/05/15
开课平台学堂在线
开课高校清华大学
开课教师罗昊
学科专业理学统计学类
开课时间2025/01/15 - 2025/07/22
课程周期27 周
开课状态开课中
每周学时-
课程简介
统计学是现代科学的通用语,是现代研究一项不可缺少的工具。社会科学与经典统计学原理结合,形成了一套使用统计测量体系研究社会环境中人类行为的方法论体系。这套体系不仅局限于深奥的数字、表格和公式,更是一种逻辑思维方式;它提供给研究者的不仅是收集、分析、理解数据的基本技能,更是一种从证据到结论的科学推论过程。 统计分析可分为探索性数据分析和推断性统计方法两部分,概率论则是连接两者的桥梁。本课程将借助开放源统计软件R语言所带来的强大功能,介绍探索数据的必备技能。接着,我们将对抽样分布、估计以及假设检验等统计学核心理论进行讲解。最后,我们将结合来自社会学、心理学、教育学等学科的研究实例,对多元回归、逻辑斯蒂回归、多水平模型等高级统计方法在社会科学中的应用进行探讨。 即使你以往的数学学习困难重重,也并不意味着你在这门课的学习中将处于劣势。我们相信,逻辑思维的训练比计算能力更重要。课程结束,你将对如何提炼纷繁数据中的有效信息有更好的感觉;别人研究中的统计分析将不再是你的阅读禁区;你将学会如何作为统计学原理的消费者,将统计思维应用到自己的研究中去。
课程大纲
第一章:绪论
1.1 什么是统计学?
1.2 数据
1.3 随机化原则
1.4 数据收集方法
第二章:描述统计
2.1 描述统计概述 - 社会学概念的量化问题
2.2 变量的分类
2.3 描述统计方法 I: 制表法 Tabular Method
2.4 描述统计方法 II: 绘图法 Graphical Method
2.5 描述统计方法 III: 数值法 Numerical Method
第三章:基于R语言的探索性数据分析
3.1 探索性数据分析
3.2 EDA的制图原则
3.3 R语言初体验
3.4 CRAN 和学习资源
3.5 R 基础知识
3.6 图形和数值
第四章:概率分布
4.1 概率的基本概念
4.2 离散型与连续型变量的概率分布
4.3 正态分布
4.4 抽样分布
第五章:统计推断 - 估计
5.1 用抽样分布来代表抽样的变异性
5.2 样本均值的抽样分布
5.3 中心极限定理
5.4 点估计和区间估计
第六章:统计推断 - 区间估计
6.1 区间估计
6.2 总体比例的区间估计
6.3 置信水平
6.4 总体均值的区间估计
第七章: 统计推断 - 显著性检验
7.1 绪论
7.2 一个显著性检验的五个部分
7.3 均值的显著性检验
7.4 比例的显著性检验
7.5 检验中错误的类型
第八章:两组比较和多组比较
8.1 预备知识
8.2 比较两组比例
8.3 比较两个独立样本的均值
8.4 比较两个相依样本的均值
8.5 方差分析(选学)
第九章:变量间的关联分析
9.1 变量间的关联分析
9.2 列联分析
9.3 定序变量间的关联关系
第十章:简单线性回归
10.1 简单线性回归模型概述
10.2 模型系数估计
10.3 评价系数估计的准确性
10.4 评价模型的准确性
10.5 R Lab: 用R构建简单线性模型
第十一章:多元回归
11.1 多元线性回归概述
11.2 多元线性回归
11.3 潜在问题及解决方案
11.4 用R语言进行多元线性回归
第十二章: Logistic回归和其他高级统计方法简介
12.1 社会科学中的分类问题
12.2 Logistic回归概述
12.3 Logistic回归系数估计
12.4 Logistic回归模型评价
12.5 其他多元统计方法
12.6 R语言实践
12.7 结束语
期末考试