新書推薦:

《
经过检视的人生 从苏格拉底到尼采
》
售價:NT$
306

《
阿尔喀比亚德斯 I(柏拉图全集)
》
售價:NT$
500

《
百家争鸣与中华文明的哲学突破
》
售價:NT$
536

《
孟子学术流传与秦汉价值重构
》
售價:NT$
510

《
中国早期城市与文明起源 一部中国早期城市发展简史,解读城市与文明交织共生的规律
》
售價:NT$
449

《
只要我还在创作 角谷美智子访谈录
》
售價:NT$
347

《
国医大师邓铁涛 治未病从孩子抓起 中医治未病 二十四节气顺时调养 常见病预防 中医健康体检 广东科技
》
售價:NT$
255

《
英国都铎王朝君主形象塑造与政治文化变迁
》
售價:NT$
857
|
| 內容簡介: |
|
本书是一本关于如何应用R语言开展流行病学数据清洗、整理和分析的医学教材。全书共18章,首先介绍了R语言基础知识,包括R语言简介、数据管理、控制流、文本处理、数据可视化、基本统计分析方法;然后介绍了R语言在常见流行病学研究设计中的应用,包括现况研究、生态学研究、队列研究、病例对照研究、随机对照试验、筛检试验和诊断试验;最后介绍了R语言在其他流行病学问题中的应用,包括缺失值处理、功效分析、交互作用分析、因果推断、Meta分析、孟德尔随机化。本书通过概述、示例实践、练习案例等教学模块,全面介绍和演示了流行病学数据的R语言处理过程。通过学习本书,学生能更好地理解流行病学研究,为开展后续的数据分析打下基础。本书有助于学生利用R语言解决实际问题,以更好地开展流行病学的相关研究。 本书可以作为流行病学相关专业的高年级本科生、研究生教材,同时对从事数据分析的医务人员、专业技术人员等也具有参考价值。
|
| 關於作者: |
|
刘跃伟,男,副教授,中山大学公共卫生学院流行病学系副主任,美国西弗吉尼亚大学访问学者,中山大学一流本科课程《流行病学》参与人,具备《R语言的流行病学应用》研究生课程教学经验,指导学生参加2022年(第八届)全国大学生统计建模大赛,获本科生组一等奖,获优秀指导教师奖。
|
| 目錄:
|
第1章 R语言简介1 1.1 概述1 1.1.1 R语言是什么1 1.1.2 为什么选择R语言2 1.2 前期准备2 1.2.1 下载并安装R语言2 1.2.2 下载并安装RStudio3 1.3 使用RStudio:极简入门4 1.3.1 RStudio界面导览4 1.3.2 创建R语言项目4 1.3.3 创建R语言脚本5 1.4 程序包的管理5 1.4.1 安装程序包5 1.4.2 加载程序包6 1.4.3 卸载与删除程序包6 1.4.4 其他实用函数7 1.4.5 安装程序包的常见问题与解决方案7 1.5 更新R-base、程序包和RStudio8 1.5.1 更新R-base和程序包8 1.5.2 更新RStudio10 1.6 获取帮助10 1.6.1 查看说明文档10 1.6.2 在社区中查找解决方案或提问11 1.7 练习案例12 1.8 小结13 第2章 数据管理14 2.1 数据类型14 2.1.1 基本数据类型速览14 2.1.2 向量15 2.1.3 因子15 2.1.4 矩阵16 2.1.5 数据框16 2.1.6 数组18 2.1.7 列表18 2.1.8 数据类型的层次结构19 2.2 数据的输入和输出19 2.2.1 数据的输入19 2.2.2 数据的输出21 2.3 函数21 2.3.1 概念21 2.3.2 数据管理常用函数22 2.3.3 函数查询24 2.4 创建新变量25 2.4.1 变量命名规则和赋值方式25 2.4.2 常用的运算符25 2.4.3 data.table程序包26 2.5 变量重编码27 2.6 变量重命名28 2.7 数据类型的查看和转换29 2.7.1 查看数据类型29 2.7.2 数据类型的转换30 2.8 数据排序31 2.8.1 sort()31 2.8.2 rank()32 2.8.3 order()32 2.8.4 setorder()33 2.9 数据集取子集33 2.9.1 基于变量提取、删除子集33 2.9.2 基于条件提取子集34 2.9.3 保留非重复行35 2.9.4 删除存在缺失值的行35 2.10 数据集合并36 2.10.1 简单合并36 2.10.2 匹配合并37 2.11 数据整合与重构38 2.11.1 转置38 2.11.2 分类汇总39 2.11.3 融合39 2.11.4 重铸40 2.12 练习案例40 2.13 小结41 第3章 控制流44 3.1 条件执行44 3.1.1 if-else结构44 3.1.2 ifelse()45 3.1.3 switch()45 3.2 循环46 3.2.1 for循环46 3.2.2 while循环47 3.2.3 repeat循环47 3.2.4 循环控制47 3.3 减少显式循环48 3.3.1 向量化运算48 3.3.2 apply族函数50 3.3.3 dplyr程序包中的向量化函数51 3.4 并行计算52 3.5 练习案例54 3.6 小结55 第4章 文本处理56 4.1 正则表达式56 4.1.1 显示匹配56 4.1.2 元字符57 4.1.3 转义字符58 4.1.4 字符类59 4.1.5 量词61 4.1.6 定位符61 4.1.7 分组62 4.1.8 处理选项63 4.2 字符统计和翻译64 4.2.1 字符统计函数64 4.2.2 字符翻译函数64 4.3 字符串连接65 4.3.1 base程序包函数65 4.3.2 stringr程序包函数65 4.4 字符串拆分66 4.4.1 base程序包函数66 4.4.2 stringr程序包函数66 4.5 字符串查询67 4.5.1 base程序包函数67 4.5.2 stringr程序包函数69 4.6 字符串替换71 4.6.1 base程序包函数71 4.6.2 stringr程序包函数71 4.7 字符串提取72 4.7.1 base程序包函数72 4.7.2 stringr程序包函数74 4.8 字符串定制输出76 4.8.1 base程序包函数76 4.8.2 stringr程序包函数77 4.9 练习案例78 4.10 小结78 第5章 数据可视化81 5.1 背景介绍81 5.2 ggplot2程序包81 5.3 数据及图形属性映射82 5.4 几何对象83 5.4.1 概述83 5.4.2 散点图和折线图84 5.4.3 误差棒图和热图85 5.5 标度和图例87 5.5.1 标度88 5.5.2 图例90 5.6 坐标系统91 5.7 图形分组和分面92 5.7.1 分组92 5.7.2 分面94 5.8 主题调整97 5.9 图形输出100 5.10 练习案例101 5.11 小结101 第6章 基本统计分析方法103 6.1 统计描述与区间估计103 6.2 均数比较的假设检验104 6.2.1 t检验104 6.2.2 方差分析105 6.3 率比较的假设检验109 6.4 非参数假设检验110 6.5 相关与回归111 6.5.1 相关111 6.5.2 回归112 6.6 广义线性模型116 6.6.1 Logistic 回归116 6.6.2 泊松回归117 6.7 生存分析118 6.7.1 绘制生存曲线118 6.7.2 Cox比例风险模型120 6.8 混合效应模型121 6.9 练习案例123 6.10 小结124 第7章 现况研究126 7.1 概述126 7.1.1 概念126 7.1.2 现况研究常见的偏倚127 7.1.3 现况研究的主要用途127 7.1.4 现况研究的优缺点127 7.2 现况研究类型127 7.2.1 按调查方式分类127 7.2.2 按研究目的分类128 7.3 示例实践132 7.3.1 抽样调查的样本量计算132 7.3.2 描述性研究133 7.3.3 分析性研究140 7.4 练习案例149 7.4.1 标准化法149 7.4.2 关联149 7.4.3 逻辑回归149 7.5 小结150 第8章 生态学研究151 8.1 研究设计概述151 8.1.1 概念151 8.1.2 生态学研究的分类151 8.1.3 生态学研究的特点152 8.1.4 生态学研究的使用情景和作用153 8.2 常见的研究设计类型153 8.2.1 生态比较研究153 8.2.2 生态趋势研究154 8.3 示例实践154 8.3.1 生态比较研究154 8.3.2 生态趋势研究155 8.4 练习案例160 8.4.1 生态比较研究160 8.4.2 生态趋势研究160 8.5 小结160 第9章 队列研究162 9.1 研究设计概述162 9.1.1 概念162 9.1.2 特点162 9.1.3 分类163 9.2 常用的分析方法164 9.2.1 生存资料164 9.2.1 生存分析164 9.3 队列研究的R语言实现及示例165 9.3.1 生存资料示例165 9.3.2 使用R语言进行生存分析166 9.4 练习案例184 9.6 小结185 第10章 病例对照研究186 10.1 概述186 10.1.1 概念186 10.1.2 特点187 10.1.3 研究框架187 10.2 常见的研究设计类型187 10.2.1 非匹配病例对照研究187 10.2.2 匹配病例对照研究188 10.2.3 常见的衍生设计类型189 10.3 示例实践190 10.3.1 非匹配病例对照研究190 10.3.2 频数匹配病例对照研究198 10.3.3 个体匹配病例对照研究200 10.4 练习案例208 10.5 小结208 第11章 随机对照试验210 11.1 研究设计概述210 11.1.1 随机对照试验的定义210 11.1.2 随机对照试验的设计原理和原则211 11.1.3 随机对照试验统计分析要点212 11.2 常见的研究设计类型213 11.2.1 大型随机对照试验213 11.2.2 单人重复交叉试验213 11.2.3 序贯试验213 11.2.4 交叉试验213 11.2.5 析因试验213 11.3 示例实践214 11.3.1 R语言与随机对照试验214 11.3.2 随机化分组214 11.3.3 临床试验样本量计算216 11.3.4 统计分析方法220 11.4 练习案例235 11.5 小结235 第12章 筛检试验和诊断试验237 12.1 概述237 12.1.1 概念237 12.1.2 筛检试验和诊断试验的区别237 12.1.3 类型237 12.1.4 诊断试验的设计238 12.2 诊断试验的评价239 12.2.1 真实性239 12.2.2 可靠性241 12.2.3 收益242 12.2.4 诊断临界值的确定242 12.3 示例实践243 12.3.1 二分类资料的诊断试验评价243 12.3.2 连续型资料的诊断试验评价245 12.3.3 单一和联合诊断试验的评价248 12.3.4 基于Logistic回归的多指标联合诊断255 12.4 练习案例257 12.5 小结258 第13章 缺失值处理260 13.1 概述260 13.1.1 缺失数据的普遍性260 13.1.2 处理缺失数据的重要性260 13.1.3 数据缺失的原因260 13.1.4 缺失数据的类型261 13.1.5 常见的缺失数据处理方法262 13.1.6 处理缺失数据的一般步骤262 13.2 示例实践263 13.2.1 识别缺失值264 13.2.2 处理缺失数据269 13.3 练习案例275 13.4 小结276 第14章 功效分析278 14.1 功效分析简介278 14.1.1 引言278 14.1.2 功效分析的意义278 14.1.3 假设检验的两类错误和功效分析的关键要素278 14.1.4 效应量279 14.1.5 功效分析的一般步骤280 14.1.6 利用R语言进行功效分析280 14.2 不同统计方法的功效分析281 14.2.1 定量资料统计方法的功效分析281 14.2.2 定性资料统计方法的功效分析284 14.2.3 相关分析和回归分析的功效分析287 14.3 练习案例289 14.4 小结和深入阅读290 14.4.1 本章小结290 14.4.2 深入阅读291 第15章 交互作用分析293 15.1 概述293 15.1.1 概念293 15.1.2 交互作用的类型294 15.1.3 交互作用的意义295 15.2 示例实践296 15.2.1 连续型变量和连续型变量296 15.2.2 连续型变量和分类变量302 15.2.3 分类变量和分类变量304 15.3 练习案例307 15.4 小结308 第16章 因果推断309 16.1 因果推断概述309 16.1.1 引言309
|
|