新書推薦:
《
心理咨询与治疗技术经典入门(第3版)
》
售價:NT$
650.0
《
无冕之王:齐桓公与齐国崛起
》
售價:NT$
290.0
《
中国涉外法治蓝皮书(2024)
》
售價:NT$
484.0
《
黄庭经详解(全2册)
》
售價:NT$
660.0
《
台北故宫博物院典藏大系·绘画卷(全十册)
》
售價:NT$
47400.0
《
姑苏繁华图
》
售價:NT$
3190.0
《
人的消逝:从原子弹、互联网到人工智能
》
售價:NT$
484.0
《
想象的共同体--民族主义的起源与散布(增订版)
》
售價:NT$
352.0
編輯推薦:
一本非常实用的社会统计软件Stata数据管理的指导书!
有效提升大数据时代的数据管理能力和处理能力!
社会科学工作者、数据工作者的数据管理参考书!
手把手逐步演示数据管理的流程,易上手,易操作,突出实务!
国际Stata出版社授权,中国人民大学中国调查与数据中心翻译,准确、经得起检验的数据管理实务手册。
一本生动可读的数据管理书。作者就像是一个坐在对面娓娓道来的讲故事的人,将数据管理的流程和步骤一一展现,让我们重新认识到Stata在数据管理方面的迷人魅力。大数据时代,让数据为我所用,易用,乐用,是这本书的一个出发点。
该书的翻译也是可圈可点的,精确,流畅,译者唐丽娜不亏是科班出身并长期致力于社会统计的专家,她在社会数据的管理与统计方面的专业经验,以及在CGSS(中国综合社会调查)项目中丰富的实操经验,也极大保证了这本书的翻译质量。
內容簡介:
数据管理是介于原始数据收集和统计分析之间的一项重要工作,其包含了数据分析中那些挑战性的方面。《Stata环境下的数据管理实务手册》从Stata入手,展示了Stata在管理数据工作中的作用,而非仅仅是其在统计上的优势。
《Stata环境下的数据管理实务手册》各章甚至各章中的大多数小节都是相互独立的,每一部分都关注某一个特定的数据管理任务,并且提供了相应的实例来展示如何在Stata中实现这一特定数据管理任务。这使得本书提供了两种不同的方式供读者使用。读者可挑选其中某一章节进行阅读学习,或以数据管理任务为导向快速获得相应帮助。
《Stata环境下的数据管理实务手册》包含11章,第1章是简介,第25章讨论数据管理的基本问题:读入和保存数据、数据清理、给数据加标签以及创建变量。第68章讨论的是在数据管理项目中较为常见的问题:合并数据、处理子群体中的个案以及改变数据结构。第9章讨论的是有关数据管理编程的问题。其相对第25章的内容而言更为深入和高级。这章描述了应怎样组织构建数据分析以便其能被循环使用,并介绍了很多用来处理重复性任务的简单编程方法。第10章主要为拓展内容,介绍了怎样为本书获取一些在线资源,如何寻找和安装其他STATA用户编写的程序,并推荐了一系列补充的在线资源。最后附录列出STATA操作中的一些基本要素。这些要素并不是关于某一个特定的数据管理任务,较为分散,但却无处不在。
關於作者:
迈克尔 N米歇尔(Michael N. Mitchell),是一位医疗卫生服务领域的高级统计师。12年来,他一直在加州大学洛杉矶分校学术技术服务部门的统计咨询组工作。所著书籍有A Visual Guide to Stata Graphics,Interpreting and Visualizing Regression Models Using Stata,Stata for the Behavioral Sciences等。
唐丽娜,社会学博士,就职于中国人民大学中国调查与数据中心。研究领域为宗教社会学、社会调查方法与技术、社会科学数据管理及数据可视化、数据库建设。
目錄 :
第一章 入门介绍
1.1 本书的使用
1.2 本书的概要
1.3 本书使用的案例
第二章 读取和录入数据
2.1 简 介
2.2 读入Stata数据
2.3 保存Stata数据
2.4 读取逗号或制表符作分隔符的文件
2.5 读取空格作分隔符的文件
2.6 读取固定格式文件
2.7 读取一条观测值包含多行原始数据的固定格式的文件
2.8 读取SAS XPORT文件
2.9 读取数据时的常见错误
2.10 在Stata数据编辑器中直接输入数据
2.11 保存逗号或制表符作分隔符的文件
2.12 保存空格作分隔符的文件
2.13 保存SAS XPORT文件
第三章 数据清理
3.1 简 介
3.2 数据的双录
3.3 单个变量检查
3.4 用分类变量检查分类变量
3.5 用连续变量检查分类变量
3.6 用连续变量检查连续变量
3.7 修正数据中的错误
3.8 识别重复录入
3.9 关于数据清理的总结性思考
第四章 给数据加标签
4.1 简 介
4.2 描述数据
4.3 给变量加标签 4.4 给取值加标签
4.5 标签的作用
4.6 用不同的语言给变量和取值加标签
4.7 给数据添加注释
4.8 格式化变量的显示
4.9 改变数据中的变量顺序
第五章 创建变量
5.1 简 介
5.2 创建和修改变量
5.3 数值表达式和函数
5.4 字符表达式和函数
5.5 重新编码
5.6 给缺失值编码
5.7 虚拟变量
5.8 日期变量
5.9 日期-时间变量
5.10 变量间的计算
5.11 个案间的计算
5.12 更多的使用egen命令的例子
5.13 把字符型变量转换成数值型变量
5.14 把数值型变量转换成字符型变量
5.15 变量重命名和变量排序
第六章 合并数据
6.1 简 介
6.2 添加数据
6.3 添加数据时存在的问题
6.4 一对一匹配合并数据
6.5 一对多匹配合并数据
6.6 合并多个数据
6.7 更新合并
6.8 合并数据时的其他选项
6.9 合并数据时的问题
6.10 连接数据
6.11 交叉合并数据
第七章 处理分组的观测值
7.1 简 介
7.2 为每个分组获取独立的结果
7.3 分组独立计算数值
7.4 组内计算:加下标的观测值
7.5 组内计算:跨观测值计算
7.6 组内计算:求和
7.7 组内计算:更多示例
7.8 比较by命令和tsset命令
第八章 改变数据形状
8.1 简 介
8.2 宽数据和长数据
8.3 长数据转换成宽数据
8.4 长数据转宽数据时的问题
8.5 宽数据转换成长数据
8.6 宽数据转长数据时的问题
8.7 多层次数据
8.8 延展数据
第九章 数据管理编程
9.1 简 介
9.2 对数据管理长期目标的建议
9.3 执行do文件和制作日志文件
9.4 数据检验的自动化
9.5 合并do文件
9.6 介绍Stata中的宏
9.7 使用Stata中的宏
9.8 通过变量循环实现命令的重复执行
9.9 通过数字循环实现命令的重复执行
9.10 任何数据管理都能用循环实现命令的重复执行
9.11 获取Stata命令保存的结果
9.12 把estimation命令的结果保存为数据
9.13 编写Stata程序
第十章 附加资源
10.1 本书的在线资源
10.2 搜索并安装其他程序
內容試閱 :
有个滤油机公司曾经做过这么一则广告:一个机修工一边修理一台发动机一边说, 如果能够定期给发动机换油,就可以不用修理它。那个机修工说:你可以现在花钱,也可以等将来再花钱。这里的暗示是你要么现在花3美元在一个滤油器上,要么将来花3 000美元去修理发动机。我觉得这是一个很好的类比,双录数据的努力(成本)相当于广告中滤油器的费用。开始的数据双录代价很小(在数据录入过程中拿出一定的时间来清理数据),但如果一开始只是单录数据,后期就需要付出更大的代价来清理数据(检查所有变量中可能出现的错误和不一致的地方)。如果你自己正在录入一份问卷或拿到其他的已经搜集好的原始资料,我强烈建议进行数据双录。本节将介绍如何用 Stata实现数据的双录。
数据双录,顾名思义,就是把同一数据录入两次,且保存成两个不同的数据文件。然后把两个数据文件做比对。如果出现不一致的地方,就意味着数据录入时出错了,然后可以通过检查原始资料(如原始问卷)找到正确的取值来纠正发现的错误。如果比对以后没有出现不一致的地方,也不一定证明录入的数据是正确的;因为也有可能两次数据录入的时候出错的方式是一样的。在大多数情况中,很难想象在两次录入出现一模一样的错误,这种事情不会经常发生。比如,假设调查用的是纸笔问卷,答案都是手填的,且两次是同一个人录入。第一次录入的时候把数字4误认为数字9,如果是同一个录入员,有可能把以后遇到的所有4都误认为9。这一点提示我们:独立双录数据是必要的,这样能够减少录入数据时重复犯错的可能性。