社会统计方法与技术

出版时间:2005-6  出版社:社科文献出版社  作者:〔美〕戴维﹒K﹒希尔德布兰德  页数:595  
Tag标签:无  

内容概要

  《社会科学定量分析丛书》是美国萨基出版社专为社会科学界从事定量分析的研究人员编撰的一套专著,其中每一部的作者都是相关领域的专家。这部丛书对世界社会科学界影响颇大,已被翻译成多国文字。本书从中选择了9部,定名为《社会统计方法与技术》,由上下篇组成,已飨读者。  社会调查数据以定序和定量者居多。因此,《社会统计方法与技术》着重介绍了定序和定量数据的处理和统计方法。学习并掌握本书的全部内容,不仅使读者能正确熟练地应用很多统计方法,提高我国的社会定量分析水平,而且为进一步学习其他的社会统计技术铺平了道路。

书籍目录

上篇一 定类数据分析1 介绍1.1 预备知识1.2 定类变量的分析2 卡方检验2.1 卡方检验的解释3 相关的量度3.1 介绍3.2  2×2表格的相关量度3.3  I×J表格的相关量度法3.4 相关量度的比较4 多元数据分析的介绍4.1 定类变量的因果分析5 结论注 释参考文献二 定序数据分析简 介1 定序量度1.1 定序变量分析的三个问题2 单个观测值的二元预测2.1 总体和样本2.2 已知自变量状态的预测2.3 自变量状态未知的预测2.4 V8量度2.5 象限量度:专门应用于定序变量2.6 科恩Kappa(Cohens Kappa):另一种量度2.7 定序变量预测的灵敏度分析:可靠性(信度)评估3 成对观测值的二元预测3.1 计算合并的定序数据3.2 对合并定序表格的预测3.3 合并表格的概率形式3.4 合并定序形式的灵敏度分析3.5 排除所有同分的预测域3.6 排除一个变量的同分的预测域3.7 从预测域去掉一个单元格而非一行或一列3.8 不同预测域的比较3.9 一致和不一致:回顾3.10 再次标准化:肯德尔τc(Kendalls τc)3.1l 肯德尔τ2b(Kendalls τ2b):合并表格的混合预测方法以及与定量变量预测的类似之处4 定量,定类和定序变量的联合预测4.1 定量变量4.2 定类变量和扩展形式5 多元分析5.1 建立三元合并表5.2 模仿二元预测的三元预测5.3 多元5.4 部分6 计算方法和统计推论6.1 计算机软件6.2 统计推论6.3 小结注 释参考文献三 方差分析1 导论2 一维方差分析:所有类别2.1 两组比较2.2 两组以上3 二维方差分析,所有类别3.1 不相关的解释变量3.2 相关的解释变量3.3 特殊主题4 方差分析,定类样本4.1 一维分析4.2 两个解释变量5 其他模型5.1 混合模型(Mixed Models)5.2 三个解释变量5.3 拉丁方设计5.4 嵌套设计(Nested Designs)5.5 方差分析与回归分析6 结论6.1 回顾6.2 其他论题参考文献四 关联的量度1 导论2 离散数据的抽样分布2.1 二项分布和多项分布2.2 列联表3 定类数据关联的量度3.1 以卡方统计值为基础的量度3.1.1 皮尔逊(PEARSON)均方列联系数3.1.2 皮尔逊(PEARSON)列联系数与斯科达(SAKODA)的修正3.1.3 楚普洛夫(TSCHUPROW)列联系数3.1.4 克莱姆(CRAMER)列联系数3.2 消减预测误差比例的量度系数3.2.1 古德曼一克鲁斯凯(GOODMAN—KRUSKAL)λ系数3.2.2 古德曼一克鲁斯凯(GOODMAN—KRUSKAL)τ系数3.3 一致性的量度3.3.1 科恩(COHEN)κ系数与加权κ系数3.3.2 科尔曼一莱特(COLEMAN-LIGHT)条件一致性量度系数3.4 针对2 × 2列联表的特定量度系数3.4.1 以交叉乘积比为基础的量度系数3.4.2 以相关系数为基础的量度系数4 量度连续(定距)数据的相关4.1 皮尔逊(PEARSON)积矩相关系数4.2 肯德尔(KENDALL)T系数4.3 斯皮尔曼(SPEARMAN)秩相关系数295 量度定序数据的关联5.1 初步5.2 肯德尔(KENDALL)τb系数5.3 与肯德尔(KENDALL)τb系数有关的量度系数5.3.1 肯德尔一斯图尔特(KENDALL-STUART)τC系数5.3.2 古德曼一克鲁斯凯(GOODMAN—KRUSKAL)γ系数5.3.3 萨默斯(SOMERS)d系数5.3.4 威尔逊(WILSON)e系数5.3.5 总结5.4 其他量度系数6 选择适当的量度系数7 相关与因果联系注释参考文献五 多重回归的应用序导言1 多元回归模型:复习2 设定错误2.1 设定错误导致的后果2.2 设定错误举例:生活满意度2.3 发现和处理设定错误3 量度误差3.1 量度误差的后果3.2 量度误差举例:生活满意度3.3 发现量度误差3.4 处理量度误差4 多元共线性4.1 多元共线性的后果4.2 发现高度多元共线性4.3 多元共线性举例:生活满意度4.4 处理多元共线性5 非线性和不可加性5.1 发现非线性和不可加性5.2 处理非线性5.3 处理不可加性5.4 非线性和不可加性模型的注意事项6 异方差和自相关6.1 出现异方差和自相关的原因6.2 异方差和自相关导致的后果6.3 发现异方差6.4 异方差举例:收入和租房6.5 处理异方差和自相关7 结束语注 释参考文献下篇一 线性概率模型、对数概率模型和正态概率模型丛书编辑引言1 线性概率模型……2 非线性概率模型的设定3 二项应变量正态概率模型和对数概率模型的估计4 最小卡方估计和多项模型5 总结和扩展注 释参考文献二 回归的解释与应用丛书编辑导言l 导论2 基础回归理论与社会科学实践3 回归估计的统计性质4 回归系数的抽样分布5 选择一种设定6 变量的重要性7 结论附录对回归一致性结果的证明注 释参考文献三 时间序列分析:回归技术1 导论2 时间序列回归分析:非滞后的情况3 其他备择的时变过程4 时间序列回归分析:滞后的情况5 预测6 总结附录防卫支出数据(单位:10亿美元)注 释参考文献四 事件史分析法——用于纵向数据的回归分析法丛书编辑序l 导论2 离散时间事件史数据分析法3 连续时间数据的参数分析法4 比例风险模型和部分似然估计5 多类事件史的数据估计分析法6 重复事件分析法7 状态变化情况下的事件史分析法8 结论附录A 最大似然和部分似然附录B  GLIM、SAS和BMDP程序实例清单附录C 计算机程序注 释参考文献

章节摘录

  定类变量  由一组类别组成的,表示一个潜在特性的不同表现的定类尺度。理想状态下,就某个属性而言,分配到某个类别的个体都具有某种同一性。把民主党派和共和党派相混合在“独立党派人士”分类中,将向我们传达关于他们政治行为的错误信息。另外,分类也必须是互斥的(每个个案只能属于一个类别)和完整的。  定类变量的分类可以由调查者根据其需要按任何顺序排列。正如我们看到的,对表1各列的重新排序不会丢失任何信息。相反,定序变量的分类具有某种隐含的次序:他们量度的不仅有性质上的而且有分量上的差异。比如社会地位变量的类别为(低,中,高),那么它就不能再按别的顺序来组织,如(中,低,高),否则就有可能丢失某些信息。定类变量和定序变量都属于类别变量,它们之间的差异在于定序变量的尺度包含了组间的次序关系,而定类变量则不具有这种性质。  定类变量量表可以量度真实的离散现象,比如种族或性别,但是在大多数情况它们大概表现了某种量度误差,因为其代表的潜特质或多或少表示某种定量的特质。例如,态度通常不是简单地进行正面地或反面的回答,人们总是保持他们不同程度的赞同倾向。因此,态度可以被认为是一个连续的集合,从坚定的同意到不确定,再到坚定的反对。在态度这个问题上,不能因为量度的难度而把这个潜含的丰富信息模糊化。  特别要注意,类别的数量和性质对于做出正确推理是至关重要的。在社会学和政治学的研究中,一个最大的错误就是将回答混合成很少几个类别。或许是为了方便起见,或许是因为人人如此,对数据进行二分(即把人们归类为成非此即彼)的做法从来都是错误的,不管使用了何种统计技术,粗劣的量度数据肯定会产生错误严重的结论。  因变量与自变量  大多数社会科学家认为一个人的党派认同,通常在其青年期逐渐形成,部分地决定他或她的政治偏好。在这种意义上讲,1980年的选举将由选民的政党派别决定。一个变量,依赖于另一个变量,或者由另一个变量所引起,或者暂时跟随另一个变量的变化而变化,我们称其为“因变量”。顺其自然的,这个原因变量被称为“自变量”。自变量在某一水平上的变化将引起因变量相应的变化,但是反过来,因变量的改变不会对自变量产生影响。  本书描述的一些方法只有当研究者对因变量有清楚的定义时,才可以适用。虽然其他的方法没有对因果依赖关系做出假定,但也应该仔细思考变量间存在的因果关系。把一个变量人为指定为因变量或是自变量,在某些场合是适当的,没有任何公式不允许这么做——但是由此产生的结果却很有可能是错误的。  当然,这些决定只是表现了我们对数据的假设,因为不太可能证明一个变量是另一个变量的原因。  类别的数目  既然定类变量通常被编组成二维或多维的表格(分别如表1和表22),在这种方式下,每个单元格包含了尽可能多的个案。其后果是:包含许多个零的交叉类别表看起来不那么可靠和有足够的表达力,这是很容易理解的。合并某些类别以提高单元格的频次尽管能够解决这个问题,但是毫无疑问也产生了其他一些问题。这有两个原因:  第一,该定类变量的变异,部分地依赖于该变量的类别数目;在其他变量保持不变的情况下,该变量的类别越多,变异越大。这里,“变异”指个案间的量度差异。如果全部样本都属于一个类别,那么就不存在离差或变异;另一方面,如果它们或多或少分布在几个类别中,那么该变量就存在较大的变异。把人们按党派分成民主党派,共和党派,以及独立党派,比起更为精确的“坚定的民主党派”,是一种较为简单的类别方式,但是存在较少的变异。在回归分析中,变异的数量,特别是自变量的变异数量,部分地影响相关量度值。  第二,合并或减少类别的数目会严重影响观察到的相互关系。例如,假定一个研究者有三个变量,各分成五个类别。为了简化结果的表达,他决定把每个变量都合并成两个类别。然而,在使用相同的变量,样本和同样的统计方法的情况下,从二分数据(dichotomized data)得来的统计分析的结果,将不同于从没有经过合并的变量得到的分析结果。具体研究中,往往会在2×2×2的交叉分类表中发现相关关系,而在5×5×5的交叉分类表中并不存在这种关系。  该教训也相当简单:尽可能的保持原有的类别,在没有充分的理由时,在没有经过证明重新分类不会影响实质性结论时,不要将变量变成二分或者三分变量。  ……

图书封面

图书标签Tags

评论、评分、阅读与下载


    社会统计方法与技术 PDF格式下载


用户评论 (总计0条)

 
 

 

250万本中文图书简介、评论、评分,PDF格式免费下载。 第一图书网 手机版

京ICP备13047387号-7