现在位置:医学图书 > 100md首页 > 医学 > 医药卫生教材 图书编号:22832363
 
《中医统计学(第二版)》
作者:申杰、王泓午、石晶、李国春、黄品贤
出版社:科学出版社 出版日期:2012/7/1
ISBN:9787030346421 定价: 26.00元
        编辑推荐

    申杰主编的《中医统计学(第2版)》内容包括绪论、中医统计资料的搜集与整理、统计描述、统计表和统计图、正态分布和二项分布、参数估计、假设检验、t检验与u检验、方差分析、χ2检验、秩和检验、直线相关与回归、研究设计和样本含量估计,常用的研究设计类型、多元统计分析及常用统计分析软件简介、统计学报告准则及统计学项目自查清单等共16章,并且在正文前给出了希腊字母表和常用统计符号。

    内容推荐

    《中医统计学(第二版)》是由科学出版社牵头,组织全国13所高等中医药院校教学一线富有经验的统计学教师,在《中医统计学(第一版)》的基础上修订再版的全国高等中医院校规划教材。鉴于中医统计学(第二版)的读者对象涉及面比较广,包括中医药院校师生、临床医护人员、中医科研工作者和中医管理人员等,因此,中医统计学(第二版)的指导思想是:在第一版的基础上,在不失严谨的前提下,努力把同行们以及我们在中医统计实践中应用统计方法的经验和体会融入其中,突出实际案例的应用和统计思想的渗透,结合统计软件介绍常用的统计分析实用方法。

    全书内容包括绪论、中医统计资料的搜集与整理、统计描述、统计表和统计图、正态分布和二项分布、参数估计、假设检验、t检验与u检验、方差分析、χ2检验、秩和检验、直线相关与回归、研究设计和样本含量估计,常用的研究设计类型、多元统计分析及常用统计分析软件简介、统计学报告准则及统计学项目自查清单等共16章,并且在正文前给出了希腊字母表和常用统计符号。特别指出的是,中医统计学(第二版)中有大量来自实际问题的数据实例,通过对这些实例的分析,读者可以学到如何将一个实际问题转化为恰当的统计问题,进而选择恰当的方法来进行分析,为中医研究提供方法学的支持。

    作者简介

    申杰、王泓午、石晶、李国春、黄品贤

    目录

    第二版前言

    希腊字母表

    常用统计符号

    第一章 绪论

    第一节 什么是统计学

    一、统计的含义和统计发展简史

    二、统计学的分类及主要内容

    三、统计学的基本思想和统计观念的构成要素

    四、统计工作步骤和基本研究方法

    五、统计学的基本概念

    第二节 为什么要学习中医统计学

    一、中医统计学的定义及研究要素

    二、学习中医统计学的目标与方法

    三、学习中医统计学的意义

    第二章 中医统计资料的搜集与整理

    第一节 中医统计资料的搜集

    一、中医统计资料的来源

    二、搜集资料的基本要求

    三、搜集资料的注意事项

    第二节 中医统计资料的整理

    一、整理方案

    二、资料审核

    三、设计分组

    第三节 数据管理

    一、数据管理的概念

    二、数据管理的内容

    三、数据管理软件的选择

    四、EpiData数据管理软件的应用

    第三章 统计描述

    第一节 频数分布

    一、频数分布表

    二、频数分布的特征与类型

    第二节 数值变量的统计描述

    一、集中趋势的描述

    二、离散趋势的描述

    第三节 分类变量的统计描述

    一、常用相对数指标

    二、率的标准化

    【附】 例题和SPSS软件应用

    一、SPSS实现描述性统计功能的过程

    二、统计描述的SPSS步骤与结果

    第四章 统计表和统计图

    第一节 统计表

    一、统计表的定义与作用

    二、统计表的格式与种类

    三、统计表的结构及制表原则

    第二节 统计图

    一、绘制统计图的基本要求

    二、常用统计图的绘制方法

    【附】 例题和SPSS软件应用

    一、SPSS绘制统计图的过程

    二、SPSS绘制统计图的步骤

    第五章 正态分布和二项分布

    第一节 正态分布

    一、正态分布的概念

    二、正态分布的特征

    三、正态曲线下的面积分布规律

    四、正态分布的主要内涵

    五、正态分布的应用

    第二节 二项分布

    一、二项分布的概念

    二、二项分布的特征

    三、二项分布的应用条件

    第三节 Poisson分布

    一、Poisson分布的概念

    二、Poisson的性质与特征

    三、Poisson分布的应用

    【附】 SPSS计算随机变量累积概率和概率密度的方法

    一、SPSS提供的概率计算函数

    二、随机变量累积概率和概率密度的计算过程

    第六章 参数估计

    第一节 抽样分布与抽样误差

    一、样本均数的抽样分布与抽样误差

    二、t分布及其应用

    三、样本率的抽样分布与抽样误差

    第二节 总体均数的估计

    一、总体均数的点估计

    二、总体均数的区间估计

    第三节 总体率的估计

    一、总体率的点估计

    二、总体率的区间估计

    【附】 例题和SPSS软件应用

    第七章 假设检验

    第一节 假设检验的基本思想与步骤

    一、假设检验的基本思想与论证方法

    二、假设检验的步骤

    第二节 假设检验的两类错误和注意事项

    一、Ⅰ型错误和Ⅱ型错误

    二、应用假设检验的注意事项

    第八章 t检验与u检验

    第一节 单样本t检验

    一、概述

    二、单样本t检验的分析思路

    三、单样本t检验的分析步骤

    四、进行单样本t检验时的注意事项

    第二节 配对设计资料的t检验

    一、概述

    二、配对设计资料t检验的分析思路

    三、配对设计资料t检验的分析步骤

    四、进行配对设计资料的t检验时的注意事项

    第三节 独立样本的方差齐性检验与t检验

    一、概述

    二、独立样本的方差齐性检验

    三、总体方差齐时独立样本t检验的分析思路与步骤

    四、总体方差不齐时独立样本t'检验的分析思路与步骤

    五、进行独立样本方差齐性检验和t检验时的注意事项

    第四节 正态性检验与数据转换

    一、正态性检验

    二、数据变换

    第五节 u检验

    一、单样本u检验

    二、配对设计数值变量u检验

    三、独立样本u检验

    【附】 例题和SPSS软件应用

    一、SPSS实现t检验的过程

    二、t检验的SPSS操作步骤与分析结果

    第九章 方差分析

    第一节 方差分析概述

    一、方差分析的相关概念

    二、对多样本均数重复进行t检验或u检验的风险性

    三、方差分析基本思想

    四、多个样本方差的齐性检验

    第二节 完全随机设计资料的方差分析

    一、完全随机设计资料方差分析的概念

    二、完全随机设计资料方差分析的分析思路

    三、完全随机设计资料方差分析的分析步骤

    四、进行完全随机设计资料方差分析时的注意事项

    第三节 随机区组设计资料的方差分析

    一、随机区组设计资料的方差分析的概念

    二、随机区组设计资料的方差分析的分析思路

    三、随机区组设计资料的方差分析的分析步骤

    四、进行随机区组设计资料的方差分析时常见的问题

    第四节 多个样本均数的多重比较

    一、Student-Newman-Keuls q检验(SNK-q检验)

    二、Dunnett-t检验

    三、LSD-t检验

    四、进行多个样本均数的多重比较时常见的问题

    第五节 重复测量资料的方差分析

    一、重复测量资料的相关概念

    二、重复测量资料方差分析的基本思想

    三、重复测量资料方差分析的分析思路

    四、重复测量资料方差分析的基本步骤

    五、重复测量资料方差分析的注意事项及常见的问题

    【附】 例题和SPSS软件应用

    一、SPSS实现方差分析的过程

    二、方差分析的SPSS操作步骤与分析结果

    第十章 χ2检验

    第一节 χ2检验概述

    一、χ2分布及其特点

    二、χ2检验的基本公式

    三、χ2检验的基本思想

    四、χ2检验的用途及应用条件

    第二节 2×2表资料χ2检验

    一、成组设计2×2表资料χ2检验

    二、配对设计2×2表资料χ2检验

    三、进行2×2表资料χ2检验时常见的错误或问题

    第三节 R×C表资料χ2检验

    一、R×C表基本类型

    二、多个样本率比较的R×2表χ2检验

    三、2个或多个构成比比较的R×C表χ2检验

    四、双向无序R×C表资料χ2检验

    五、R×C表χ2检验的注意事项

    六、进行R×C表资料的χ2检验时常见的错误或问题

    第四节 多个样本率或构成比多重比较

    一、χ2分割法

    二、基于χ2分割原理的多重比较

    三、进行多个样本率或构成比多重比较时常见的错误或问题

    【附】 例题和SPSS软件应用

    一、SPSS实现χ2检验的过程

    二、χ2检验的SPSS操作步骤与分析结果

    第十一章 秩和检验

    第一节 秩和检验概述

    一、秩和检验的概念与基本思想

    二、秩和检验的应用范围及优缺点

    三、秩和检验方法的选择及检验效能

    第二节 配对设计资料的符号秩和检验

    一、基本思想

    二、检验步骤

    三、进行配对设计资料的符号秩和检验时常见的错误或问题

    第三节 完全随机设计两样本比较的秩和检验

    一、基本思想

    二、检验步骤

    三、进行完全随机设计两样本秩和检验时应注意的问题

    第四节 完全随机设计多个样本比较的秩和检验

    一、多组数值变量资料的秩和检验

    二、多组单向有序分类变量资料的秩和检验

    三、进行完全随机设计多个样本的秩和检验时常见错误或问题

    第五节 随机区组设计资料的秩和检验

    一、基本思想

    二、检验步骤

    三、进行随机区组设计资料的秩和检验时应注意的问题

    第六节 多个样本两两比较的秩和检验

    一、完全随机设计多个样本两两比较

    二、随机区组设计资料的两两比较

    三、进行多个样本两两比较的秩和检验时应注意的或问题

    【附】 例题和SPSS软件应用

    一、SPSS实现秩和检验的过程

    二、秩和检验的SPSS操作步骤与分析结果

    第十二章 直线相关与回归

    第一节 直线相关

    一、相关的概念与意义

    二、相关系数的计算

    三、进行相关系数的假设检验时常见的错误或问题

    第二节 直线回归

    一、直线回归分析的概念与意义

    二、直线回归分析的步骤

    三、直线相关与回归的区别与联系

    四、进行直线回归分析时常见的错误或问题

    第三节 秩相关

    一、Spearman等级相关

    二、相同秩次较多时rs的校正

    三、进行等级相关分析时常见的错误或问题

    【附】 例题和SPSS软件应用

    一、SPSS实现直线相关分析的过程

    二、SPSS实现回归分析的过程

    三、直线相关分析的SPSS操作步骤与分析结果

    四、秩相关分析的SPSS操作步骤与分析结果

    五、直线回归分析的SPSS操作步骤与分析结果

    第十三章 研究设计和样本含量估计

    第一节 实验设计的基本要素

    一、处理因素

    二、受试对象

    三、实验效应

    第二节 实验设计的基本原则

    一、随机

    二、对照

    三、均衡

    四、重复

    五、盲法

    第三节 样本含量估计的常用方法

    一、样本含量估计的主要参数

    二、单样本比较的样本含量

    三、独立样本比较的样本含量

    四、参数估计的样本含量

    【附】 SPSS实现随机分组的过程

    一、用SPSS产生随机数字并进行完全随机分组

    二、用SPSS产生随机数字并进行配对(或配伍)设计分组

    第十四章 常用的研究设计类型

    第一节 完全随机设计

    一、完全随机设计

    二、配对设计

    三、随机区组设计

    第二节 析因设计和交叉设计

    一、析因设计

    三、交叉设计

    第三节 拉丁方设计和正交设计

    一、拉丁方设计

    二、正交设计

    第十五章 多元统计及常用统计分析软件简介

    第一节 多元统计分析简介

    一、多元方差分析

    二、多元线性回归分析

    三、典型相关分析

    四、判别分析

    五、聚类分析

    六、主成分分析

    七、生存分析

    八、因子分析

    九、通径分析

    十、结构方程模型

    第二节 常用统计分析软件简介

    一、SAS统计分析软件

    二、SPSS统计分析软件

    三、BMDP统计分析软件

    四、STATA统计分析软件

    五、EPIINFO软件

    第十六章 统计学报告准则及统计学项目自查清单

    第一节 统计学报告准则简介

    一、国际医学期刊编辑委员会的统计学报告准则的基本内容

    二、统计学报告准则确定的基本原则

    第二节 研究论文统计学项目自查清单

    主要参考文献

    附录 统计用表

    附表1 标准正态分布曲线下左侧面积ψ(u)值

    附表2 t分布界值表

    附表3 百分率的95%可信区间

    附表4 F界值表(两个独立样本方差齐性检验用,双侧界值)

    附表5 F界值表(方差分析用)

    附表6 χ2分布界值表

    附表7 t界值表(配对比较的符号秩和检验用)

    附表8 t界值表(两样本比较的秩和检验用)

    附表9 H界值表(三样本比较的秩和检验用)

    附表10 M界值表(随机区组比较的秩和检验用)

    附表11 q界值表

    附表12 r界值表

    附表13 随机数字表

    附表14 随机排列表(n=20)

    在线试读部分章节

    第一章绪论导 学

    第一章 绪论

    1. 掌握中医统计学的定义、主要内容和工作步骤;统计资料的类型。

    2. 熟悉统计学的基本概念、基本思想和统计观念的构成要素;统计的含义、分类;统计研究的基本方法。

    3. 了解统计发展简史;中医统计学的学习目标、方法和意义。

    统计学(statistics)是处理数据变异性(variability)和复杂性(complicacy)的科学和艺术。作为一门科学,统计学必须如实反映现状,无论从实施统计方法或进行科学研究的角度,目的都是在同样的前提下得到同样的真实、可靠的数据;作为一门艺术,统计学必须在概率论和数理统计理论的指导下,正确运用统计学思维,针对数据特点,选用适宜的统计分析方法,让研究变得井然有序。在数据日益成为一种重要信息的信息社会里,统计学不仅是专业知识的讲授与运用,更重要的是学会如何正确地进行统计思维,形成用数据说话的科学态度。因此,在对中医药学进行努力挖掘、加以提高的同时,应该注重统计分析方法的学习与运用。

    第一节 什么是统计学

    一、统计的含义和统计发展简史

    1. 统计的含义

    (1) 统计工作(statistical work):即统计实践,是根据统计方法从事统计设计、搜集、整理、分析研究和提供各种统计资料、统计咨询意见活动的总称,其成果是统计资料。

    (2) 统计资料(statistical data):亦称统计数据(statistical data),是通过统计工作所获得的反映客观现象的各项数据资料以及与之相关的其他资料的总称,具体表现为各种统计图、统计表、册及统计分析报告等。

    (3) 统计学(statistics):即统计理论,是研究如何搜集、整理、分析和预测的方法论科学,其目的是探索事物的内在数量规律性,以达到对客观事物的科学认识。

    2. 统计发展简史 人类最初利用手指、石子、贝壳、小木棍以及绳索等工具进行的计数活动就蕴藏着统计萌芽,但是,人类由统计实践上升到统计学,却只有300 多年的历史。按统计方法及特征的历史演变顺序,统计学的发展史可分为古典统计学的萌芽时期(17 世纪70 年代至19 世纪初期)、近代统计学的形成时期(19 世纪初至20世纪初)和现代统计学的发展时期(20 世纪初至今)三个阶段。正是由于古典统计学时期的政治算术学派和国势派、以及近代统计学时期的数理统计学派和社会统计学派之间的相互争论,相互渗透,使数理统计学与社会统计学最后融合成为统一的现代统计学。统计学的发展有四个明显趋势:①随着数学的发展,统计学依赖和吸收的数学方法越来越多;②统计方法与计算机技术相结合,已渗透到所有科学的学科部门,使以统计学为基础的边缘学科不断形成;③统计与实质性学科、统计软件、现代信息相结合,所发挥的功效日益增强;④ 统计学的作用与功能已从描述事物现状、反映事物规律,向抽样推断、预测未来变化方向发展,已成为具有方法论性质的综合性学科。

    二、统计学的分类及主要内容

    1. 统计学的分类

    (1) 数理统计学(mathematical statistics):是从数学的角度研究统计学,为各种应用统计学提供理论支持。

    如怎样有效地收集、整理和分析带有随机性的数据,以对所考察的问题作出推断或预测,直至为采取一定的决策和行动提供依据和建议。数理统计学的中心内容是统计推断问题,实质是以归纳方法研究随机变量的一般规 律。

    (2) 应用统计学(applied statistics):统计方法在自然科和社会科学领域的应用而产生的分支学科,其特点是以本学科范畴的现象的数量形式为基础,对它们的规律性进行数量上的分析研究。如生物统计学(biostatistics);医学统计学(medicinal statistics)、卫生统计学(hygeian statistics)和中医统计学(statistics for chinesemedicine)等。

    2. 统计学的主要内容

    (1) 统计设计(statistical design):如何合理地安排实验内容,对实验结果如何进行有效地分析。目的在于保证结果的经济性、可重复性和科学性。

    (2) 统计描述(statistical description):用统计指标、统计图、统计表等方法描述样本资料的数据特征及其分布规律,是统计推断的基础与前提。

    (3) 统计推断(statistical inference):用样本信息推论总体特征的归纳过程,是描述统计的发展,分为两个领域:①参数估计(estimation of parameter):以样本指标数值――统计量(statistic)推断总体指标数值――参数(parameter)范围。统计学关注总体参数的大小,其依据却是统计量。②假设检验(hypothesis testing):利用样本信息,根据一定的概率水准,推断指标间的差异有无统计学意义的分析方法,其本质是一种决策的概率思想与反证法。

    三、统计学的基本思想和统计观念的构成要素

    1. 统计学的基本思想

    主要是变异的思想、概率的思想和随机抽样思想。众所周知,同质(homogeneity)是相对的,变异(variation)是绝对的、客观存在的,因此,反映事物特征的指标常带有变异性。由于变异性的存在,实验或观测结果必然带有不确定性(uncertainty)――概率性。不确定性的主要来源为:①生物学因素;②环境因素;③方法学因素;④个人或患者的信息不完整;⑤工具不完备;⑥依从性差;⑦医学知识不完善;⑧偶然因素及未知因素。

    为了获得带有规律性的结果,常常需要进行大数量的实验或观测,然而,研究者的时间、精力、人力和物力是有限的,大多数研究者只能进行抽样研究(sampling study),以期通过样本所提供的信息去推论总体的规律性,由此产生了随机抽样思想,形成了医学科学研究的基本方法――抽样研究方法(图1-1)。但是,由于医学研究对象的变异性和复杂性,由样本推断总体时不可能准确地预测各种结局,从而形成了医学现象所固有的不确定性,并且产生了概率的思想。结论的概率性是统计学最重要的特点,故统计结论中没有“证明”,只有在一定概率水平上的推论。

    2. 统计观念的基本构成要素

    统计观念(statistics conception)是在亲身经历的过程中培养出来的感觉,是由一组数据所引发的想法,所推测到的可能结果,自觉的想到运用统计方法解决有关的问题等等。主要有三层含义:①数据的收集、记录和整理能力;②对数据的分析、处理并由此作出解释、推断与决策的能力;③对数据和统计信息有良好的判断能力。形成统计观念的基本构成要素如下。

    (1) 统计思维:统计思维类似于数学上的数感、符号感,以及人们对于音乐的乐感、节奏感等,是一种对给定数据及与数据有关的量、表、图等的潜意识的反应,即面对与数据信息有关的问题时,能有意识地从统计的角度进行思考和决策。经常对接触到的各类研究数据、图(表)等进行抽样方法、分组方法、样本量估计方法、统计描述方法、假设检验方法和参数估计方法的统计层面的思考,可逐渐形成良好的统计思维。

    (2) 统计方法:统计方法可洞悉隐藏在杂乱无章的数据信息背后的规律,为研究决策提供依据和指出方向。

    形成良好的统计观念的关键在于统计方法的获得和掌握,只有懂得了统计方法(原理),才能产生正确的统计思维和有效地处理与统计相关的问题。但是,统计方法的掌握离不开实践。

    (3) 批判意识与辨别能力:统计观念的重要体现就是能对数据的来源、处理数据的方法及相关信息与结论进行合理的质疑与批判。批判意识是科学精神的重要标志,而衡量统计观念强弱的重要指标为是否具有反思和批判意识。例如,某研究声称经过统计,某药对某病症的有效率达到了100%,而根本不提统计数据是怎么得来的,显然是对统计数据的误用和滥用。因此,只有具备相应的批判意识和辨别能力,统计水平才可能真正达到更高的层次。

    3. 统计观念基本构成要素间的相互关系

    (1) 统计思维是掌握统计方法的前提和基础。灵敏的统计思维可更快和更准确地掌握各种统计方法,并真正领悟到统计方法的理论及现实含义。反过来,统计方法则是统计思维深入发展的支撑和保障,没有系统及扎实的方法奠基,统计思维很难获得更大的发展。因而,统计思维与方法是既有区别又有联系的整体。

    (2) 批判意识和辨别能力则是统计思维和统计方法的具体体现。是否具有一定的统计思维和较强的统计方法,可从与统计有关的数据、信息等的反应、态度判断出来。没有个人思考,盲从研究论文的统计结论是不会具备良好的统计思维和方法的。因此,统计思维和统计方法是构成统计观念的内隐要素,批判意识和辨别能力则是构成统计观念的外显要素。

    四、统计工作步骤和基本研究方法

    1. 统计工作的基本步骤

    (1) 研究设计(research design):即制定调查研究和实(试)验研究的计划,以尽可能少的人力、财力及物力达到预期研究目的。因此,统计学对医学研究最重要的贡献在于研究设计而不是数据分析。

    (2) 搜集资料(collection of data):按研究设计所拟定的方法、过程与要求,通过对研究对象的观察及实验,测量并记录其结果,及时取得准确、完整、可靠的原始数据的过程。

    (3) 整理资料(sorting data):根据研究任务与研究设计的要求,对搜集到的各种原始数据进行清理、纠错、转化、建库与存储,以便于进一步对数据进行统计分析。

    (4) 分析资料(analysis of data):依照研究设计的要求计算相关指标,以反映研究对象的内在特征和规律,并结合专业知识,对分析结果做出可靠的推论。

    2. 统计研究过程

    如图1-2 所示。

    3. 统计研究方法

    统计学的基本研究方法是由观测到的个体特征归纳关于总体某种信息的归纳推断法。

    人们在统计实践经验的基础上不断地概括,逐步形成了统计方法体系及工作步骤(图1-3)。

    (1) 大量观察法(method of mass observation):从总体上考察研究客观现象和过程的规律,对所研究的事物的全部或足够数量进行观察与综合分析的方法,其理论根据是“当试验次数足够多时,事件发生的频率无穷接近于该事件发生的概率”的大数定律(law of large numbers)。

    (2) 统计分组法(statistical grouping method):根据统计研究目的和研究对象的特点,将总体各观察单位按照某一标志划分为不同性质的类型或组别的研究方法。通过统计分组形成统计指标,从而反映总体内部的数量差异和数量关系,以及总体之间的联系和区别,是研究总体内部差异的方法。

    (3) 综合指标法(aggregative indicator method):运用各种综合指标对现象的数量关系进行对比分析,以得到事物数量特征的本质或规律性的认识方法。

    (4) 统计模型法(statistical models method):是根据一定的专业理论和假设条件,用数学方程模拟现实客观现象之间相互关系的一种研究方法。利用这种方法可以对客观现象发展过程中存在的数量关系进行比较完整或近似的描述,从而简化了客观存在的其他复杂的关系,以便利用模型对所研究的现象变化进行定量的估计和趋势预测。例如,回归分析法模拟变量之间的数量关系,所建立的回归方程就是统计数学模型。

    (5) 统计推断法(statistical Inference method):指在一定可信程度下,根据样本资料的特征,对总体的特征作出估计和预测。主要方法是将数据中的数据模型化,计算它的概率并且对其总体做出推论。这个推论可能以对/错问题的答案所呈现(假设检验),对于数字特征量(用以浓缩、简化实验数据中的信息,使问题变得更加清晰、简单,易于理解和处理的有代表性的特征量,如集中性、离散性指标)的估计,对于未来观察的预测,关联性的预测(相关性),或是通过变异数分析(analysis of variance,ANOVA)以及数据挖掘(data mining)等模型化技术将关系模型化(回归)。

    五、统计学的基本概念

    1. 变量和变量值

    (1) 变量(variable):指没有固定的值,可以改变的数。例如观测对象的某个特征(观察指标),通常用数字、字母或其他符号代表观察单位(对象)的某一项特征或属性(如人的年龄、体重、身高等),以便存储和分析。

    (2) 变量值(value of variable):指变量的观察结果或测定值。

    (3) 变量类型:变量值可以是定量的,也可是定性的,由此分为下述两类。

    1) 数值变量(numerical variable):又称为连续变量(continuous variable)、定量变量,是对每个观察单位用计量方法测得某项标志数值大小所获得的指标。其特点为其变量值是定量的,表现为数值的大小,通常具有一定的度量衡单位,数值之间具有连续性,可作无限分割,如身高(cm)体重(kg)、体温(℃)和血压(mmHg) 等。

    2) 分类变量(categorical variable):又称为离散变量(discrete variable)、定性变量,是按事物的性质、特征和等级分类,然后清点各类调查单位的个数所得到的资料。特点为其变量值是定性的,表现为互不相容的类别或属性,数值之间不具有连续性,以整数表示。根据类别之间是否有程度上的差别又可分为两类(表 1-1)。

    (4) 变量转化:指根据统计分析的具体要求和研究目的,将不同的变量进行转化。为了便于数据分析,有时需要变量转换。变量的转化是单向的,一般转化顺序为:数值变量→分类变量→多分类→二分类,即计量资料→等级资料→计数资料。例如,作为数值变量的血红蛋白(Hb)量:可按正常(110~140g/L)、轻度贫血(90~109g/L)、中度贫血(60~89g/L)、重度贫血(<60g/L)转成有序的多分类变量;若规定女性Hb 量<110g/L 为贫血,可清点贫血和不贫血的个数而转换为二分类变量。

    2. 同质和变异

    (1) 同质(homogeneity):指对观察指标产生影响的因素相同。但在医学研究中有些影响因素往往是难以控制的,甚至是未知的(如遗传、营养等)。因此,在实际工作中只有相对的同质,故可将同质理解为对研究指标影响较大的、可以控制的非处理因素尽可能相同。例如比较两种不同的治疗方法对高血压的控制情况,药物为处理因素,血压为观察指标,影响血压的非处理因素有年龄、情绪等。只有组间影响血压的非处理因素都应控制在相同的水平,才能区分不同药物的疗效是否相同。鉴于遗传、营养、心理等因素未知或者无法准确测量,属于不可控制的因素,可不加考虑,而性别、年龄、病情轻重、病程长短等可控制因素控制在相同的水平,则可认为达到了同质的要求。

    (2) 变异(variation)指在同质的基础上各观察单位(或个体)之间的差异,如同年龄、同性别、同民族、同地区儿童的血压、身高、体重有高有低,分别称之为血压的变异、身高的变异和体重的变异。

    3. 总体与样本

    (1) 总体(population):根据研究目的确定的同质观测单位的集合。可分为两类:①无限总体(infinitepopulation),无空间、时间和人群范围的限制,其观测单位的全体数只是理论上存在,可理解为目标人群。② 有限总体(finite population),限定于特定的空间、时间与人群范围内的有限个观测单位,可理解为研究人群。总体内个体数值的分布称为总体分布(population distribution)。

    (2) 样本(sample):从统计总体中随机抽取的、具有代表性的(representative)部分观测单位的集合。样本所包含的观测单位数为样本量(sample size),用小写拉丁字母n 表示。样本内个体数值的分布即样本分布(sampledistribution)。样本具有三个特点:①随机性,从一个总体中可以抽取许多个样本,样本单位的取值是可变的,不同的取值就有不同的样本;②代表性,样本的代表性直接影响到对总体推断的准确性;③客观性,从总体中抽取样本,必须排除主观因素的影响。

    4. 误差 误差(error)指实际观测值与真值之差或样本指标与总体指标之差。由于仪器、实验条件、环境等因素的限制,测量不可能无限精确,物理量的测量值与客观存在的真实值之间总会存在着一定的差异,这种差异即误差。误差与错误不同,错误是应该而且可以避免的,而误差是不可能绝对避免的。误差的分类如表1-2 所示。

    5. 事件(event) 泛指事物发生的某种情况或在调查、观察和实验中获得的某种结果,分为以下三类。

    (1) 确定性事件(certainty event):事前可预言的现象,即在准确地重复某些条件下,它的结果总是肯定的。例如,在一个标准大气压下将水加热到100℃便会沸腾。确定性事件包括事件的概率为1 的必然事件(certain event)和事件的概率为0 的不可能事件(impossible event)两种类型。

    (2) 随机事件(random event):一定条件下可能发生也可能不发生的不确定性事件。了解随机事件的目的是:①知道随机现象中所有可能出现的结果;②预测每个结果出现的概率。例如,医生治疗疾病时每一种可能的结果都是一个随机事件。随机事件的概率介于0~1。概率越接近1,表明某事件发生的可能性越大。此外,随机事件有两个特点:①结果的随机性――重复同样的试验时,所得结果并不相同,以至于在试验之前无法预料试验的结果;②频率的稳定性――在大量重复试验中,每个试验结果发生的频率“稳定”在一个常数附近。

    (3) 模糊事件(fuzzy event):事物本身的含义不确定的现象,如“健康”与“不健康”,“年青”与“年老”。

    研究这类现象的工具是模糊数学。

    确定性事件与随机事件的共同特点是事物本身的含义确定。随机事件与模糊事件的共同特点是不确定性,但是,随机事件中是指事件的结果不确定,而模糊事件中是指事物本身的定义不确定。

    6. 频率、概率与小概率事件

    (1) 频率(frequency):某种现象发生的次数。对于随机事件A,在相同的条件下进行了n 次实验,事件A发生的次数为m,比值m/n 为频率,记为fn(A)。医学常用的患病率、病死率等均为频率。

    (2) 概率(probability):描述某随机事件A发生的可能性大小,记为P(A)。当n→∝时,频率fn(A)→概率P(A),统计符号为P,P 值的取值范围为0≤P≤1。

    (3) 小概率事件:医学研究中,习惯上把P≤0.05、P≤0.01的事件称为小概率事件,表示某事件发生的可能性很小(但不是不可能事件),统计学认为小概率事件在一次抽样中是不可能发生的。

    第二节 为什么要学习中医统计学

    世界上各类现象的发展变化规律都表现为质与量的辩证统一。要认识某现象客观存在的规律性,就必须认识其质与量的辩证关系,认识其数量关系的特征及度的界限,这一切都离不开统计学。在数据日益成为一种重要信息的信息社会里,统计学不仅是专业知识的讲授与运用,更重要的是学会如何正确地进行统计思维,形成用数据说话的科学态度。从定性研究到定量分析的发展,是中医学更精密、更科学的表现,也是现代中医学的基本特征。