数统社区

统计学的发展史

发稿日期:2020-06-05  作者:学生会宣传部

认识统计

统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统数据,进行量化的分析、总结,进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。

统计学主要分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称 做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门学科背后的理论基础。

统计的发展历程
    统计学的英文statistics 最早是源于现代拉丁文 statisticum collegium (国会)以及意大利文statista (国民或政治家)。德文Statistik, 最早是由Gotfried Achenwall(1749) 所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair 引进到英语世界。

统计学是一-门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情"政治算数统计分析科学”三个发展阶段。所谓数理统让"并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴

统计学的发展过程的三个阶段

第一阶段称之为“城邦政情"(Matters of state)阶段

城邦政情"阶段始于古希腊的亚里斯多德撰写城邦政情'或城邦纪要"。他一共撰写了一百五十余种纪要,其内容包括各城邦的历史,行政,科学,艺术,人口,资源和财富等社会和经济情况的比较,分析,具有社会科学特点。“城邦政情式的统计研究延续了一两千年直至十七世纪中叶才逐渐被“政治算数"这个名词所替代,并且很快被演化为"统计学"(Statistics) 统计学依然保留了城邦(state)这个词根。

第二阶段称之为“政治算数"Politcal arthmetic)阶段

与“城邦政情阶段没有很明显的分界点,本质的差别也不大。“政治算数"的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。1690年英国威廉·配弟出版(政治算数)-书作为这个阶段的起始标志.威廉·配弟用数字,重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉·配弟的(政治算数)被后来的学者评价为近代统计学的来源,威廉·配弟本人也被评价为近代统计学之父。

配弟在书中使用的数字有三类:

第一类是对社会经济现象进行统计调查和经验观察得到的数字因为受历史条件的限制,书中通过严格的统计调查得到的数据少,根据经验得出的数字多;

第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种:

(1)以已知数或已知量为基础,根据某种具体关系进行推算的方法;

(2)通过运用数字的理论性推理来进行推算的方法;

(3)以平均数为基础进行推算的方法; .

第三类是为了进行理论性推理而采用的例示性的数字,配弟把这种运用数字和符号进行的推理称之为“代数的算法”。从配弟使用数据的方法看,政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术"特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。

第三阶段称之为“统计分析科学"(Science of statistical analysis)阶段

在“政治算数”阶段出现的统计与数学的结合趋势逐渐发展形成了"统计分析科学"。十九世纪末,欧洲大学开设的“国情纪要”或“政治算数”等课程名称逐渐消失,代之而起的是"统计分析科学"课程当时的统计分析科学课程的内容仍然是分析研究社会经济问题。”统计分析科学"课程的出现是现代统计发展阶段的开端. 1908年,"学生"(WilliamSleey Gosset的笔名Student) 发表了关于t分布的论文,这是一篇在统计学发展史上划时代的文章。它创立了小样本代替大样本的方法,开创了统计学的新纪元。现代统计学的代表人物首推比利时统计学家奎特莱(Adolphe Quelet) ,他将统计分析科学广泛应用于社会科学,自然科学和工程技术科学领域,因为他深信统计学是可以用于研究任何科学的一般研究方法.现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年,数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论,正态分布理论和最小平方法则。于是,现代统计方法便有了比较坚实的理论基础。

统计学的观念

为了将统计学应用到科学,工业以及社会问题上,我们由研究母体开始。这可能是一个国家的人民,石头中的水晶,或者是某家特定工厂所生产的商品。一个母体甚至可能由许多次同样的观察程序所组成;由这种资料全集所组成的母体我们称它叫时间序列。

为了实际的理由,我们选择研究母体的子集代替研究母体的每一笔资料, 这个子集称作样本。以某种经验设计实验所集的样本叫做资料。资料是统计分析的对象,并且被用做两种相关的用途:描述和推论。

描述统计学处理有关叙述的问题:资料是否可以被有效的摘要,不论是以数学或是图片表现,以用来代表母体的性质?基础的数学描述包括了平均数和标准差。图像的摘要则包含了许多种的表和图。

推论统计学被用来将资料中的数据模型化,计算它的机率并且做出对于母体的推论。这个推论可能以对错问题的答案所呈现(假设检定),对于数字特征量的估计(估计),对于未来观察的预测,关联性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括变异数的分析(ANOVA),时间序列,以及资料采矿。

相关的观念特别值得被拿出来讨论。对于资料集合的统计分析可能显示两个变量(母体中的两种性质)倾向于一起变动, 好像它们是相连的一样。举例来说,对于人收入和死亡年龄的研究期刊可能会发现穷人比起富人平均来说倾向拥有较短的生命。这两个变量被称作相关的。但是实际上,我们不能直接推论这两个变量中有因果关系;参见相关性推论因果关系(逻辑谬误)

如果样本足以代表母体的,那么由样本所做的推论和结论可以被引申到整个母体之上。最大的问题在于决定样本是否足以代表整个母体。统计学提供了许多方法来估计和修正样本和全集资料过程中的随机性(误差),如同.上面所提到的透过经验所设计的实验。

参见实验设计。要了解随机性或是机率必须具备基本的数学观念。数理统计(通常又叫做统计理论)是应用数学的分支,它使用机率论来分析并且验证统计的理论基础。

任何统计方法是有效的只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述或是推论严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。

统计方法

1)测量的尺度

统计学一共有四种测量的尺度或是四种测量的方式。这四种测量(名目,顺序,等距,等比)在统计过程中具有不等的实用性。等 比尺度(Ratio measurements) 拥有零值及资料间的距离是相等被定义的,等距尺度(Interval measurements )资料间的距离是相等被定义的但它的零值并非绝对的无而是自行定义的(如智力或温度的测量)( Ordinal measurements )顺序尺度的意义并非表现在其值而是在其顺序之.上。名目尺度( Nominalmeasurements )的测量值则不具量的意义。

2)统计技术

以下列出一些有名的统计检定方法以及可供验证实验数据的程序

费雪最小显著差异法( Fisher's Least Significant Difference test )

学生t检验(Student's t-test)

曼惠特尼∪检定(Mann-Whitney U)

回归分析(regression analysis)

相关性( correlation)

皮尔森积矩相关系数(Pearson product-moment correlation cofficient)

史匹曼等级相关系数( Spearman's rank correlation coficient )

卡方分配( chi-square )

统计学现状

在科学技术飞速发展的今天,统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。今天的统计学已展现出强有力的生命力。在我国,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求。随着我国社会主义市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘。

第一,对系统性及系统复杂性的认识为统计学的未来发展增加了新的思路。由于社会实践广度和深度迅速发展,以及科学技术的高度发展,人们对客观世界的系统性及系统的复杂性认识也更加全面和深入。随着科学融合趋势的兴起,统计学的研究触角已经向新的领域延伸,新兴起了探索性数据的统计方法的研究。研究的领域向复杂客观现象扩展。21世纪统计学研究的重点将由确定性现象和随机现象转移到对复杂现象的研究。如模糊现象、突变现象及混沌现象等新的领域。可以这样说,复杂现象的研究给统计开辟了新的研究领域。

第二,定性与定量相结合的综合集成法将为统计分析方法的发展提供新的思想。定性与定量相结合的综合集成方法是钱学森教授于1990 年提出的。这- -方法的实质就是将科学理论、经验知识和专家判断相结合,提出经验性的假设,再用经验数据和资料以及模型对它的确实性进行检测,经过定量计算及反复对比,最后形成结论。它是研究复杂系统的有效手段,而且在问题的研究过程中处处渗透着统计思想,为统计分析方法的发展提供了新的思维方式。

第三,统计科学与其他科学渗透将为统计学的应用开辟新的领域。现代科学发展已经出现了整体化趋势,各门学科不断融合,已经形成-一个相互联系的统-整体。由于事物之间具有的相互联系性,各学科之间研究方法的渗透和转移已成为现代科学发展的一个大的趋势。许多学科取得的新的进展为其他学科发展提供了全新的发展机遇。模糊论、突变论及其他新的边缘学科的出现为统计学的进一步 发展提供了新的科学方法和思想。将一些尖端科学成果引入统计学,使统计学与其交互发展将成为未来统计学发展的趋势。统计学也将会有一个令人振奋的前景。今天已经有一些先驱者开始将控制论、信息论、系统论以及图论、混沌理论、模糊理论等方法和理论引入统计学,这些新的理论和方法的渗透必将会给统计学的发展产生深远的影响。统计学产生于应用,在应用过程中发展壮大。随着经济社会的发展、各学科相互融合趋势的发展和计算机技术的迅速发展,统计学的应用领域、统计理论与分析方法 也将不断发展,在所有领域展现它的生命力和重要作用。

[1] [2] [3] 下一页

学院地址:贵州省都匀市斗篷山路黔南民族师范学院笃行楼(第三教学楼)

技术支持:数学与统计学院信息化项目组   联系电话:0854-8737080

网站版权: 黔南民族师范学院数学与统计学院    邮编:558000

学院网站二维码

学院微信公众号

网站版权:黔南民族师范学院数学与统计学院

技术支持:数学与统计学院信息化项目组

学院地址:贵州省都匀市斗篷山路

                 黔南民族师范学院笃行楼(第三教学楼)

联系电话:0854-8737080 邮编:558000