数据处理吧 关注:624贴子:1,335

数据处理答案

只看楼主收藏回复

数据处理答案


IP属地:福建1楼2020-11-17 21:19回复
    3.数据的误差分析3.1误差分析的定义,误差和偏差,真值和平均值(算术平均值和加权平均值)
    误差分析是指对误差在完成系统功能时,对所要求的目标的偏离产生的原因、后果及发生在系统的哪一个阶段进行分析,把误差减少到最低限度。
    误差是指测量值与真实值之间的差异.由于仪器、实验条件、环境等因素的限制,测量不可能无限精确,物理量的测量值与客观存在的真实值之间总会存在着一定的差异,这种差异就是测量误差。误差是不可避免的,只能减小。根据误差产生的原因及性质可分为系统误差与偶然误差两类。
    偏差又称为表观误差,是指个别测定值与测定的平均值之差,它可以用来衡量测定结果的精密度高低。在统计学中,偏差可以用于两个不同的概念,即有偏采样与有偏估计。一个有偏采样是对总样本集非平等采样,而一个有偏估计则是指高估或低估要估计的量。
    真值是指在一定的时间及空间(位置或状态)条件下,被测量所体现的真实数值。真值是一个变量本身所具有的真实值,它是一个理想的概念,一般是无法得到的。所以在计算误差时,一般用约定真值或相对真值来代替。通常所说的真值可以分为“理论真值”、“约定真值”和“相对真值”。
    算术平均值( arithmetic mean),又称均值,是统计学中最基本、最常用的一种平均指标,分为简单算术平均数、加权算术平均数。它主要适用于数值型数据,不适用于品质数据。根据表现形式的不同,算术平均数有不同的计算形式和计算公式。
    加权平均值即将各数值乘以相应的权数,然后加总求和得到总体值,再除以总的单位数。加权平均值的大小不仅取决于总体中各单位的数值(变量值)的大小,而且取决于各数值出现的次数(频数),由于各数值出现的次数对其在平均数中的影响起着权衡轻重的作用,因此叫做权数。
    3.2误差的基本概念:误差 error(绝对误差 Ea 和相对误差 ER,标准误差 SE)和偏差deviation(绝对偏差和相对偏差、算术平均偏差和相对平均误差,标准偏差 SD 和相对标准偏差RSD)
    绝对误差是统计学中的一个量。它等于置信区间的一半。在置信区间和置信区间长度已知的情况下需要求取样的数量时绝对误差起一个非常重要的作用。绝对误差Δμ = zσX标志着一个估计的精确度。
    相对误差指的是测量所造成的绝对误差与被测量(约定)真值之比乘以100%所得的数值,以百分数表示。一般来说,相对误差更能反映测量的可信程度。设测量结果y减去被测量约定真值t,所得的误差或绝对误差为Δ。将绝对误差Δ除以约定真值t即可求得相对误差。相对误差= 绝对误差÷真值。为绝对误差与真值的比值(可以用百分比、千分比、百万分比表示,但常以百分比表示)。一般来说,相对误差更能反映测量的可信程度。
    标准误差(Standard error),也称均方根误差(Root mean squared error)。标准误差是指在抽样试验(或重复的等精度测量)中,常用到样本平均数的标准差。注意:标准差与标准误差,计算公式类似,但是是两个不同的概念。
    3.3误差的来源和分类(随机误差、系统误差和过失误差)
    误差的来源:由于仪器、实验条件、环境等因素的限制,测量不可能无限精确,物理量的测量值与客观存在的真实值之间总会存在着一定的差异,这种差异就是测量误差。误差是不可避免的,只能减小。根据误差产生的原因及性质可分为系统误差与偶然误差两类。
    随机误差也称为偶然误差和不定误差,是由于在测定过程中一系列有关因素微小的随机波动而形成的具有相互抵偿性的误差。其特点是大小和方向都不固定,也无法测量或校正。
    系统误差(规律误差)是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差。
    过失误差也称粗差,是指工作中的差错,是由于工作粗枝大叶,不按操作规程办事等原因造成的。
    3.4准确度、精密度(极差和方差、标准偏差 SD 和相对标准偏差 RSD、Χ2-test 和 F-test)、正确度(加标回收率,t-test、秩和检验 )(a 和P)、异常值
    极差(Range),又称范围误差或全距,是用来表示统计资料中的变异量数,即最大值减最小值后所得的数据。极差是标志值变动的最大范围,它是测定标志变动的最简单的指标。极差不能用作比较,因为极差的单位不同,但是方差能用作比较,因为都是个比率。
    方差 是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。方差是衡量源数据和期望值相差的度量值。
    标准差(外文名:Standard Deviation,又称:均方差)是离均差平方的算术平均数的平方根,用σ表示,标准差是方差的算术平方根。标准差在概率统计中最常使用作为统计分布程度,还能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。
    相对标准偏差(relative standard deviation;RSD)又叫标准偏差系数、变异系数、变动系数等,由标准偏差除以相应的平均值乘100%所得值,可在检验检测工作中分析结果的精密度。
    加标回收率,是指在没有被测物质的空白样品基质中加入定量的标准物质,按样品的处理步骤分析,得到的结果与理论值的比值。
    秩和检验(rank sum test)又称顺序和检验,是一种非参数检验(nonparametric test)。它不依赖于总体分布的具体形式,应用时可以不考虑被研究对象为何种分布以及分布是否以知,因而实用性较强。
    异常值(outlier)是指一组测定值中与平均值的偏差超过两倍标准差的测定值,与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。
    3.5误差的统计检验(χ-test 、 F-test 、 t-test 、 Rank sum test)
    F-test 是在零假设下检验统计量具有F分布的统计检验。它最常用于比较已拟合到数据集的统计模型,以识别最适合数据抽样总体的模型。精确的“F检验”主要出现在当模型用最小二乘法拟合数据的时候。该名称是George W. Snedecor为纪念Sir Ronald A. Fisher而创造的。Fisher在20世纪20年代发明了这一检验统计量,最初称之为方差比率
    t-test (Student's t test)是指虚无假设成立时的任一检定统计有学生t-分布的统计假说检定,属于母数统计。可分为单总体检验和双总体检验,以及配对样本检验,主要应用于比较两个平均数的差异是否显著。
    3.6 误差的传递(公式、应用) 4.数据的列表画图4.1列表和画图的定义
    列表;以表格为容器,装载着文字或图表的一种形式
    画图是一个简单的图像绘画程序,是微软公司Windows操作系统的预载软件之一。“画图”程序是一个位图编辑器,可绘人物,动物,自然景色等等众多图画,也可以对各种位图格式的图画进行编辑,是家庭和办公的理想软件。用户可以自己绘制图画,也可以对扫描的图片进行编辑修改,在编辑完成后,可以以BMP,JPG,GIF 等格式存档,用户还可以发送到桌面和其他文本文档中。
    4.2表格组成:表号、表名、表头(名称、符号、单位)、数据(有效数字的概念、运算和修约)、表注或表附
    4.3表格类型:原始数据记录表、中间数据计算表、最终结果数据表4.4表格注意点:简明合理、层次清晰、格式三线、科学计数法4.5图的组成:图号、图名、横坐标、纵坐标、图例、图注4.6图的类型:二维图(散点图、折线图、柱形图和条形图、圆形图和环形图),三维图(三维表面图和三维等高图)4.7画图注意点:坐标系和图形的选择、坐标轴的分度(坐标轴比例尺)、有效数字和单位,双Y 轴,误差线


    IP属地:福建3楼2020-11-17 21:23
    回复
      2025-07-16 18:28:05
      广告
      5.数据的方差分析5.1方差分析的基本概念和基本内容
      方差分析:是一种非常实用、有效的统计检验方法,能用于检验试验过程中,有关因素对实验结果影响的显著性。又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。
      实验设计:1因素:自变量x,实验条件。
      2水平:自变量取值,因素的不同状态或内容。
      3指标:因变量y,实验结果的参数
      5.2单因素方差分析(均值、离差平方和 SS、自由度df、均方 MS、F 检验、P 值)
      单因素:单因素实验方差分析又称一元方差分析,它是讨论一种因素对实验结果有无显著影响。
      均值:算数平均值
      离差平方和 SS:离差平方和(Sum of Squares of Deviations)是各项与平均项之差的平方的总和。定义是设x是一个随机变量,令η=x-Ex, 则 称 η为x的离差,它反映了x与其数学期望Ex的偏离程度。
      自由度df:SST:dfT=n-1 SSA:df=r-1 SSe:df=n-r
      均方 MS:均方是表示离差平方和与自由度之比。
      F 检验:F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的方差 S^2,以确定他们的精密度是否有显著性差异。至于两组数据之间是否存在系统误差,则在进行F检验并确定它们的精密度没有显著性差异之后,再进行t检验。
      P 值:P值指的是,比较两者(结果)的差异是由偶然误差(机遇)所致的可能性大小。
      5.3双因素方差分析(总离差平方和、组间(水平项)离差平方和、组内(随机误差项) 离差平方和,交互作用的离差平方和)双因素方差分析(Two-way ANOVA)有两种类型:一个是无交互作用的双因素方差分析,另一个是有交互作用的双因素方差分析,它假定因素A和因素B的结合会产生出一种新的效应。
      SST==S+S+SSe
      5.4多个平均值(两个以上样本均值)的方差分析方差分析(ANOVA)又称“变异数分析”或“F检验”,是由R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验。6.数据的回归分析6.1回归分析和残差的定义,回归分析基本内容回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
      残差:1)若用一模型拟合资料,则模型计算值与资料实测值之差为残差,如线性回归中的实测值与方程的计算值之差。
      2)变量的真值与观测值之差
      6.2类型:一元和多元回归方程,线性和非线性回归方程一元线性回归方程反映一个因变量与一个自变量之间的线性关系,当直线方程Y'=a+bx的a和b确定时,即为一元回归线性方程。
      .在统计学中,线性回归方程是利用最小二乘函数对一个或多个自变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量的情况叫多元回归
      线性方程,指量与量之间按比例、成直线的关系,在数学上可以理解为一阶导数为常数的函数;非线性方程则指不按比例、不成直线的关系,一阶导数不为常数。
      6.3术语:最小二乘法原理、回归系数和偏回归系数、相关系数和复相关系数及决定系数、F 检验和相关系数检验 、线性回归的 SLOPEINTERCEPTCORREL最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达
      回归系数(regressioncoefficient)在回归方程中表示自变量x 对因变量y 影响大小的参数。回归系数越大表示x 对y 影响越大,正回归系数表示y 随x 增大而增大,负回归系数表示y 随x增大而减小
      偏回归系数是多元回归问题出现的一个特殊性质。设自变量x1,x2,…,xm与因变量y都具有线性关系,可建立回归方程:ŷ=b0+b1x1+b2x2+…+bmxm。式中b1,b2,…,bm为相应于各自变量的偏回归系数
      相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示
      复相关系数是反映一个因变量与一组自变量(两个或两个以上)之间相关程度的指标,是度量复相关程度的指标。
      决定系数(coefficient ofdetermination),有的教材上翻译为判定系数,也称为拟合优度。是相关系数的平方。表示可根据自变量的变异来解释因变量的变异部分。
      相关系数检验:1、找到相关系数显著性检验表;
      2、然后确定自由度(n-m-1),n,m分别代表样本个数和未知量维度;
      3、查找a0.01 ,a0.05,a.010对应的值;
      4、将相关系数r与a比较,确定显著性水平。
      最小二乘回归,也就是求一个斜率,一个截距,这里SLOPE就是斜率,INTERCEPT就是截距,把数据套进就是了
      6.4应用:散点图拟合及统计检验、分析工具库拟合及统计检验、规划求解的应用


      IP属地:福建4楼2020-11-17 21:23
      回复
        7.正交试验设计和数据处理7.1正交实验设计的定义,正交表及特点(正交性)正交试验设计(Orthogonal experimental design)是研究多因素多水平的又一种设计方法,它是根据正交性从全面试验中挑选出部分有代表性的点进行试验,这些有代表性的点具备了"均匀分散,齐整可比"的特点,正交试验设计是分析因式设计的主要方法。是一种高效率、快速、经济的实验设计方法。
        正交表是一整套规则的设计表格,用 L为正交表的代号,n为试验的次数,t为水平数,c为列数,也就是可能安排最多的因素个数。正交表的构造需要用到组合数学和概率学知识,现在广泛使用的Ln(t)类型的正交表构造思想比较成熟
        每一列中,不同的数字出现的次数相等
        任意两列中数字的排列方式齐全而且均衡
        以上两点充分的体现了正交表的两大优越性,即"均匀分散性,整齐可比"。通俗的说,每个因素的每个水平与另一个因素各水平各碰一次,这就是正交性。
        7.2正交试验结果的直观分析(极差分析、趋势图,比较即因素主次顺序、优化及优方案预测)
        极差分析法:最大值-最小值,特点:极差分析法不能估计试验误差。
        计算极差,确定因素的主次顺序
        趋势图:因素与指标的关系图
        根据极差R的大小,进行因素的主次排队。R越大,表示该因素的水平变化对试验的影响越大,因此在本试验中这个因素就越重要;反之,R越小,
        优方案是指在所做的试验范围内,各因素较优的水平组合,优水平的确定与试验指标Ki有关
        7.3混合水平和拟水平,交互作用和水平搭配表拟水平设计是指在水平数较少的正交表上安排某些水平数较多因子的设计方法,用于在同水平正交表上安排不同水平因子试验的设计
        当影响行为的一因子与另一个因子共同起作用时,它们对该行为产生与各自单独作用时截然不同的影响,这就是交互作用
        最简单的正交表是L4(23),含意如下:“L”代表正交表;L 下角的数字“4”表示有 4 横行,简称行,即要做四次试验;括号内的指数“3”表示有3 纵列,简称列,即最多允许安排的因素是3 个;括号内的数“2”表示表的主要部分只有2 种数字,即因素有两种水平1与2。
        7.4正交试验的方差分析(方差分析和因素影响的显著性及比较,极差分析和优方案) 7.5空列和误差列空白列只做预处理,不做其他处理,就是压力.浓度.电压都没有要求,就在室温下做对照就可以了,就如你做单因素时的空白,一样的
        Word 作业 8.回归正交试验设计和数据处理8.1一次回归正交试验的设计和数据处理自然变量和规范变量,上水平和下水平,零水平和变化间距总离差平方和 SST,回归离差平方和 SSR,失拟离差平方和 SSLf,重复实验的随机误差平方和 SSe1,拟合度检验(失拟性检验) 8.2二次回归正交组合的设计和数据处理实验次数和因素水平数的关系,二水平试验、零水平试验、星号试验,星号臂长度,上星号臂(上限)和下星号臂(下限)、变化间距、上水平和下水平, 二次项的中心化
        8.3二次回归正交旋转组合的设计和数据处理预测值的方差和试验点的空间位置,星号臂长度,零水平的实验次数


        IP属地:福建5楼2020-11-17 21:24
        回复
          Word 作业1 列表的主要事项
          标题:统计表要有标题,标题在表的正上方,要能简明扼要地概括表中的主要内容。
          标目:标目分为横标目和纵标目。横标目一般列在统计表的左侧,常常说明被研究的事物,相当于统计表的主语;纵标目多放在统计表的上行,常用来表示说明主语的各项指标,相当于统计表的谓语。对于复杂的统计表还可在纵或横标目上冠以总标目。一般来讲无论是简单表还是复合表,主语和谓语连贯起来能读成一句通顺的话,表达一个较完整的意思。纵横标目应文字简明,有单位的标目要注明单位。
          线条:不宜过多,除上面的顶线,下面的底线,以及纵标目下面与合计行上面的横线外,其余线条一般均省去。
          数字:表内数字一律用阿拉伯数字表示。同一指标的小数位数应保留一致,位次对齐。表内不留空格,暂缺或未记录可用“……”表示,无数字用“——”表示,数字若是“0 ”,则填明0。
          备注:一般不列入表内,必要时可用“※ ”号标出,解释在表的下面。
          2 绘图的注意事项
          字体大小要有规律:字体大小尽可能保持统一,如果无法保证字体大小一样,要有规律可循。
          颜色选择要合适:表格中需要使用一些颜色进行标识,使用的颜色不要刺眼,不可大面积使用刺眼颜色,尽可能的选用一些柔和的浅色。
          结果以图形表示出来:对于分析的一些数据,要将结果以图形形式展示出来,不要还是停留在的数据分析的表格阶段,那样不易让人看出,使用图形的信息表达力和美观度都要好一些
          数据分析过程中最好不要合并单元格:数据分析时候,合并单元格会对自己运算数据、排列等级为不利,而且几乎很多都难以开展数据运算。所以还是要等到最后结果出来的时候再进行合并
          字段设计要合理:第一行和第一列的字段设计一定要合理,不能太长太短,概括的要全面恰当,不管是汉字还是英文,最好是统一的。
          3 随机误差检验(F-test)的步骤和显著性判断标准
          1、Excel中将待检验数据制成表格
          2、参考1.8.3安装好“分析工具库”后,在【数据】选项卡下,点击【分析】标签中的【数据分析】打开分析工具库,从中选中“F-检验 双样本方差”工具,即可弹出“F-检验 双样本方差”对话框
          3、选择需要分析的数据表格区域。在变量1的区域输入对需要进行分析的第一列或第一行数据的单元格应用。在变量2的区域输入对需要进行分析的第二列或第二行数据的单元格应用,如果输入的第一行或第一列中包括标志项,则选中标志复选框,如果输入区域没有标志项,则清楚复选框,Excel将在输出表中生成适宜的数据标志,在α(A)出输入F检验临界值的置信度,或称显著性水平,该值必须介于0到1之间。默认值为0.05.在输出区域输入对输出表左上角单元格的引用。
          4、按要求填完F检验对话框后单机确定即可得到方差分析结果
          在输出结果中,包括各组数据的算术平均值、方差、实验次数、自由度和F值等。
          P≤0.01非常显著 P>0.05不显著 0.01≥P>0.05
          4 系统误差检验(t-test)的步骤和显著性判断标准
          1、 Excel中将带检验数据制成表格
          2、 在【数据】选项卡【分析】命令组中,点击【数据分析】打开分析工具库,选中“F-检验 双样本方差”工具,然后进行F检验,等到检验结果。
          3、 在【数据】选项卡【分析】命令组中,点击【数据分析】打开分析工具库,然而选中“t-检验:双样本等方差假设”工具,进入“t-检验:双样本等方差假设”对话框,并填写对话框。
          4、 选择需要分析的数据表格区域。在变量1的区域输入对需要进行分析的第一列或第一行数据的单元格应用。在变量2的区域输入对需要进行分析的第二列或第二行数据的单元格应用,如果输入的第一行或第一列中包括标志项,则选中标志复选框,如果输入区域没有标志项,则清楚复选框,Excel将在输出表中生成适宜的数据标志,在α(A)出输入F检验临界值的置信度,或称显著性水平,该值必须介于0到1之间。默认值为0.05.在输出区域输入对输出表左上角单元格的引用。假设平均分差填0
          5、
          10 正交试验设计的基本步骤
          1. 明确实验目的,确定评价指标
          2. 挑选因素;确定水平
          3. 选正交表,进行表头设计
          4. 明确实验方案,进行实验,得到结果
          5. 对实验结果进行统计分析
          6. 进行验证实验,进一步分析
          11 正交试验结果直观分析的基本步骤
          1. 选正交表
          2. 表头设计
          3. 明确实验方案
          4. 按规定的方案做实验,得出实验结果
          5. 计算极差,确定因素的主次顺序
          6. 优方案的确定
          12 正交试验结果方差分析的基本步骤
          一. 计算离差平方和
          1. 总离差平方和
          2. 各因素引起的离差平方和
          3. 实验误差的离差平方和
          4. 交互作用的离差平方和
          二. 计算自由度
          三. 计算平均离差平方和
          四. 计算F值
          五. 显著性检验
          13 一次回归正交试验设计和数据处理的步骤
          1. 因素水平编码
          2. 正交表的选择和实验方案的确定
          3. 回归方程的建立
          4. 方差分析
          5. 预测优方案
          6. 处理数据
          14 二次回归正交组合设计和数据处理的步骤
          1. 因素水平编码
          2. 确定合适的二次回归正交组合设计
          3. 实验方案的实验
          4. 回归方程的建立
          5. 回归方程显著性检验
          6. 失拟性检验
          7. 回归方程的回代
          8. 最优实验方案确定
          15 二次回归正交旋转组合设计和数据处理的步骤1. 因素水平编码
          2. 二次回归正交旋转组合设计
          3. 回归方程的建立及检验
          4. 失拟性检验
          5. 预测优方案


          IP属地:福建6楼2020-11-17 21:25
          回复
            吧主大大手下饶命,考试用的资料千万别删


            IP属地:福建7楼2020-11-17 21:27
            回复
              作业一
              实验和试验 Experiment and Test
              试验:指的是在未知事物,或对别人已知的某种事物而在自己未知的时候,为了了解它的性能或者结果而进行的试探性操作。
              实验:是为了解决文化、政治、经济及其社会、自然问题,而在其对应的科学研究中用来检验某种新的假说、假设、原理、理论或者验证某种已经存在的假说、假设、原理、理论而进行的明确、具体、可操作、有数据、有算法、有责任的技术操作行为。
              数据和数值 Data and Figure
              数据是指在实验中控制实验对象而搜集到的变量的数据。搜集数据的另一类方法是通过实验,在实验中控制一个或多个变量,在有控制的条件下得到观测结果。
              数值指的是用数目表示的一个量的多少。
              实验设计和数据处理 Experimental Design and Data Processing
              实验设计是指一种有计划的研究,包括一系列有意图性的对过程要素进行改变与其效果观测,对这些结果进行统计分析以便确定过程变异之间的关系,从而改变这过程。
              数据处理是对数据的采集、存储、检索、加工、变换和传输。
              比较实验和优化实验 Comparison and Optimization
              比较实验,指设置两个或两个以上的实验组,通过对结果的比较分析,来探究各种因素与实验对象的关系
              优化实验就是在最优化思想指导下,通过实验进行最优设计的一种优化方法
              验证实验和探索实验 Verification and Exploration
              验证实验是指对研究对象有了一定了解,并形成了一定认识或提出了某种假说,为验证这种认识或假说是否正确而进行的一种实验。
              探索实验是指人们从事开创性的研究工作时,为探寻未知事物或现象的性质以及规律所进行的实践活动。
              重复和平行 repeat and parallel
              重复试验是指相同的方法,同一试验材料,在相同的条件下获得的一系列结果之间的一致程度。相同的条件是指同一操作者,同一测量仪器,同一地点,相同的测量程序和短暂时间内重复测量。一个数值在上述条件下得到的两次试验结果之差的绝对值以某个指定的概率低于这个数值。
              平行试验就是同一批号(炉号等)取两个以上相同的样品,以完全一致的条件(包括温度、湿度、仪器、试剂,以及试验人)进行试验,看其结果的一致性,两样品间的误差是有国标或其他标准要求的。其优点是防止偶然误差的产生。
              结果和结论 result and conclusion
              结果:在一定阶段,事物发展所达到的最后状态。
              结论:对人或事物所下的最后的论断。
              P值
              P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。总之,P值越小,表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P值的大小和实际问题来解决。
              作业二
              表格的定义和组成
              定义: 表格是指表格由一行或多行单元格组成,用于显示数字和其他项以便快速引用和分析。表格中的项被组织为行和列。按所需的内容项目画成格子,分别填写文字或数字的书面材料,便于统计查看。
              组成:表号、表名、表头、数据、表注和表附
              有效数字
              具体地说,有效数字是指在分析工作中实际能够测量到的数字。能够测量到的是包括最后一位估计的,不确定的数字。把测量结果中能够反映被测量大小的带有一位存疑数字的全部数字叫有效数字。数据记录时,我们记录的数据和实验结果真值一致的数据位便是有效数字。另外在数学中,有效数字是指在一个数中,从该数的第一个非零数字起,直到末尾数字止的数字称为有效数字。
              表格注意点
              (1)表格设计应该简明合理、层次清晰,以便于阅读和使用;
              (2)数据表的表头要列出变量的名称、符号和单位,如果表中的所有数据的单位都相同,这时单位可以在表的右上角标明;
              (3)要注意有效数字位数,即记录的数字应与试验的精度相匹配;
              (4)试验数据较大或较小时,要用科学记数法来表示,将10±n记入表头,注意表头中的10±n与表中的数据应服从下式:数据的实际值X10±n=表中数据;
              (5)数据表格记录要正规,原始数据要书写得清楚整齐,不得潦草,要记录各种试验条件和现象,并妥为保管。
              图示的定义和图组成
              图示的定义:将试验数据用图形表示出来,使复杂的数据更加直观和形象。在数据分析中,一张好的数据图,往往胜过冗长的文字表述。通过数据图,可以人直观地看出试验数据变化的特征和规律。它的优点在于形象直观,便于比较,容易看出折点、周期性、变化率以及其他特性。
              图示组成:图号、图名、图例、图注、纵坐标、横坐标的分度。
              图类型
              二维图(散点图、折线图、柱形图和条形图以及甘特图、圆形图和环形图),三维图(三维表面图和三维等高图)
              画图注意点
              (1)在绘制线图时,要求曲面光滑,并使曲面尽可能通过较多的试验点,或者使曲线以外的点尽可能位于曲线附近,并使曲线两侧的点数大致相等;
              (2)定量的坐标轴,其分度不一定自零起;
              (3)定量绘制的坐标图,其坐标轴上必须标明该坐标所代表的变量名称、符号及所用的单位,一般用纵轴代表因变量;
              (4)坐标轴的分度应与试验数据的小数相匹配;
              (5)图必须有图号和图题,以便于引用,必要时应有图注。
              坐标系和比列尺的选择
              坐标系的选择:大部分图形都是描述在一定的坐标系中,在不同的坐标系中,对同一组数据作图,可以得到不同的图形,所以在作图之前,应该对试验数据的变化规律有一个初步的判断,以选择合适的坐标系,使所作的图形规律性更明显。
              比例尺的选择:比例尺是表示图上一条线段的长度与地面相应线段的实际长度之比。公式为:比例尺=图上距离与实际距离的比。比例尺有三种表示方法:数字式比例尺、图示比例尺和文字比例尺。一般讲,大比例尺地图,内容详细,几何精度高,可用于图上测量。小比例尺地图,内容概括性强,不宜于进行图上测量。
              作业三
              真值和均值 True and mean values
              真值:真值是指在一定的时间及空间(位置或状态)条件下,被测量所体现的真实数值。真值是一个变量本身所具有的真实值,它是一个理想的概念,一般是无法得到的。所以在计算误差时,一般用约定真值或相对真值来代替。通常所说的真值可以分为“理论真值”、“约定真值”和“相对真值”。
              均值:1.算术平均值。2.加权平均值
              误差、偏差、绝对误差和相对误差/偏差
              Errors, deviations, absolute errors and relative errors/deviations
              误差:试验值(测量值)—真值(参考值)
              偏差:试验值(测量值)—均值(最可信赖值)
              绝对误差/偏差:△=X-L
              式中:△—绝对误差  X—测量值 L—真实值
              注:绝对误差有正负性,正性表示测量值大于真实值,负性表示测量值小于真实值。
              相对误差/偏差:绝对误差与测量值或多次测量的平均值的比值
              标准偏差和标准误差 Standard deviation and standard error
              标准偏差:是一个变量的所有数据的高均差平方和两平均之后开平方,它是度量数据精密度(离散程度)的指标。
              标准误差:是一种特殊的标准偏差,它是指样本平均数与总体平均数之间的相对偏差,实际是新抽样分布的标准偏差。
              随机误差、系统误差和过失误差
              Random error, systematic error and fault error
              随机误差:不可避免
              系统误差:1、仪器误差:是由使用的仪器本身不够精密所造成的;2、方法误差:是有分析方法本身造成的;3、试剂误差:是由所用蒸馏水含有杂质或使用的试剂不纯造成的;4、操作误差:是由操作人员掌握分析操作的条件不成熟、个人观察器官不敏锐和固有的习惯造成的;5、主观误差:是由操作人员主观原因,如观察判断能力的缺陷或不良习惯造成的
              过失误差:这是需要避免的。
              重复实验和平行试验 Repeat experiments and parallel experiments
              重复实验:同一实验,需要重新做一遍
              平行实验:同一实验,同时进行。
              统计检验 Statistical test
              随机误差的检验:1、x2检验;2、F检验
              系统误差的检验:1、t检验法;2、秩和检验法
              异常值的检验:1、拉依达检验法;2、格拉布斯检验法;3、狄克逊检验法
              P值
              P值:是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。
              方差分析analysis of variance,简称ANOVA
              检验试验中有关因素对试验结果影响的显著性
              试验指标experimental index
              口衡量或考核试验效果的参数
              因素experimental factor
              影响试验指标的条件
              可控因素(controllable factor)
              水平level of factor
              因素的不同状态或内容


              IP属地:福建8楼2020-11-17 21:51
              回复
                作业三
                l 误差分析和方差分析 Error analysis and variance analysis
                误差分析:对试验数据的可靠性行进统计学分析
                方差分析:对实验因素对结果影响的显著性进行统计学分析
                l 因素 experimental index
                自变量X、影响试验的条件
                l 水平 level of factor
                自变量的值、因素的不同状态内容
                l 指标(试验结果的数值) index
                因变量Y、试验结果的参数
                l 单因素试验方差分析和双因素试验方差分析
                One way ANOVA and two factor ANOVA
                单因素试验方差分析:又称一元方差分析,它是讨论一种因素对试验结果有无显著影响。
                双因素试验方差分析:即讨论两个因素对试验结果影响的显著性,又称二元方差分析。
                l P值
                概率值(一般用P值表示某因素对试验结果有无显著影响)
                当P>0.05时,为不显著,无表示;
                当0.01<P£0.05时,为显著,用“*”表示;
                当P£0.01时,为非常显著,用“**”表示。
                l 误差和偏差 Error and deviation
                误差:试验值(测量值)-真值(参照值)
                偏差:试验值(测量值)-均值(最可信赖值)
                l 绝对误差和绝对偏差 Absolute error and absolute deviation
                绝对误差:绝对误差试验值与真值之差称为绝对误差,反应了试验值偏离真值的大小,这个偏差可正可负。
                绝对偏差:为某一测量值与多次测量值的均值之差。
                l 相对误差和相对偏差 Relative error and relative deviation
                相对误差:为判断试验值的准确性,还必须考虑试验值本深的大小;相对误差等于绝对误差除以真值。
                相对偏差:相对偏差是指某一次测量的绝对偏差占平均值的百分比。相对偏差只能用来衡量单项测定结果对平均值的偏离程度。
                l 随机误差、系统误差与过失误差
                Random error, systematic error and negligent error
                随机误差:随机误差是指在一定试验条件下,以不可预知的规律变化着的误差,多次试验值的绝对误差时正时负,绝对误差的绝对值时大时小。解决方法:增加重复实验。
                系统误差:系统误差是指在定试验条件下,由某个或某些因素按照某一确定的规律起作用而形成的误差,系统误差的大小及其符号在同一试验中是恒定的,或在试验条件改变时按照某确定的规律变化。当试验条件一旦确定,系统误差就是一个客观上的恒定值,它不能通过多次试验被发现,也不能通过取多次试验值的平均值而减小。
                过失误差:过失误差是一种显然与事实不符的误差,也称“粗大误差”,没有一定的规律,它主要是由于实验人员粗心大意造成的,如读数错误、记录错误或操作失误等。所以只要实验者加强工作责任心,过失误差是可以完全避免的。
                l 标准误差和标准偏差 Standard error and standard deviation
                标准误差:是一种特殊的标准误差,它是指样本平均数与总体平均数之间的相对偏差,实际是新抽样分布的标准偏差。
                标准偏差:也叫标准差或均方差,是一个变量的所有数据的离均差平方和再平均之后开平方,它是度量数据精密度(离散程度)的指标。
                l 方差、极差和离差 Variance,Range and Deviation
                方差:方差(Variance)应用数学里的专有名词。在概率论和统计学中,一个随机变量的方差描述的是它的离散程度,也就是该变量离其期望值的距离。一个实随机变量的方差也称为它的二阶矩或二阶中心动差,恰巧也是它的二阶累积量。方差的算术平方根称为该随机变量的标准差。
                极差:极差(Range)又称范围误差或全距,是用来表示统计资料中的变异量数,即最大值减最小值后所得的数据。
                离差:离差(Deviation)即标志变动度,又称“偏差”,是观测值或估计量的平均值与真实值之间的差,是反映数据分布离散程度的量度之一,或说是反映统计总体中各单位标志值差别大小的程度或离差情况的指标,常写作,即参与计算平均数的变量值与平均数之差。
                l 试验结果和试验结论 Test results and conclusions
                试验结果:即用实验得出的第一手资料,主要指实验数据。
                试验结论:结论应反映论文中通过实验、观察研究并经过理论分析后得到的学术见解。试验结论应是该试验最终的、总体的结论。
                作业四
                基本概念
                l 相互关系
                确定性关系:变量之间存在着严格的函数关系
                相关关系:变量之间近似存在某种函数关系
                在一定条件下,确定性关系和相关关系可以相互转换。
                l 回归分析
                定义:确定自变量(因素)和因变量(指标)之间定量关系的一种统计方法(y=f(x1,x2,…xn))
                主要内容:
                确定回归方程:变量之间近似的函数关系,散点图(一元)和分析工具库(线性)
                检验回归方程;显著性检验,相关系数检验和F检验(AVOVA/F-text)
                因素主次判断:t检验,P
                预测优方案:excel规划求解
                类型:一元回归、多元回归(默认因变量只有一个,依据自变量的个数分类)
                一元线性回归、一元非线性回归、多元线性回归、多元非线性回归
                l 一元回归分析
                n 一元线性回归
                (1)方差的建立
                原理:最小二乘法
                一元线性回归方差(a、b回归——系数)
                ——回归值/拟合值,由代入回归方程计算出的y计算值。
                回归值与试验值不一定相等
                与之间的偏差称为残差:
                相关系数检验法
                A、相关系数特点
                相关系数定义:描述变量x与y的线性程序
                定义式:
                :x与y有精确线性关系
                :x与y负线性相关
                :x与y正线性相关
                时,x与y没有线性关系,但可能存在其它类型关系
                相关系数r越接近于1,x与y的线性相关程度越高
                试验次数越少,r越接近1
                相关系数检验
                对于给定的显著性水平α,查相关系数临界值rmin
                当,说明x与y之间存在显著的线性关系
                F检验
                n 一元非线性回归
                曲线y=f(x)有多种形式(双曲线、对数函数、指数函数、幂函数等)通过线性变化,将一元线性回归问题:
                在直角坐标中画出散点图:
                推测y与x之间的函数关系;线性变化;用线性回归方法求出线性回归方程;返回到原来的函数关系,得到要求的回归方程
                n 一元多项式回归
                不是所有的一元非线性函数都能转换成一元线性方程,但任何复杂的一元连续函数都可以用高阶多项式近似表达。
                ŷ=a+b1x1+b2x2+...+bmxm,b1,b2,..,bm为偏回归系数
                置信水平(0.95)+显著性水平(0.05)=1
                l 多元线性回归
                多元线性回归的原理和方法与一元线性的回归分析相似
                复相关系数检验法
                复相关系系数R:反应了一个变量y与多个变量(x1,x2,...xm)之间线性相关程度
                计算式:决定系数,R2的大小反映了回归平方和在总高差平方和中所占的比重。
                R一般取正值,
                R=1时,y与变量之间存在严格的线性关系
                时,y与变量之间不存在线性相关关系
                当时,变量之间存在一定程度的线性相关关系
                时,y与变量之间存在密切的线性关系


                IP属地:福建9楼2020-11-17 21:53
                回复
                  2025-07-16 18:22:05
                  广告
                  作业五
                  l 实验设计原则:
                  重复、随机化、区组化、对照
                  l 实验设计类型、正交表、设计步骤
                  n 实验设计类型(3因素3水平)
                  (1)全面实验设计 33=27
                  (2)单因素序贯实验设计 3+3+3=9
                  (3)正交试验设计(orthogonal design):利用正交表科学地安排多因素试验,用极差、方差、回归等方法分析实验结果的实验设计方法。
                  正交实验设计的优点:
                  能均匀地挑选出代表性强的少数试验方案;由少数试验结果,可以推出较优的方案;可以得到试验结果之外的更多信息
                  n 正交表
                  1、等水平正交表:各因素水平数相等的正交表
                  等水平正交表特点 :表中任一列,不同的数字出现的次数相同。也就是说每个因素的每一个水平都重复相同的次数;表中任意两列,把同一行的两个数字看成有序数字对时,所以可能的数字对(或称水平搭配)出现的次数相同。
                  2、混合水平正交表:各因素水平数不完全相同的的正交表
                  混合水平正交表性质:表中任一列,不同的数字出现的次数相同;每两列,同行两个数字组成的各种不同的水平搭配出现的次数是相同的,但不同的两列间所组成的水平搭配种类及出现次数是不完全相同的。
                  n 正交试验设计的基本步骤:
                  (1)明确试验目的,确定评价指标
                  (2)挑选因素
                  (3)选正交表,进行表头设计
                  (4)明确试验方案,进行试验,得到结果
                  (5)对试验结果进行统计分析
                  (6)进行验证试验,作进一步分析
                  作业六
                  l 直观分析
                  目的:通过极差分析和趋势图确定因素主次顺序和优方案
                  优点:数据计算量小,图形简单直观
                  缺点:不能估计误差的大小,不能精确地估计因素对试验结果影响的显著程度
                  l 方差分析
                  能估计误差的大小
                  能精确地估计各因素对试验结果影响的显著程度
                  特别对于水平数大于等于3且要考虑交互作用的实验
                  l 单因素方差分析的步骤
                  1、计算平均值
                  2、计算离差平方和SS
                  3、计算自由度df
                  4、计算均方MS
                  5、F-test
                  6、方差分析表及结论
                  l 正交试验结果方差分析的基本步骤
                  1、列因素水平表
                  2、选正交表
                  3、设计表头
                  4、明确实验方案,做实验得到结果
                  5、计算极差和列水平搭配表,画趋势图和交互作用图
                  6、方差分析和结论一计算离差平方和、自由度和均方,做F-test,列差分析表
                  7、根据方差分析、极差分析和交互作用表水平搭配表确定优方案,结论2
                  8、验证试验,作进一步的分析,制定下一步的实验方案
                  l F检验
                  回归方程显著性检验 FR=MSR/MSe
                  偏回归系数显著性检验:Fj=MSj/MSe Fkj=MSkj/MSe
                  判断因素或交互作用对试验的影响程度
                  l 有零水平试验时
                  目的:进行回归方程的失拟性检验
                  失拟性检验:为了检验一次回归方程在整个研究范围内的拟合情况
                  l 正交设计
                  n 优点
                  能挑选出代表性较强的少数试验方案
                  由少数试验结果可以推出较优的方案
                  可以得到试验结果之外的更多信息
                  n 缺点
                  优方案只能限制在已定的水平上,而不是试验因素水平范围内的最优方案
                  l 一次回归正交试验设计及结果分析
                  设计目标:建立试验指标(y)与m个试验因素x1,x2,x3·····xm之间的一次回归方程
                  l 实验设计步骤:四步
                  1、确定因素的变化范围(上水平、下水平、零水平、变化间距)
                  2、因素水平的编码(自然变量和规范变量,-1 0 1)
                  3、一次回归正交试验设计编码表(2水平的转换)
                  4、试验方案的确定(表头设计、零水平试验和失拟试验)
                  l 二次回归正交试验设计
                  回归方程的建立。根据最小二乘法原理得到正规方程组。求解正规方程组,得回归系数。要求:试验次数>回归方程项数。回归正交组合设计:在一次回归正交试验设计的基础上再增加一些待定的试验点,通过适当的组合形成试验方案


                  IP属地:福建10楼2020-11-17 21:54
                  回复



                    IP属地:江苏11楼2020-11-18 08:37
                    回复




                      IP属地:福建13楼2020-11-18 08:52
                      回复
                        部分课后习题答案:
                        http://www.docin.com/p-2074217927.html(1.7、1.8、2.3、3.1、3.2、4.1、4.3、4.4、6.1、6.5、6.6)


                        IP属地:福建14楼2020-11-18 09:07
                        回复
                          https://wenku.baidu.com/view/a7dc41bd80c758f5f61fb7360b4c2e3f57272531.html 第六章课后答案


                          IP属地:福建15楼2020-11-18 09:09
                          回复
                            第一章答案 https://www.docin.com/touch_new/preview_new.do?id=1747399531


                            IP属地:福建16楼2020-11-18 09:18
                            回复
                              2025-07-16 18:16:05
                              广告
                              1.方差分析(Analysis of Variance,简称ANOVA)为数据分析中常见的统计模型,主要为探讨连续型资料型态之因变量与类别型资料型态之自变量的关系。
                              回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。
                              2.单因素方差分析(均值、离差平方和 SS、自由度df、均方 MS、F 检验、P 值)
                              单因素:单因素实验方差分析又称一元方差分析,它是讨论一种因素对实验结果有无显著影响。
                              均值:算数平均值
                              离差平方和 SS:离差平方和(Sum of Squares of Deviations)是各项与平均项之差的平方的总和。定义是设x是一个随机变量,令η=x-Ex, 则称 η为x的离差,它反映了x与其数学期望Ex的偏离程度。
                              自由度df:SST:dfT=n-1 SSA:df=r-1 SSe:df=n-r
                              均方 MS:均方是表示离差平方和与自由度之比。
                              F 检验:F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的方差 S^2,以确定他们的精密度是否有显著性差异。至于两组数据之间是否存在系统误差,则在进行F检验并确定它们的精密度没有显著性差异之后,再进行t检验。
                              P值:P值指的是,比较两者(结果)的差异是由偶然误差(机遇)所致的可能性大小。
                              3.绝对误差是统计学中的一个量。它等于置信区间的一半。在置信区间和置信区间长度已知的情况下需要求取样的数量时绝对误差起一个非常重要的作用。绝对误差Δμ = zσX标志着一个估计的精确度。
                              相对误差指的是测量所造成的绝对误差与被测量(约定)真值之比乘以100%所得的数值,以百分数表示。一般来说,相对误差更能反映测量的可信程度。设测量结果y减去被测量约定真值t,所得的误差或绝对误差为Δ。将绝对误差Δ除以约定真值t即可求得相对误差。相对误差= 绝对误差÷真值。为绝对误差与真值的比值(可以用百分比、千分比、百万分比表示,但常以百分比表示)。一般来说,相对误差更能反映测量的可信程度。
                              标准误差(Standarderror),也称均方根误差(Root mean squared error)。标准误差是指在抽样试验(或重复的等精度测量)中,常用到样本平均数的标准差。注意:标准差与标准误差,计算公式类似,但是是两个不同的概念。


                              17楼2020-11-18 20:55
                              回复