当前位置首页 > 高等教育 > 大学课件/教案
搜柄,搜必应! 快速导航 | 使用教程  [会员中心]

统计基础知识第一讲.ppt

文档格式:PPT| 51 页|大小 1.81MB|积分 15|2020-08-10 发布|文档ID:15451339
第1页
下载文档到电脑,查找使用更方便 还剩页未读,继续阅读>>
1 / 51
此文档下载收益归作者所有 下载文档
  • 版权提示
  • 文本预览
  • 常见问题
  • 统计基础知识,2008年3月,统计学定义 统计方法的分类 统计方法的用途 概率基础知识 数据的分类 随机变量分布的均值、方差与标准差 常用的分布,3,为什么要学习统计知识,6 六西格玛重要理念: 依据数据决策 以数据和事实作为驱动,4,DMAIC是6管理的核心,返回目录,六西格玛五大步骤:,定义:确定影响客户满意度的关键因素SWOT分析、KANO分析、流程图 测量:收集整理数据随机抽样 分析:找出存在问题的根本原因柏拉图、直方图、假设检验 改进:优化工作流程回归分析、相关分析、试验设计 控制:将主要变量的偏差控制在许可范围内 SPC,5,6管理策略是建立在统计思想与方法基础上的现代管理方法,流程,数据,,,统计分析,,,6管理,,,返回目录,六西格玛管理离不开统计学,评估、改进和控制公司的流程,6,1统计学定义,最早定义:统计学是关于数字资料收集、组织、分析与解释的科学归类为数学中国大百科全书:统计学是一门社会经济科学归类为经济学大英百科全书:统计学是根据数据进行推断的艺术和科学,统计学是研究客观事物数量关系和数量特征的方法论科学7,2 统计方法的分类,按统计方法的构成来分类,统计方法,按统计方法研究与应用来分类,描述统计方法 是对统计数据进行整 理和描述的方法,推断统计方法 研究如何根据样本数 据去推断总体数量特 征的方法,理论统计方法 统计方法的数学原理 与数学理论,应用统计方法 研究如何应用统计方 法去解决实际问题,,,,,,,,8,1. 提供表示事物特征的数据;(平均值、中位数、标准偏差、方差、极差) 2. 比较两事物的差异;(假设检验、显著性检验、方差分析、水平对比法) 3. 分析影响事物变化的因素; (因果图、调查表、散布图、树图、方差分析) 4. 分析事物之间的相互关系; (散布图、试验设计法) 5.研究取样和试验方法,确定合理的试验方案;(抽样方法、抽样检验、试验设计、可靠性试验) 6.发现质量问题,分析和掌握质量数据的分布状况和动态变化;(频数直方图、控制图、排列图) 7.描述质量形成过程。

    流程图、控制图),,3 统计方法的用途,9,必然事件:当给定一组所需要的条件后,所发生的结果是必然的 不可能事件:在一定条件下一定不发生的事件 随机事件:当给定一组所需要的条件后,所发生的结果是不确定的 例如:质量控制、掷骰子,波动的产生是很自然的,意料之中的,是统计学的基础,,,4 概率基础知识,,10,,概率是事件发生可能性大小的度量 概率的统计定义: 与事件A有关的试验是可以重复试验的; 若在n次重复试验中,事件A发生kn 次,则事件A发生的频率为 fn(A)= kn /n=事件A发生的次数/重复试验的次数 频率fn(A)将会随着重复试验次数的增加趋于稳定,这个频率的稳定值就是概率概率的定义,11,品质革新Team,21,6,,12,1、事件的包含和相等:设有事件及,如果发生, 那么B必发生,则称事件包含事件A,记为 或 , 如果事件包含事件,同时事件也包含事件,则 称事件与相等,记为,,、事件的和(并):事件A与事件B,两事件至少有一个发生时, 这一事件称为事件与事件B的和或并,记作 或 类似地,可定义n个事件及无限个事件的和若几个事件 中 至少有一个发生,则称这一事件为 的和或并,记为 或,,,,,,,随机事件的关系,13,事件的积(交):两事件A与B同时发生,称这事件 为事件A与事件B的积或交,记为 或 类似地,可定义n个事件及可列无限个事件的积。

    . 事件的差:事件A 发生而事件B不发生,这一事件称为 事件A与事件B的差,记为 A B 5对立事件: 事件A不发生的事件称为A的对立(或逆) 事件,记作, 6. 互不相容(互斥) 事件: 若两事件A与B不能同时发生, 则称事件A与事件B是互不相容的或互斥的, 记为 AB= 或 AB=,,14,减法公式:若A B,则P(A-B)=P(A)-P(B) 加法公式:P(A+B)=P(A)+P(B) P(AB) 当事件A与事件B互不相容时, P(A+B)=P(A)+P(B),概率的相关公式,统计07年460钢筋性能合格情况,有0.07%是抗拉强度不合导致的性能不合,有0.12%是弯曲不合导致的,抗拉强度与弯曲同不时合占0.01%,问07年460钢筋性能不合的概率有多少?,设事件A为“抗拉强度不合”,事件B为“弯曲不合”,性能不合A+B, P(A+B)=P(A)+P(B)P(AB)=0.07%+0.12%-0.01%=0.18%,15,条件概率:P(AB)=P(AB)/P(B),例:乌龟的寿命表,记事件Ax=“乌龟能活到x岁”,问已活到20岁的乌龟能活到80岁的概率是多少?,P(A80A20)=P(A80 A20)/P( A20)=P(A80)/P(A20)=0.87/0.92=0.95,16,乘法公式: P(AB)= P(AB)P(A)=P(BA)P(B) 当事件A与事件B相互独立, P(AB)= P(A)P(B),10件产品中,有8件正品,2件次品,问: (1)某检验员从10件产品中依次抽取了两件,两件都是次品的概率是多少? (2)甲乙两位实习检验员各自独立从这10件产品中抽取一件产品进行检测,且抽取后皆放回,两位检验员都抽到次品的概率是多少?,设事件A1为“某检验员第一次抽到的是次品“,事件A2为”第二次抽到的是次品”。

    事件B1为“甲检验员抽到的是次品“,事件B2为“乙检验员抽到的是次品” P(A1)=0.2,P(A2A1)=1/9 P(A1A2)=P(A1)P(A2A1)=0.2(1/9) P(B1)=0.2,P(B2B1)=P(B2)=0.2 P(B1B2)=P(B1)P(B2)=0.04,17,5 数据的分类,按连续性分类: 连续随机变量(连续随机数据) 离散随机变量(离散随机数据),6,,18,,,连续数据以参数的形式,说明一个产品或过程的特性测量标准可以有意义地不断分割,使精确度提高 计量数据 正态分布,5 数据的分类(续),重量,温度,时间,容积,19,,,离散数据不能更进一步精确地细分离散数据是不能连续取值的,或者说即使使用测量工具也得不到小数点以下数值,而只能得到0或1,2,3等自然数的这类数据发生或未发生的次数,地区事故、班次计数数据,地区,亮和不亮,5 数据的分类(续),20,计数数据为记件数据和记点数据 记件数据是指按件计数的数据,如S超标的炉数、彩色电视机台数、质量检测项目数等; 记点数据是指按缺项点(项)计数的数据,如疵点数、砂眼数、某操作系统发生的故障数、单位(产品)缺陷数等。

    5数据的分类(续),记件数据一般服从二项式分布,记点数据一般服从泊松分布21,,,请在下面的例子旁,写出它是“连续”还是“离散”,1 销售订单准确度 2 数据输入准确度 3 某厂发生的事故次数 4 使用“合格/不合格”测量仪器得到的孔径 5 使用游标卡尺测量孔径 6 应答中心对话时间 7 制冷氟利昂的重量(克) 8 加热炉出现的故障数 9 钢材的碳含量,练习题,22,,,A说:昨天晚上我和3个平均年龄只有24岁的小姐约会 B说:哇!!羡慕死啊!羡慕死啊! A说:一点也不,年龄差距太大,一点也不起劲 B说:还好吧,你也才28岁而已!,6 随机变量分布的均值、方差与标准差,23,离散随机变量分布可用分布列表示 X 1 2 n P p1 p2 pn,任何一个离散型随机变量的概率分布一定满足性质:,,,24,例:掷两颗骰子,出现的点数有,设表示“掷两颗骰子,点出现的个数”,分布列为:,设表示“掷两颗骰子,出现的点数之和”,分布列为:,,25,均值的计算方法,26,方差和标准差的计算方法,27,例:离散分布 掷两颗骰子,出现的点数之和的均值、方差和标准差:,例,28,,1.常用的离散分布: 二项分布 泊松分布 超几何分布,7 常用的分布,2.常用的连续分布 正态分布 均匀分布 指数分布 对数正态分布,29,正态分布,一般,属于计量数据的特性值服从正态分布。

    (1)正态分布的曲线,30,,,其中: -

    如果目标值(T)和规格上下限(USL or LSL)距离是标准偏差的3倍的话,说明具备了3Sigma的工序能力(三西格玛水平)工序能力Z值的测定方法,对应于过程输出无偏移的情况,西格玛水平Z0,考虑到1.5的偏移,西格玛水平Z可由下列公式求得: ZZ0+1.5,对于单边规范,Z0为上述中合适的一个 对于双边规范,Z0为与出现缺陷的总概率 相对应的Z值,可从正态表中查到Six Sigma就是 过程能力Z值等于6,,,P(d),41,Z 作为一种能力的尺度,,z,,,随着偏差减小, 出现缺陷 的概率降低, 所以,能力提高我们希望: 小 z大,,,42,,,,,,,,,,LSL,USL,,,PL,Pu,,产品特性缺陷率,其中PL为X低于下规范线的概率, Pu为X高于上规范线的概率,缺陷率的计算,43,,计算 Z 值需要 4 个条件: 1) 平均值Mean 2) 标准偏差 3) 规范 (单边 或 双边) 4) 正态分布的假定 (那么就可以使用正态表确定缺陷率) 例子 (单边规范极限): 等候服务台回答你的电话的平均时间为5分钟. 标准偏差为2.06分钟. 规范是小于或等于7分钟. 缺陷率和Z值各是多少? 1) 计算 Z 值: X = 5 Zusl = USL - X = 7 - 5 = 0.97 s = 2.06 s 2.06 USL = 7 2) 确定缺陷率 (超过7分钟才被回答的电话):,,单边规范,,44,Z 值大于0.97的概率是多少?,这表示, 电话超过7分钟才被回答的概率是0.166, 或者说, 缺陷率是0.166或16.6%. 该过程的 “sigma” 是多少? Z=.97 所以该过程是 0.97 sigma过程相对于我们的 6 sigma 目标不很好.,标准正态分布表,45,,例 (双边规范限): 处理客户的一个要求的平均时间为47天, 标准偏差为5天. 客户要求处理时间在40天和50天之间. 求: 该过程“sigma”值和 缺陷率. 1) 计算 Z 值: X = 47Zusl = USL - X = 50 - 47 = 0.6 s = 5 s 5 USL = 50 LSL = 40 Zlsl = LSL - X = 40 - 47 = -1.4 s 5 2) 确定缺陷率 (处理客户要求的时间少于40天并多于50天):,,,,双边规范,,46,查表, 得出超出规范上限和规范下限的概率: 规范上限: 规范下限:,超出规范的总的概率 = 超出规范下限的概率 + 超出规范上限的概率 超出规范的总的概率 = 0.274 + 0.0808 = 0.355 3) “sigma”值: 将概率转换为科学记数: 0.355 -- 3.55E-01 查表得到 Z 值:,Z= 0.37, 或者说, 该过程是 0.37 sigma 过程! 仍然.不很好, 相对于我们的 6 sigma 目标.,标准正态分布表,47,若质量特性值X服从正态分布,那么,在 3 范围内包含了99.73% 的质量特性值。

    规格区域,,1350ppm,,1350ppm,,,,3,3原理推理过程,48,,,,,,,,,,,,,,,,,,68.27%,,,,,,,,,,,,,95.45%,,,99.73%,,,99.9937%,99.99943%,99.9999998%,未考虑偏移的正态分布,49,考虑偏移1.5 的正态分布,,,,,,,规格中心,,分布中心,,,,,1.5,,,+/-3,,,+/-6,,0ppm,3.4ppm,,,66800ppm,,3.4ppm,50,当规格限为M+/-3 时(3质量水平时), 正态分布中心距USL只有1.5, 而距LSL有4.5,两侧的不各格率分别为:,当规格限为M+/-6 时(6质量水平时), 正态分布中心距USL只有4.5, 而距LSL有7.5,这时下侧的不合格品率几乎为0, 而上侧的不各格率分别为:,考虑偏移1.5 的正态分布,51,,,。

    点击阅读更多内容
    卖家[上传人]:maxianhui
    资质:实名认证