经典方法前提要求总结:1.随机抽样(样本之间相互独立);2.数据对称、无异常值;3.解释变量之间相关性不强;4.残差方差为常数;5.残差相互独立;6.残差与解释变量无关。 违背要求的解决方法:违背3、4、5条,引起多重共线性、异方差、自相关;违背2,引起模型敏感性,不耐抗;违背1,多层统计模型解决;违背6,技巧解决;否则,半参数解决。 探索性数据分析的实质:原本设想:只要严格假定成立,古典统计技术就是最好的办 法。后来,实践经验和理论研究使人们认识到:当实际场合偏离严格假定所描述的理想模型,古典统计技术就可能表现很差。新开发的稳健和探索性方法充实了统计分析的工具。探索性数据分析技术能帮助我们,以不那么正式的方式对付一组数据,直截了当把我们导向数据的结构。地道的统计实际工作者总是先详细察看数据,然后才提出总括统计量和假设检验。探索性数据分析提供丰富多采的详细考究一组数据的方法。它侧重先灵活探究数据,然后才把数据与概率模型作比较。稳健耐抗方法不是在一个狭窄定义场合的最好办法,而是对于广泛范围的各种场合的最好折衷办法;常常,对于其中每个场合都是接近“最好的”。无分布方法对所有可能的分布都一视同仁地看待;而稳健耐抗方法对于似乎合理可信的分布与不太合理可信的分布,是区别对待的。 本课程的内容由九部分构成,每部分的题目为:第一部分引言;第二部分茎叶图;第三部分字母值:一组当选的次序统计量;第四部分箱线图和批比较;第五部分变换数据;第六部分y对x的耐抗线;第七部分变用中位数分析双向表 ;第八部分考查残差 ;第九部分更精密的估计量的入门。