首页> 外文期刊>応用統計学 >合否判定データによる判別分析の問題点
【24h】

合否判定データによる判別分析の問題点

机译:基于通过/失败判断数据的判别分析问题

获取原文
获取原文并翻译 | 示例
           

摘要

本稿では,マークセンス試験データを用いて判別分析の問題点を議論する.rn試験は10択100問である.正解と不正解を1/0の備に変換し,自明な線形分離可rn能な合否判定の2群判別の説明変数として用いる.また中間試験は9項目,期末試rn験は6項目の設問群の合計得点を説明変数として判別分析する.rnフィッシャーの線形判別関数(LDF),二次判別関数とロジスティック回帰分析を,rn誤分類数最小化(MNM)基準による最適線形判別関数(改定IP-OLDF)と比較する.rn100個の説明変数の判別では次の問題点が発見された.逐次変数選択法は28変数rnから54変数を選んだが,改定IP-OLDFは6変数から32変数で線形分離可能であrnる.また二次判別関数は一方の群の全員が誤分類されることがある.線形分離可能rnな場合,ロジスティック回帰の係数の推定値は不安定になった.9変数と6変数のrn判別では,改定IP-OLDFでは合否判定できるが,LDFと二次判別関数は合否判定rnできなかった.ロジスティック回帰分析は合否判定できたがロジスティック回帰係rn数は必ず不安定になった.%In this paper, we discuss problems of discriminant analysis by mark sense test data. The test consists of 100 questions with 10 choices. The correct or incorrect answers are converted to 1/0 values. Therefore, this data is the discrimination of two groups (pass and fail) with 100 independent variables x_i. And 100 questions are summarized in six or nine sub-total scores.rnTwo groups are trivial linear separable data. Linear discriminant function such as y = f(x) = Score(Σ_ix_i) - pass/fail score. If y ≥ 0, students pass the examination. Otherwise, students don't pass. Therefore, the number of misclassification by this linear discriminant function is 0.rnFisher's linear discriminant function (LDF), quadratic discriminant function and logistic regression are compared with optimal linear discriminant function (Revised IP-OLDF) based on MNM (Minimum number of misclassifications) criterion by these data.rnIn the cases of 100 independent variables discrimination, the following problems are found. The stepwise variable selection methods chose over 28 independent variables, nevertheless Revised IP-OLDF find that these data is linear separable less than 12 independent variables. In some cases, quadratic discriminant function misclassified all pass/fail students to other group. The standard error of coefficients of logistic regression becomes very big.rnIn the cases of summarized sub-total scores discrimination, the number of misclassifications of LDF, quadratic discriminant function are mostly greater than 0, nevertheless MNM of Revised IP-OLDF are 0.
机译:在本文中,我们讨论了使用标记感测验数据进行判别分析的问题。 rn测试在10个选择中有100个问题。正确和不正确的答案将转换为1/0,并用作解释线性平分性的两组判别的解释变量。此外,判别分析以问题组的总分作为解释变量,该总分由中期考试的9个项目和期末考试的6个项目组成。将Fisher线性判别函数(LDF),二次判别函数和logistic回归分析与具有最小误分类最小化(MNM)准则的最佳线性判别函数(修订的IP-OLDF)进行比较。在区分100个解释变量时发现以下问题。在顺序变量选择方法中,从28个变量rn中选择了54个变量,但是修改后的IP-OLDF可线性地从6个变量分离为32个变量。同样,在二次判别函数中,一组的所有成员可能会被错误分类。当线性可分rn时,逻辑回归系数估计值不稳定。在9变量和6变量rn判别中,修改后的IP-OLDF可以做出通过/失败判断,但是LDF和二次判别函数无法做出通过/失败判断。尽管逻辑回归分析能够做出通过/失败判断,但逻辑回归系数rn始终不稳定。本文通过标记感测试数据讨论判别分析的问题,该测试由100个问题和10个选择组成,正确或不正确的答案被转换为1/0值,该数据是两组的判别力(合格与不合格)有100个独立变量x_i。六个或九个小计的分数汇总了100个问题.rn两组是琐碎的线性可分离数据。线性判别函数,例如y = f(x)=分数(Σ_ix_i)-通过/不及格分数。如果y≥0,则学生通过考试;否则,则学生不通过。那里,该线性判别函数的错误分类数为0.rnFisher的线性判别函数(LDF),二次判别函数和逻辑通过这些数据,将回归与基于MNM(最小错误分类数)准则的最佳线性判别函数(修订的IP-OLDF)进行比较。rn在进行100个自变量判别的情况下,存在以下问题逐步变量选择方法选择了28个以上的自变量,但是IP-OLDF修订版发现这些数据是线性可分离的,少于12个自变量,在某些情况下,二次判别函数将所有合格/不合格学生错误地分类为另一组。 logistic回归系数的误差变得很大。在汇总小计分数歧视的情况下,LDF的错误分类数量,二次判别函数大多大于0,而经过修订的IP-OLDF的MNM为0。

著录项

  • 来源
    《応用統計学》 |2011年第3期|p.157-172|共16页
  • 作者

    新村秀一;

  • 作者单位

    成蹊大学経済学部 〒180-8633 東京都武蔵野市吉祥寺北町3-3-1;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号