合否判定データによる判別分析の問題点

新村秀一

首页> 外文期刊>応用統計学 >合否判定データによる判別分析の問題点

【24h】

合否判定データによる判別分析の問題点

机译：基于通过/失败判断数据的判别分析问题

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本稿では，マークセンス試験データを用いて判別分析の問題点を議論する．rn試験は10択100問である．正解と不正解を1／0の備に変換し，自明な線形分離可rn能な合否判定の2群判別の説明変数として用いる．また中間試験は9項目，期末試rn験は6項目の設問群の合計得点を説明変数として判別分析する．rnフィッシャーの線形判別関数（LDF），二次判別関数とロジスティック回帰分析を，rn誤分類数最小化（MNM）基準による最適線形判別関数（改定IP-OLDF）と比較する．rn100個の説明変数の判別では次の問題点が発見された．逐次変数選択法は28変数rnから54変数を選んだが，改定IP-OLDFは6変数から32変数で線形分離可能であrnる．また二次判別関数は一方の群の全員が誤分類されることがある．線形分離可能rnな場合，ロジスティック回帰の係数の推定値は不安定になった．9変数と6変数のrn判別では，改定IP－OLDFでは合否判定できるが，LDFと二次判別関数は合否判定rnできなかった．ロジスティック回帰分析は合否判定できたがロジスティック回帰係rn数は必ず不安定になった．%In this paper, we discuss problems of discriminant analysis by mark sense test data. The test consists of 100 questions with 10 choices. The correct or incorrect answers are converted to 1/0 values. Therefore, this data is the discrimination of two groups (pass and fail) with 100 independent variables x_i. And 100 questions are summarized in six or nine sub-total scores.rnTwo groups are trivial linear separable data. Linear discriminant function such as y = f(x) = Score(Σ_ix_i) - pass/fail score. If y ≥ 0, students pass the examination. Otherwise, students don't pass. Therefore, the number of misclassification by this linear discriminant function is 0.rnFisher's linear discriminant function (LDF), quadratic discriminant function and logistic regression are compared with optimal linear discriminant function (Revised IP-OLDF) based on MNM (Minimum number of misclassifications) criterion by these data.rnIn the cases of 100 independent variables discrimination, the following problems are found. The stepwise variable selection methods chose over 28 independent variables, nevertheless Revised IP-OLDF find that these data is linear separable less than 12 independent variables. In some cases, quadratic discriminant function misclassified all pass/fail students to other group. The standard error of coefficients of logistic regression becomes very big.rnIn the cases of summarized sub-total scores discrimination, the number of misclassifications of LDF, quadratic discriminant function are mostly greater than 0, nevertheless MNM of Revised IP-OLDF are 0.

机译：在本文中，我们讨论了使用标记感测验数据进行判别分析的问题。 rn测试在10个选择中有100个问题。正确和不正确的答案将转换为1/0，并用作解释线性平分性的两组判别的解释变量。此外，判别分析以问题组的总分作为解释变量，该总分由中期考试的9个项目和期末考试的6个项目组成。将Fisher线性判别函数（LDF），二次判别函数和logistic回归分析与具有最小误分类最小化（MNM）准则的最佳线性判别函数（修订的IP-OLDF）进行比较。在区分100个解释变量时发现以下问题。在顺序变量选择方法中，从28个变量rn中选择了54个变量，但是修改后的IP-OLDF可线性地从6个变量分离为32个变量。同样，在二次判别函数中，一组的所有成员可能会被错误分类。当线性可分rn时，逻辑回归系数估计值不稳定。在9变量和6变量rn判别中，修改后的IP-OLDF可以做出通过/失败判断，但是LDF和二次判别函数无法做出通过/失败判断。尽管逻辑回归分析能够做出通过/失败判断，但逻辑回归系数rn始终不稳定。本文通过标记感测试数据讨论判别分析的问题，该测试由100个问题和10个选择组成，正确或不正确的答案被转换为1/0值，该数据是两组的判别力（合格与不合格）有100个独立变量x_i。六个或九个小计的分数汇总了100个问题.rn两组是琐碎的线性可分离数据。线性判别函数，例如y = f（x）=分数（Σ_ix_i）-通过/不及格分数。如果y≥0，则学生通过考试;否则，则学生不通过。那里，该线性判别函数的错误分类数为0.rnFisher的线性判别函数（LDF），二次判别函数和逻辑通过这些数据，将回归与基于MNM（最小错误分类数）准则的最佳线性判别函数（修订的IP-OLDF）进行比较。rn在进行100个自变量判别的情况下，存在以下问题逐步变量选择方法选择了28个以上的自变量，但是IP-OLDF修订版发现这些数据是线性可分离的，少于12个自变量，在某些情况下，二次判别函数将所有合格/不合格学生错误地分类为另一组。 logistic回归系数的误差变得很大。在汇总小计分数歧视的情况下，LDF的错误分类数量，二次判别函数大多大于0，而经过修订的IP-OLDF的MNM为0。

著录项

来源
《応用統計学》 |2011年第3期|p.157-172|共16页
作者
新村秀一;
展开▼
作者单位

成蹊大学経済学部〒180-8633 東京都武蔵野市吉祥寺北町3-3-1;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. 統合化顕在パターン判別モデルによる　Webアクセスログデータの分析 [J] . 羽室行信, 中西正雄, 山本昭二オペレ-ションズ·リサ-チ . 2008,第2期

机译：集成清单模式识别模型对Web访问日志数据的分析
2. 統合化顕在パターン判別モデルによる　Webアクセスログデータの分析 [J] . 羽室行信, 中西正雄, 山本昭二オペレ-ションズ·リサ-チ . 2008,第2期

机译：通过集成缺少模式确定模型分析Web访问日志数据
3. エッジ点の差分特徴を用いた判別分析による映像データからの漸次カット点検出法 [J] . 鈴木賢一郎, 坂野鋭, 大塚作一, 電子情報通信学会技術研究報告. パターン認識·メディア理解. Pattern Recognition and Media Understanding . 2003,第295期

机译：利用边缘点差异特征的判别分析从视频数据中逐步切入点检测方法
4. 3 次元レーザー測量による建築オブジェクトのモデリング手法に関する研究その2点群データ座標のクラスター分析による建築部材の抽出 [C] . 陳琳, 本間里見, 位寄和久, 日本建築学会(Architectural Institute of Japan);日本建築学会年度大会 . 2012

机译：基于3D激光测量的建筑对象建模方法研究；第二部分，通过点云数据坐标的聚类分析提取建筑构件。
5. LODデータセット生成の自動化のための宣言的記述による半構造化データの抽出とその統合手法 [D] . 豊田将平, /トヨタショウヘイ 2019

机译：通过声明性描述提取半结构化数据及其集成方法以自动生成LOD数据集
6. 障害児を育てる家族に対する看護実践モデル構築を目指した質的研究の統合 : 家族のノーマリゼーションを視点としたメタ研究による体系化 [O] . 佐藤奈保 2005

机译：定性研究的整合，旨在构建抚养残疾儿童家庭的护理实践模型：从家庭正常化的角度通过元研究进行系统化

合否判定データによる判別分析の問題点

摘要

著录项

相似文献

相关主题

期刊订阅