...
首页> 外文期刊>応用統計学 >アウトカム情報を利用した細菌データに対するノンパラメトリックべイズトピックモデル
【24h】

アウトカム情報を利用した細菌データに対するノンパラメトリックべイズトピックモデル

机译:使用结果信息的细菌数据的非参数贝叶斯主题模型

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

近年,細菌の検出数を示す16S rRNAデータを用いて,疾患等の臨床アウトカムと関連する菌種を特定する統計解析が広く行われるようになった.それに対応して解析手法も多く提案されるようになり,解析手法の一つとして潜在ディリクレ配分モデル(LDA)が用いられている.教師情報を利用したLDAとして,教師ありトピックモデル(SLDA)やディリクレ多項回帰モデルを伴うLDA(DMR)が提案されている一方で,それら手法は細菌データに対して応用されていないとともに,一定の割合を持つトピックが抽出されないことが多くある.これら問題に対処するため,本研究ではDMRを拡張したノンパラメトリックベイズトピックモデルを提案し,既存のDMRやSLDAと予測性能を比較評価した.ノンパラメトリックべイズモデルでは,潜在変数について無限の値を仮定し,各潜在クラスが占める割合に傾斜性を持たせることが可能となる.本研究では共変量値をもとに棒折り過程を生成する手法をトピックモデルに応用することで,共変量と関連するトピックを抽出するノンパラメトリックベイズトピックモデルを考案した.提案法について実際の細菌データに適用し性能を評価したところ,トピック割合が比較的大きくなおかつァゥトカムと関連するトピックが抽出されるとともに,アウトカムに対して既存の手法を上回る予測性能を持つことが示された.
机译:近年来,利用显示检测到的细菌数的16S rRNA数据,广泛地进行统计分析以鉴定与诸如疾病等临床结果相关的细菌种类,因此提出了许多分析方法。因此,潜在的Dirichlet分配模型(LDA)被用作分析方法之一,监督主题模型(SLDA)和具有Dirichlet多项式回归模型的LDA(DMR)被用作基于教师信息的LDA。虽然已经提出了这些方法,但是它们尚未应用于细菌数据,并且在许多情况下,没有提取到具有一定比例的主题。我们提出了一个参数贝叶斯主题模型,并与现有的DMR和SLDA进行比较并评估了预测性能。在非参数贝叶斯模型中,潜在变量被假定为无穷大,每个潜在类别的比例都有一个斜率。在这项研究中,我们设计了一种非参数贝叶斯主题模型,该模型通过将基于协变量值生成条形折叠过程的方法应用于主题模型来提取与协变量相关的主题。当该方法应用于实际细菌数据并评估其性能时,表明主题比率相对较大,提取了与结果相关的主题,结果的预测性能超过了现有方法。它是。

著录项

  • 来源
    《応用統計学》 |2019年第2期|1-16|共16页
  • 作者

    奥井 佑;

  • 作者单位

    九州大学病院;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号