...
【24h】

格パターンの多様性に頑健な日本語格フレーム構築

机译:为各种案例模式构建强大的日语案例框架

获取原文
获取原文并翻译 | 示例
           

摘要

述語項構造のパターンである格フレームは構文·格解析,さらに照応·省略解析における重要な知識源である.従来の格フレーム構築の研究では,用例をクラスタリングして,述語の語義と格パターンの違いの両方をとらえようとしてきたが,格パターンの多様性に頑健ではないという問題があった.本稿では,用例を格の出現の仕方に基づいて3種類に分け,それぞれについて格フレームを構築してから最後に統合する手法を提案する.また,格パターンを正しく認識するために必要な格フレームの述語単位の定義と,可能動詞·サ変動詞の語彙の整備も行う.評価実験では,日本語ウェブテキスト40億文に対して提案手法を用いた格フレームを構築し,従来手法と比較して妥当な格フレームの割合が72.5%(145/200)から95.5%(191/200)に大きく改善したことを確認した.
机译:案例框架是谓词术语结构的一种模式,是语法/案例分析和匹配/缩写分析的重要知识来源。在传统的案例框架构建研究中,我们试图通过聚类示例来捕获谓词的含义和案例模式的差异,但是存在一个问题,即案例模式的多样性不够鲁棒。在本文中,我们提出了一种根据案例的出现方式将示例分为三类的方法,为每种案例构造案例框架,最后将它们集成在一起。另外,我们将定义正确识别案例模式所必需的案例框架的谓词单元,并准备可能动词和可变动词的词汇。在评估实验中,使用提出的方法为40亿个日语Web文本构建了一个案例框架,与常规方法相比,适当案例框架的比例为72.5%(145/200)对95.5%(191)。可以肯定的是,/ 200有显着改善。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号