...
首页> 外文期刊>電子情報通信学会論文誌, D. 情報·システム >日本語ウェブページを主観的か非主観的かに分類する分類器のジャンル領域拡大化能力の改善:実用的な分類器へ向けて
【24h】

日本語ウェブページを主観的か非主観的かに分類する分類器のジャンル領域拡大化能力の改善:実用的な分類器へ向けて

机译:提高分类器将日语网页分类为主观或非主观性的分类器的类型扩展能力:迈向实际分类器

获取原文
获取原文并翻译 | 示例
           

摘要

本論文では,機械学習法を利用して日本語ウェブページのセンチメント分類に取り組む.分類のためのカテゴリーは「主観的」と「非主観的」である.交差検定用データセットは,限られたジャンル群に分布する日本語ウェブページからなる.まず,交差検定用データセットをほぼ確実に分類する分類器を生成できることを示す.その分類器の実用性を評価するために,本論文ではジャンル領域拡大化能力という概念とジャンル領域拡大データセットを導入する.ジャンル領域拡大データセットは,交差検定用データセットを構成するジャンル群を含む,より多様なジャンル群に分布する日本語ウェブページからなるデータセットである.ジャンル領域拡大化能力は,交差検定用データセット上で訓練?生成された分類器がジャンル領域拡大データセットを分類する能力である.本論文では,交差検定用データセット上で訓練?生成された分類器のジャンル領域拡大化能力が,低いことを示す.一方で,分類器のジャンル領域拡大化能力を改善するための方法として,遺伝的アルゴリズムを利用したPOSフィルタリングに基づく素性選択法を提案し,その方法によって分類器のジャンル領域拡大化能力を改善でき,ある程度実用的とみなせる分類器を生成できることを示す.
机译:在本文中,我们将使用机器学习方法照顾日本的网页情绪分类。分类类别是“主观”和“非主观性”。交叉点数据集包括一个在有限类型组中分发的日语网页。首先,它表示几乎可靠地分类交叉数据集的分类器。为了评估分类器的实用性,本文介绍了扩展类型区域和流派扩大数据集的概念。流体区域放大数据集是由分布在更多样化的类型组中的日语网页组成的数据集,包括构成交叉点数据集的一组类型。流派区域扩展能力是训练生成的分类器对分类流体区域放大数据集的能力,以进行交叉测试的数据集。在本文中,表明在交叉点测试数据集上产生了生成的分类器的类型扩展能力。另一方面,作为提高分类器的类型扩展容量的方法,我们提出了一种基于POS滤波的装置选择方法,使用遗传算法,通过该方法提高分类器的类型扩展能力它表明A可以生成可以在一定程度上被认为是实际的分类器。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号