您现在的位置: 首页> 研究主题> 离群数据

离群数据

离群数据的相关文献在1983年到2022年内共计117篇,主要集中在自动化技术、计算机技术、财政、金融、建筑科学 等领域,其中期刊论文90篇、会议论文7篇、专利文献544794篇;相关期刊62种,包括情报杂志、太原科技大学学报、传感技术学报等; 相关会议7种,包括中国药学会药物检测质量管理专业委员会成立大会暨药物检测质量管理学术研讨会、全国第18届计算机技术与应用学术会议(CACIS)、第二十三届中国数据库学术会议(NDBC2006)等;离群数据的相关文献由206位作者贡献,包括张继福、徐雪松、蔡江辉等。

离群数据—发文量

期刊论文>

论文:90 占比:0.02%

会议论文>

论文:7 占比:0.00%

专利文献>

论文:544794 占比:99.98%

总计:544891篇

离群数据—发文趋势图

离群数据

-研究学者

  • 张继福
  • 徐雪松
  • 蔡江辉
  • 刘凤玉
  • 付兴旺
  • 刘学军
  • 史东辉
  • 吴楠
  • 张宏
  • 韦鹏
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 赵向兵; 张天刚
    • 摘要: 为了提高离群数据检测精度和效率,提出了一种基于相关子空间的离群数据检测算法。该算法首先根据数据局部密度分布特征得出稀疏度矩阵,通过高斯相似核函数放大稀疏度特征;然后计算各属性维中数据稀疏度相似因子,确定子空间向量及相关子空间,结合数据稀疏度和维度权值得出数据对象的离群因子,选取最大的若干个对象为离群数据;最后采用人工数据集和UCI实验数据集验证算法准确性和有效性。
    • 程雅琼
    • 摘要: 在对高维光谱数据集中的离群数据进行分类和挖掘时,由于传统基于逆k近邻计数的挖掘方法在应用中极易受到宇宙背景噪声、光线衰弱等因素影响,使得成功挖掘出的离群数据点数量少,最终会严重影响挖掘精度。针对这一问题,在引入双区块链结构的基础上,开展高维光谱离群数据挖掘方法设计研究。通过基于双区块链结构的高维光谱数据获取、高维光谱数据离群点检测、基于离群分数的三元组挖掘样本选择和高维光谱离群数据分离,提出一种全新的挖掘方法。通过实验证明,新的挖掘方法可有效解决上述问题,促进挖掘精度的不断提升。
    • 钟耀霞; 程建斌; 项正山
    • 摘要: 离群数据具有分散性特点,对其聚类容易出现节点失联的情况,导致传感网络局部离群数据聚类精准度不高.提出一种基于核PP主成分分析的离群数据动态聚类算法.首先利用非规则模型表示传感网络中节点分布状态,计算参数区域差异度,通过邻域分割方法改善网络节点分散性问题,避免发生空间失联节点定位不准情况,了解传感网络内是否拥有离群节点;其次使用离群约简及离群数据关键属性域子空间分析方法,明确离群数据产生来源及含义,为实现离群数据动态聚类提供帮助;最后运用核PP主成分转换进行数据维数消减,得到对应非线性矢量,在模糊C-均值算法基础上获取每个数据权值,完成局部离群数据动态精准聚类.仿真结果表明,所提方法具备较高的聚类精准度,运算时间短,具有良好的鲁棒性.
    • 陈凤
    • 摘要: 对复杂网络数据信息传输的稳定性检测,能够有效保障网络的稳定运行.对信息传输稳定性的检测,需要获取各个数据对象与其邻域的加权距离,计算出每个数据对象的离群度量值,完成对数据信息传输稳定性的检测.传统方法计算出数据集的属性个数,获取每条数据记录的离群度,但忽略了计算出每个数据对象的离群度量值,导致检测精度偏低.提出基于密度的复杂网络数据信息传输稳定性检测方法.将网络整体的数据分布状态划分为不同类型的区间,描述网络信息组,对网络各个区域的数据流密度进行划分,给出稠密网格的区域,利用空间属性及其空间关系确定不同数据密度空间邻域,获取各个数据对象与其邻域的加权距离,计算出每个数据对象的离群度量值,完成对复杂网络数据信息传输稳定性检测.仿真证明,所提方法数据检测精度高,为提升和保障网络的稳定运行奠定了基础.%A stability detection method for data information transmission of complex networks is proposed based on density.Firstly,the holistic data distribution of the network is divided into different types of intervals,and the network information group is described,and then the data flow density of each region of the network is partitioned to dense grid regions.Secondly,spatial attributes and their spatial relations are utilized to determine the spatial neighborhood of different data densities to obtain weighted distance between each data object and its neighborhood.Finally,the outlier metric of each data object is calculated to complete the stability detection for data information transmission of complex networks.The simulation results show that the method has high detection accuracy.It can promote and guarantee stable operation of network.
    • 孙晓琳; 姚波; 陈瑜
    • 摘要: 大数据背景下选择有用信息能帮助企业更准确地分类客户,离群数据同样包含重要的客户信息.为了研究了基于客户资产离群数据的客户分类问题,构建了基于客户资产离群数据分析的客户分类模型,该模型根据交易频率、交易的产品或服务的种类、交易金额以及客户年龄这4个维度的变量,采用先聚类再分类的方法,最终把25类离群客户数据按照客户资产分为4大类,针对不同离群客户分类提出相应的营销策略,并应用某公司的客户数据进行了实证分析.
    • 杨海峰; 蔡江辉; 张继福; 罗阿理; 赵旭俊; 杨雨晴
    • 摘要: LAMOST regular survey has successfully observed more than 100,000 galaxy spectra,which provides important data for mining the precious and rare objects to improve the existing theories.In this paper,the s pectrum J140242.45+092049.8 is particularly chosen from LAMOST DR3 by using the outlier mining me thod based on the relevant subspaceand intensively discussed these rare characte ristics respectively.First of all,the dual-redshift system (absorption syst em:z1=0.020 95,emission system:z2=0.069 5) are measured and identified by fuzzilyrecognizing the characteristics lines and cross matching th e information of the homologous spectrum observed with SDSS.As a whole,the Δz=0.048,which is far greater than the physical interacting threshold (Δz<0.008) provided with Keel,indicating that they are superimposed in the l ight of sight rather than physical interacting occurring between the foreground galaxy and background one,and the possibility of lens for such "absorption+emi ss ion" mode dual-redshift spectrum is illuminated by studying the availableliter ature and analyzing the image feature provided with SDSS.For the foreground ga la xy (absorption system),the strong Balmer absorption lines and iron lines appea red simultaneouslyin the spectrumimplies that this object will be most likely be E+A galaxy.For the background galaxy (emission system),the characteristic of do uble peak emission lines is analyzed and the strange relationship between the em ission lines is also discussed in the end.%LAMOST巡天已获取超过100 000条星系光谱,为探索珍贵、稀有的天体从而完善现有科学理论提供了重要的数据条件. 研究采用基于相关子空间的离群挖掘方法,从LAMOST DR3星系光谱数据中获得的离群数据挖掘结果中,针对呈现出多种稀有特征的光谱J140242.45+092049.8进行了深入分析. 首先利用特征光谱线进行红移测量并交叉SDSS同源光谱提供的红移信息,测量并证认了该光谱的两套红移系统: 吸收线系统z1=0.020 95、发射线系统z2=0.069 5. 从整体上,通过交叉现有文献及SDSS图像特征,分析了该"吸收+发射"模式的双红移系统属于透镜星系的可能性,而红移间隔Δz=0.048远大于Ke el指出的双星系具有物理关系的临界0.008,意味着该目标前景与背景星系之间只是视向重叠,即视向星系对,没有相互的物理作用;对于前景星系(吸收线系统),通过测量光谱中呈现的特殊的特征线强度,分析了属于E+A星系的可能性;对于背景星系(发射线系统)光谱中呈现的双峰特征,分析了该光谱来自双峰发射线星系的可能性;此外,初步分析了该光谱中背景星系发射线强度关系异常的原因.
    • 杨海峰; 于晓龙; 荀亚玲; 张继福
    • 摘要: 目前,对于离群数据挖掘算法研究颇多,但对于离群数据挖掘结果可理解性和可解释性的研究相对较少.采用相关子空间,给出一种MapReduce编程模型下的上下文离群数据挖掘算法.该算法利用局部稀疏差异度,确定相关子空间,并计算其数据对象离群因子值;将离群因子和相关属性维,定义为数据对象的上下文信息,提高了数据对象的可理解性;选取离群因子最大的N个数据对象,作为上下文离群数据;利用MapReduce编程模型,实现了一种上下文离群数据并行挖掘算法;最后,采用UCI数据集,实验验证了该算法的可解释性和有效性.
    • 刘忠宝; 赵文娟
    • 摘要: It’s one of the main goals in universe exploration to find unknown and special celestial bodies .The spectra outlier data is analyzed based on the traditional classification approaches ,which is a general method of special celestial body exploration .But it’s depressed that many traditional classification approaches are insensitive to the outlier data ,which even influence the classifi‐cation efficiencies ,therefore ,these methods can’t accomplish the task of special celestial body exploration .In view of this , Fuzzy Large Margin and Minimum Ball Classification Model (FLM‐MBC) is proposed in this paper .In FLM‐MBC ,part of gen‐eral data and outlier data are trained to construct the minimum ball model and the fuzzy technique is introduced to reduce the noise influence to classification .Comparative experiments with C‐SVM ,KNN ,and SVDD on the SDSS spectral datasets verify the effectiveness of the proposed FLM‐MBC .%由于人类对宇宙的认识有限,因此,如何通过对光谱数据分析发现一些新的、特殊的天体成为天文学家面临的重要课题。目前,常见特殊天体发现方法的基本思想是利用智能分类算法对离群数据进行分析。然而,当前主流分类算法大多对离群数据不敏感,分类性能甚至受离群点影响较大,因而无法完成特殊天体发现任务。鉴于此,提出基于模糊大间隔最小球分类模型的离群数据挖掘方法,该方法利用部分一般样本和离群样本建立最小球模型,并在此基础上引入模糊技术,通过降低噪声的权重,尽量减少噪声的影响。与C‐SVM ,SVDD ,KNN等传统分类方法在SDSS恒星光谱数据集上的比较实验表明所提方法的有效性。
    • 吕圣军; 赵建锋; 桂婷
    • 摘要: 针对房产销售困难问题,提出了采用离群数据挖掘技术从客户信息集中提取隐含知识的方案,该方案具有效率高、成本低的特点.方案利用LOF挖掘算法发现现有客户集中具有潜在购房意向者,并对试验结果质量进行评价.算例结果验证了方案的可行性.
    • 吕圣军12; 赵建锋1; 桂婷1
    • 摘要: 针对房产销售困难问题,提出了采用离群数据挖堀技术从客户信息集中提取隐含知识的方案,该方案具有效率高、成本低的特点。方案利用LOF挖掘算法发现现有客户集中具有潜在购房意向者,并对试验结果质量进行评价,算例结果验证了方案的可行性。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号