半结构化数据
半结构化数据的相关文献在1998年到2022年内共计234篇,主要集中在自动化技术、计算机技术、信息与知识传播、预防医学、卫生学
等领域,其中期刊论文164篇、会议论文19篇、专利文献2863834篇;相关期刊104种,包括警察技术、河南科学、电脑知识与技术等;
相关会议14种,包括第四届工程建设计算机应用创新论坛、第二十二届中国数据库学术会议、全国第四届信息技术高级研讨会等;半结构化数据的相关文献由492位作者贡献,包括B·A·索维尔、M·A·沙赫、S·哈里佐保罗斯等。
半结构化数据—发文量
专利文献>
论文:2863834篇
占比:99.99%
总计:2864017篇
半结构化数据
-研究学者
- B·A·索维尔
- M·A·沙赫
- S·哈里佐保罗斯
- 陈恩红
- 刘振华
- 唐世渭
- 王能斌
- 王腾蛟
- 陈滢
- B·哈默施密特
- D·茨罗吉安尼斯
- N·宾科尔特
- 施伯乐
- 本诺特·戴奇维勒
- 杨冬青
- 瓦迪姆·安东诺夫
- 董逸生
- 吴共庆
- 张利军
- 李宁
- 王宁
- B·D·卡普兰
- D·特思罗吉安尼斯
- D·麦克马洪
- K·R·美亚
- N·A·宾克特
- 丁湘陵
- 万月亮
- 万谦
- 亚当·本杰明·塞林
- 付长冬
- 侯军伟
- 侯建卫
- 俞本权
- 关启盼
- 冯博琴
- 刘先锋
- 刘利民
- 刘均
- 刘芳
- 刘颖
- 卞信铨
- 叶飞跃
- 吕律
- 吴伟斌
- 吴蓓
- 周琦
- 周立柱
- 孙廷韬
- 孟小峰
-
-
赵小凡;
李情
-
-
摘要:
为了提升半结构化数据的安全转换能力、降低数据转换输出误码率(BER),提出基于元数据管理的半结构化数据安全转换方法。构建云存储动态半结构化数据的Hash编码模型,采用动态随机码元调制方法,分析云存储动态半结构化数据的参数统计特征量。采用模糊自相关融合调度方法,构建云存储动态半结构化数据的直觉模糊度对偶集。采用统计分析和概率密度特征采样的方法,构建云存储动态半结构化数据分簇聚类融合模型。采用元数据管理和参数模糊度辨识,实现半结构化数据安全转换和多属性群决策。根据分组交换的方法,实现云存储动态半结构化数据动态分析和聚类。结合信息聚类和自适应学习方法,实现半结构化数据安全转换和编码控制。仿真结果表明,采用该方法进行半结构化数据安全转换的准确性较高、数据输出误码率较低、融合性较好,提高了半结构化数据的安全传输能力。
-
-
张学青
-
-
摘要:
文章探讨了元数据仓储建设过程中非结构化数字资源的元数据抽取,为非结构化数字资源的深度利用提供借鉴。根据非结构化数字资源的特点,总结主流的可以用作元数据抽取的技术,分析其优缺点,阐述各自适应的场景。针对不同种类非结构化数字资源采取不同的抽取方法,并提出了总体的抽取思路与主要工作流程。
-
-
李巍;
廖雪花;
杨军
-
-
摘要:
为提高大数据时代半结构化数据集聚类分析效率,提出一种以数据集频繁子树模式为特征的半结构化数据集聚类方法。提出一种频繁子树模式挖掘方法FSTPMiner,使用“编码树”数据结构对半结构化数据进行编码,通过编码树将树结构频繁模式挖掘过程转化为线性表结构频繁模式挖掘,提高挖掘效率。使用频繁子树模式作为特征并构建特征向量空间,基于经典凝聚型层次聚类方法对半结构化文档数据集进行聚类。经过对照实验,与Costa算法、ICQB算法和Damalagas算法相比,在保证聚类结果正确率前提下,对半结构化数据集聚类效率方面具有优势。
-
-
陈豪
-
-
摘要:
为了开发自主可控路基设计软件,预研了一种路基横断面数据处理方法,研究首先分析了路基横断面数据处理问题,再对半结构化数据的处理方法进行了归纳,并以某路基横断面为例,按嵌套层次JSON数据方式建模并在MongoDB增删查改,最后得出结论:非关系数据库可以无阻抗匹配面向对象设计方法,并对各种繁杂多变的工程数据进行统一处理。
-
-
陈豪
-
-
摘要:
为了开发自主可控路基设计软件,预研了一种路基横断面数据处理方法,研究首先分析了路基横断面数据处理问题,再对半结构化数据的处理方法进行了归纳,并以某路基横断面为例,按嵌套层次JSON数据方式建模并在MongoDB增删查改,最后得出结论:非关系数据库可以无阻抗匹配面向对象设计方法,并对各种繁杂多变的工程数据进行统一处理.
-
-
施岭
-
-
摘要:
cqvip:数据安全现状分析在《数据安全法》体系之下,2019年至2021年金融行业发生多起事件,相关部门对数据安全下达多项指导意见和方针,金融机构应在可见的法律和规范内进行合规化建设,避免因某些无意识的操作而造成数据泄露,从而遭到处罚。金融行业数据存在四方面特性,一是存在形式多样式,包括结构化数据、半结构化数据、非结构化数据,二是动态流转复杂性,包括全生命周期动态流转、实际业务驱动数据动态流转,三是数据主体多样式,包括基础设备、数据中心、部门间和第三方机构,四是数据价值模糊性,包括数据确权问题、数据归属认责、数据价值准确评估。
-
-
孙学军;
李长银
-
-
摘要:
为了提高物联网通信大数据库的运行速度与处理效率,提出一种物联网通信大数据库半结构化数据识别方法,通过计算大数据库内数据的稀疏度系数与划分系数子空间,获得不同种类数据的关联特性,根据半结构化数据结构得到该其储存节点坐标,使用主成分分析和德尔菲算法融合集成转换为综合加权法,赋予识别半结构化数据得到指标权重,根据Tanimoto系数度量半1结构化数据的相似性并优化参数,实现识别大数据库内的半结构化数据.实验证明,通过所提识别方法处理后的数据重写率大幅度降低,且识别结果与真实结果差值较小,具有一定实际应用价值.
-
-
陈洞天;
汪火明
-
-
摘要:
目的:设计并实现一种可配置和可解析半结构化、高性能电子病历数据的病历质控系统。方法:通过对30条病历质控规则进行分析,设计通用的病历数据质控规则模型,并对两套技术栈解析半结构化文档的性能进行测试对比。基于规则模型和性能测试结果设计并实现病历数据质控系统。结果:病历数据质控规则具有良好的可配置性和扩展性,Node.js+Express+xml2js技术栈的半结构化病历数据解析性能远高于Java+J2EE+SAXParser技术栈,基于病历数据质控规则模型和较优的技术栈设计并实现了可配置、高性能的病历数据质控系统。结论:病历数据质控系统能避免规则变更等因素带来的开发和维护压力。采用Node.js解析半结构化电子病历数据比传统开发架构(J2EE)具有明显的性能优势。
-
-
-
余羊羊;
彭芳胜;
田华咏;
曾商禹;
郭维加;
张艺;
刘秀华
-
-
摘要:
目的 利用数据挖掘技术对半结构化数据的土家族医药进行品种规范和常用功效的可视化发现.方法 收集整理《中国民族药辞典》、《土家医方剂学》等土家族代表性医药文献,建立土家族医药原始数据库,包含药物拉丁学名、药用部位、性味、毒性、功效、主治疾病等.借助Visual FoxPro 9.0软件对土家族医药特性进行频次统计和品种规范,主要以法定标准收录;借助TCMISS(V2.5)、Cytoscape3.6.1、Gephi0.9.2等软件对土家药"药物-功效-主治"间的语义关系,进行功效挖掘和可视化展示.结果 筛选土家药共1453味,方剂共771首,其中土家药主要以"寒(凉)、平"性偏多,苦味药频次最高,其次是辛味药、甘味药;清热败毒、赶风除湿等功效出现频次最高;皮肤疮癣、妇科疾病等是关联程度较大的主治病症.结论 土家族医药的品种规范和"药性-药味-功效-主治"隐形关系可视化分析,可为完善土家药信息化研究奠定基础.
-
-
刘林霞;
张自强;
何安平
- 《2009年全国理论计算机科学学术年会》
| 2009年
-
摘要:
在Web迅猛发展和半结构化数据急剧膨胀的今天,Web上的半结构化数据查询日益成为信息技术领域一个重要的研究发展方向.现有的半结构化查询语言在查询效率上存在着不足.文章提出了一个将模型检测技术应用到半结构化数据查询的新方法,它通过把数据库看作Kripke状态变迁系统,把查询解释为时序逻辑CTL公式,将查询过程转化为模型对公式的满足问题,通过模型检测过程高效地完成数据查询,从而使查询可以在多项式时间内完成,很好地改善了查询效率.最后,给出了该方法在现有半结构化查询语言Lorel上的应用.
-
-
-
孙伟;
刘大昕;
张万松
- 《第二十二届中国数据库学术会议》
| 2005年
-
摘要:
1998年2月,W3C推出了可扩展标记语言XML.随着XML成为Web上进行半结构化数据表示和数据交换的标准,XML数据相关技术的研究成为热点.本文首先给出XML多值依赖的一个定义,定义中采用约束限制范围很好地解决了多值依赖的有效性与属性集范围有关的问题.在此基础上,转化为信息表,利用不可分辨关系对信息表细化,并给出多值依赖的判定定理.根据多值依赖的特点,提出发现多值依赖的两点规则,并给出一个新的有效发现最小非平凡多值依赖的算法.该算法依据规则,有效地减少了属性集的候选空间,有较好的效率.在XML文档集中自动发现最小多值依赖关系可广泛应用于XML模式规范化、XML的存储模式设计、查询优化等.
-
-
-
董峥;
徐晓飞;
战德臣
- 《2003中国计算机大会》
| 2003年
-
摘要:
提出了用半结构化数据模式来封装分布式数据源,以便利用XQuery语言来增强分布式系统的信息获取能力的思想.针对目前半结构化数据模式信息量不足,在模式分解时存在语义歧义问题,我们将ORASS模型引入到我们的研究中来.利用ORASS模型封装分布式数据源,同时采用该模型作为用户查询语义的采集手段.在此基础上,提出了一种分布式XML数据源的查询规划框架,给出其中若干关键操作的相应算法.
-
-
朱茂盛;
程雷;
赵章界
- 《中国科学院计算技术研究所第七届计算机科学与技术研究生学术讨论会》
| 2002年
-
摘要:
XML是一种典型的半结构化数据,它既能表示关系,对象等结构化的数据,也能表示Web这样的半结构,非结构的数据,在数据交换和集成中得到大量应用.关系数据是一种最常见的结构化数据,许多数据库厂商都提供了关系数据(〈-〉)XML映射中间件.本文研究了XML到关系数据库的映射算法以及在此基础上基于SAX的XML数据到关系数据库的导入算法.
-
-
YU Fangqiang;
余芳强;
ZHANG Jianping;
张建平;
LIU Qiang;
刘强;
ZHAO Wenzhong;
赵文忠
- 《第四届工程建设计算机应用创新论坛》
| 2013年
-
摘要:
近10年来,BIM技术得到快速发展,但现有技术和系统仍难以支持面向建筑全生命期的BIM数据的存储和交换.因此,本研究提出一种基于云计算的BIM数据集成与服务技术,采用NoSql型数据库Hbase实现海量BIM数据的分布式存储和虚拟集成,并支持统一的信息访问.本文着重介绍其中最重要的半结构化BIM数据库的概念模式和实现.该数据库通过有机结合IFC数据模型特性和Hbase的分布式存储等特点,避免了空间浪费以及复杂Join操作等问题.相对于已有BIM数据库,该数据库具有查询效率高、可扩展性好等优势,更适合存储和管理BIM数据,为分布式BIM数据集成与服务技术的实现奠定了良好基础,具有一定的使用价值和应用前景.
-
-
YU Fangqiang;
余芳强;
ZHANG Jianping;
张建平;
LIU Qiang;
刘强;
ZHAO Wenzhong;
赵文忠
- 《第四届工程建设计算机应用创新论坛》
| 2013年
-
摘要:
近10年来,BIM技术得到快速发展,但现有技术和系统仍难以支持面向建筑全生命期的BIM数据的存储和交换.因此,本研究提出一种基于云计算的BIM数据集成与服务技术,采用NoSql型数据库Hbase实现海量BIM数据的分布式存储和虚拟集成,并支持统一的信息访问.本文着重介绍其中最重要的半结构化BIM数据库的概念模式和实现.该数据库通过有机结合IFC数据模型特性和Hbase的分布式存储等特点,避免了空间浪费以及复杂Join操作等问题.相对于已有BIM数据库,该数据库具有查询效率高、可扩展性好等优势,更适合存储和管理BIM数据,为分布式BIM数据集成与服务技术的实现奠定了良好基础,具有一定的使用价值和应用前景.
-
-
YU Fangqiang;
余芳强;
ZHANG Jianping;
张建平;
LIU Qiang;
刘强;
ZHAO Wenzhong;
赵文忠
- 《第四届工程建设计算机应用创新论坛》
| 2013年
-
摘要:
近10年来,BIM技术得到快速发展,但现有技术和系统仍难以支持面向建筑全生命期的BIM数据的存储和交换.因此,本研究提出一种基于云计算的BIM数据集成与服务技术,采用NoSql型数据库Hbase实现海量BIM数据的分布式存储和虚拟集成,并支持统一的信息访问.本文着重介绍其中最重要的半结构化BIM数据库的概念模式和实现.该数据库通过有机结合IFC数据模型特性和Hbase的分布式存储等特点,避免了空间浪费以及复杂Join操作等问题.相对于已有BIM数据库,该数据库具有查询效率高、可扩展性好等优势,更适合存储和管理BIM数据,为分布式BIM数据集成与服务技术的实现奠定了良好基础,具有一定的使用价值和应用前景.
-
-
YU Fangqiang;
余芳强;
ZHANG Jianping;
张建平;
LIU Qiang;
刘强;
ZHAO Wenzhong;
赵文忠
- 《第四届工程建设计算机应用创新论坛》
| 2013年
-
摘要:
近10年来,BIM技术得到快速发展,但现有技术和系统仍难以支持面向建筑全生命期的BIM数据的存储和交换.因此,本研究提出一种基于云计算的BIM数据集成与服务技术,采用NoSql型数据库Hbase实现海量BIM数据的分布式存储和虚拟集成,并支持统一的信息访问.本文着重介绍其中最重要的半结构化BIM数据库的概念模式和实现.该数据库通过有机结合IFC数据模型特性和Hbase的分布式存储等特点,避免了空间浪费以及复杂Join操作等问题.相对于已有BIM数据库,该数据库具有查询效率高、可扩展性好等优势,更适合存储和管理BIM数据,为分布式BIM数据集成与服务技术的实现奠定了良好基础,具有一定的使用价值和应用前景.