首页> 中国专利> 一种基于Spark分布式数据挖掘算法封装与调参方法

一种基于Spark分布式数据挖掘算法封装与调参方法

摘要

本发明提供一种基于Spark分布式数据挖掘算法封装与调参方法,对spark机器学习算法抽象出四类通用参数,基于算法配置,完成抽象参数针对性赋值;根据数据存储、算法设置和应用场景,将同一种算法的数据输入参数、算法参数和算法输出参数设置为不同形式;将不同算法运行评估结果存储为算法执行结果表,对抽象参数不同赋值后,监控算法每次调用记录及其评估结果后自定义辅助输出;通过监控辅助输出对算法完成调参,获取运行效果。本发明将算法的调参与输入数据、硬件条件、软件环境相分离,通过配置完善算法实体;算法可自定义算法并将其封装打包,支持算法包及其信息的新增与修改;在算法打包时,对其输出结果进行自定义封装。

著录项

  • 公开/公告号CN115357583A

    专利类型发明专利

  • 公开/公告日2022-11-18

    原文格式PDF

  • 申请/专利权人 中电鸿信信息科技有限公司;

    申请/专利号CN202211017912.0

  • 申请日2022-08-24

  • 分类号G06F16/22;G06F16/2458;G06F16/27;G06F16/28;G06F9/50;G06N5/00;G06N20/00;

  • 代理机构南京钟山专利代理有限公司;

  • 代理人戴朝荣

  • 地址 210029 江苏省南京市鼓楼区汉中路268号

  • 入库时间 2023-06-19 17:38:41

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-11-18

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号