首页> 外文会议>IEEE International Conference on Data Science and Advanced Analytics >Label, Segment, Featurize: A Cross Domain Framework for Prediction Engineering
【24h】

Label, Segment, Featurize: A Cross Domain Framework for Prediction Engineering

机译:标签,细分,特色化:用于预测工程的跨域框架

获取原文

摘要

In this paper, we introduce "prediction engineering" as a formal step in the predictive modeling process. We define a generalizable 3 part framework - Label, Segment, Featurize (L-S-F) - to address the growing demand for predictive models. The framework provides abstractions for data scientists to customize the process to unique prediction problems. We describe how to apply the L-S-F framework to characteristic problems in 2 domains and demonstrate an implementation over 5 unique prediction problems defined on a dataset of crowdfunding projects from DonorsChoose.org. The results demonstrate how the L-S-F framework complements existing tools to allow us to rapidly build and evaluate 26 distinct predictive models. L-S-F enables development of models that provide value to all parties involved (donors, teachers, and people running the platform).
机译:在本文中,我们将“预测工程”作为预测建模过程中的正式步骤进行介绍。我们定义了一个可概括的3部分框架-标签,分段,特征化(L-S-F)-以解决对预测模型不断增长的需求。该框架为数据科学家提供了抽象,以针对独特的预测问题定制流程。我们描述了如何将L-S-F框架应用于2个领域的特征性问题,并演示了在DonorsChoose.org的众筹项目数据集上定义的5个独特的预测问题的实现。结果表明,L-S-F框架如何补充现有工具,从而使我们能够快速构建和评估26种不同的预测模型。 L-S-F支持开发模型,为涉及的所有各方(捐助方,教师和运行平台的人员)提供价值。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号