广西师范大学学报(自然科学版)

2022, v.40(03) 185-193

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

数据驱动的自动化机器学习流程生成方法
Data-driven Method for Automatic Machine Learning Pipeline Generation

陈高建;王菁;栗倩文;袁云静;曹嘉琛;

摘要(Abstract):

自动化机器学习是机器学习前沿的一个重要问题,自动化机器学习工具根据数据集及任务需求组合机器学习算子来构造流程,使领域用户在不具备专业机器学习知识的情况下也能完成相应数据分析工作,但目前的自动化机器学习工具普遍存在耗时长和精度低的问题。本文基于数据集相似性和强化学习原理,提出一种数据驱动的自动化机器学习流程的生成方法,利用相似数据集的历史知识,将神经网络与MCTS相结合,指导机器学习流程的生成。实验结果表明:该方法在耗时方面缩短至分钟级别,流程性能也得到提升。

关键词(KeyWords): AutoML;数据集相似性;MCTS;强化学习

Abstract:

Keywords:

基金项目(Foundation): 国家重点研发计划(2018YFB1402500);; 国家自然科学基金重点项目(61832004);国家自然科学基金国际(地区)合作与交流项目(62061136006)

作者(Authors): 陈高建;王菁;栗倩文;袁云静;曹嘉琛;

DOI: 10.16088/j.issn.1001-6600.2021071801

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享