文章摘要:组合在线学习问题研究如何在与环境的交互过程中学习未知参数,逐步找到最优的目标组合。该问题有丰富的应用场景,如广告投放、搜索和推荐等。首先阐述了组合在线学习问题的定义及其框架——组合多臂老虎机问题,归纳了此框架下的经典算法和研究进展,而后具体介绍了该问题的两个实际应用——在线影响力最大化和在线排序学习问题,以及其研究进展,最后展望了组合在线学习问题的未来研究方向。
文章关键词:组合多臂老虎机,在线学习,在线影响力最大化,在线排序学习,
项目基金:国家自然科学基金(No.62006151,No.62076161),
论文作者:孔芳1 杨悦然1 陈卫2 李帅1
作者单位:2. 微软亚洲研究院
论文分类号: TP181
相似文献:基于深度强化学习的装备组合运用方法.....作者:文东日,陈小虎,李文,杜二锋,刊载期刊:《指挥控制与仿真》基于组合建模技术的串行多阶段参数优化.....作者:肖甜丽,马义中,林成龙,刊载期刊:《工业工程与管理》改进蝙蝠算法柔性作业车间调度问题研究.....作者:李帆,高东,许欣,张玉良,刊载期刊:《计算机工程与应用》基于马尔可夫链的人工蜂群算法.....作者:郭佳,马朝斌,苗萌萌,张绍博,刊载期刊:《北京邮电大学学报》一类随机方差缩减算法的分析与改进.....作者:刘彦,郭田德,韩丛英,刊载期刊:《Science China Mathematics》基于随机替换和多样性控制的花朵授粉算法.....作者:崔丽群,张磊,郭相卓,张晨,刊载期刊:《计算机工程与应用》改进的蜻蜓算法及其在特征选择中的应用.....作者:王万良,朱凯莉,李伟琨,赵燕伟,介婧,刊载期刊:《计算机集成制造系统》蝙蝠算法研究及应用综述.....作者:许德刚,赵萍,刊载期刊:《计算机工程与应用》智能时代算法治理的合理性证成.....作者:苏令银,刊载期刊:《云南社会科学》一种基于等距度量学习策略的行人重识别改进算法.....作者:周智恒,刘楷怡,黄俊楚,陈增群,刊载期刊:《电子与信息学报》
相关文章:人工智能在智能制造中的应用.....作者:杨磊大数据人工智能驱动图书馆知识服务和学科建设.....作者:姜爱蓉商业航天背景下的遥感应用产业化.....作者:刘东升Artificial Intelligence: Where Maybe Next Steps? “人工智能热”之后的冷静思考.....作者:Tony QiuComputational Analysis of the Voynich Manuscript 十五世纪伏尼契码的智能解析.....作者:Greg Kondrak深度强化学习系列课程第四讲.....作者:汪荣贵北京二号遥感卫星星座及其应用服务.....作者:屈鸿钧第一讲:人工智能时代的刑事责任演变: 过去·现在·将来.....作者:刘宪权
文章来源:《探索科学》 网址: http://www.tskxzzs.cn/qikandaodu/2021/0901/2242.html
上一篇:
医药卫生方针政策与法律法规研究论文_某三级
下一篇:
有机化工论文_基于化工卓越人才培养的化工原