早在2016年,一台超级计算机就能够在一款名为围棋的复杂棋类游戏中击败世界冠军。这是怎么可能的?这是如何做到的?
这是通过使用一种被称为强化学习(reinforcement learning)的人工智能(AI)来实现的,即计算机在被输入基本指令后自行训练。计算机从错误中不断学习,并逐渐变得非常强大。
强化学习的主要缺点是它不能应用于某些实际应用,这是因为当计算机在训练自己的时候,他们倾向于尝试几乎任何事情,然后最终得到正确的道路。
对于某些应用领域,如气候控制系统,在这种情况下,温度的突然变化是无法忍受的,这种初步的试错阶段可能会很棘手。
开车前先学习驾驶手册
瑞士电子与微技术中心(CSEM)的工程师们设计了一种新的方法来解决这个问题。他们证明,计算机在被编程学习现实系统之前,可以先在高度简化的理论模型上进行训练。这意味着,当计算机在实际系统上开始机器学习过程时,它们可以利用之前在模型上所学的知识来解决需要解决的问题。
因此,计算机可以迅速地走上正确的道路,而不会经历一段时间的极端变化。研究人员的研究最近发表在《IEEE神经网络与学习系统汇刊》上。
这就像在开车前先学习一下驾驶手册。通过这一预先的训练步骤,计算机建立了一个可以利用的知识库,这样它们就不会在寻找正确答案时盲目地试错。
该项技术可以使能源消耗减少20%以上
CSEM的工程师们在一座有100个房间的多层建筑的供暖、通风和空调(HVAC)系统上采用三相程序测试了他们的方法。
这个团队最初用一个“虚拟模型”来教计算机,这个模型是根据基本方程建立的,这些方程近似地定义了建筑物的模型。然后,他们将真实的建筑数据(天气状况、温度、百叶窗打开的时间等)输入计算机程序,使机器的训练更加精确和具有针对性。最后,他们允许计算机运行其强化学习算法,以确定处理暖通空调系统的最佳方式。
广泛的应用
这项最新发现可能会为机器学习的新前景铺平道路,因为它将更多地用于工作参数变化大、安全性或财务成本高的应用领域。
1、本文由入驻智造人才网资讯专栏的作者撰写或者网上转载,观点仅代表作者本人,不代表智造人才网立场。如有侵权或者其他问题,请联系举报。
2、本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
3、如涉及作品内容、版权等问题,请在作品发布之日起一周内与本网联系,否则视为放弃相关权利。