少样本学习或将解决AI数据难题
- +1 你赞过了
【雷竞技须安全稳定 网络频道】前言:近年来,深度学习发展如此迅猛,最为关键的因素是拥有海量的数据支撑。然而,在现实生活中,并没有那么多的数据可以去采集。因此,少样本学习成为了这几年来深度学习领域非常重要的一个前沿研究方向。近日,吴恩达在接受媒体采访时表示,目前人工智能技术取得了重大进展,可以用较少的数据得出准确的结论。他认为,第一波深度学习进展主要来自大公司,如果想构建语音识别系统,需要使用100,000个小时的数据进行训练,如今,他越来越多地看到在小数据上的结果,即使你有1000张照片,也产生了很好的结果。
深度学习如何突破数据瓶颈?
当前,深度学习取得了巨大成功,这是毋庸置疑的,而其中最为关键的因素就是利用大量的数据去驱动模型训练,使其获得良好的效果。但是,拥有大数据的企业毕竟是少数,很多其他企业并没有那么多的数据可以去采集,而且无限制的获取用户信息的渠道,必然会侵犯到个人隐私,甚至是涉及保密、法律的问题,而挖掘已有的用户信息,数据量往往是不够的。
近日,美国媒体VentureBeat采访了包括吴恩达、Yann Lecun在内的四位人工智能领域权威学者,询问了他们对于2018年人工智能领域发展的看法,以及他们认为2019年人工智能和机器学习可能产生的突破。
其中,吴恩达谈到了自己对2019年人工智能和机器学习发展趋势的总体展望。他表示,在新的一年,人工智能(AI)和机器学习(ML)研究中有两个特定领域的进步将有助于推动整个领域的发展。此外,他还指出,目前人工智能技术取得了重大进展,可以用较少的数据得出准确的结论,有人称其为“少样本学习(Few-Shot Learning)”。他认为,第一波深度学习进展主要来自大公司,他们有大量的数据训练非常大的神经网络,因此,如果想构建语音识别系统,需要用100,000个小时的数据进行训练。想培训机器翻译系统?用平行语料库的大量句子训练它,这会产生很多突破性的结果。而如今,尝试用小量数据变得越来越多,比如1000张图像,也产生了很好的结果。
吴恩达——人工智能和机器学习领域国际最权威学者之一
对于自身就拥有海量数据的科技巨头来说,数据量越大就能做出越好的人工智能产品,这些企业又能吸引更多的用户贡献数据,如此循环,就会形成一些数据垄断。如今,少样本学习的出现,正打破数据的壁垒,为初创企业提供机会。
什么是少样本学习?
那么,什么是少样本学习呢?少样本学习研究的就是如何从少量样本中去学习。对于人类而言,在识别物体的时候,仅需要少量图像或者无需图像,而通过对物体的描述信息就能基于以往的经验实现对物体的识别,为什么我们人类能够快速学习到未知的事物呢?
这是因为人类天生的思考能力以及生活中各种知识的积累。天生的思考能力意味着强大的大脑算力,知识的积累意味着人类会利用自己的先验知识来进行学习。所谓先验知识,指的是先于经验的知识。在哲学上,它使人联想到下述思想:人类头脑包含有若干内在的特征,它可以为人类理性和悟性提供基础。人类智能的一个重要特性是,人类具有从少量样本中进行学习的能力,并且具有极强的泛化性,即所谓举一反三,融会贯通。
受到人类少样本学习能力的启发,人们对机器少样本学习的兴趣愈发浓厚。既然人类具备少样本学习能力,那么深度学习如果按照现在的思路去发展,应该也是可以实现该能力的。正因为如此,少样本学习成为了近年来深度学习领域非常重要的一个前沿研究方向。
如何实现少样本学习?
目前,实现少样本学习的方法有很多,包括元学习、迁移学习以及多任务学习等。其中,少样本学习一直以来与元学习的关系非常紧密。
元学习(Meta Learning)或者叫做学会学习(Learning to Learn),是机器学习的一个子领域。元学习学习到的是学习能力,而不是知识本身。它自动学习一些应用于机器学习实验的元数据,主要目的是使用这些元数据来自动学习如何在解决不同类型的学习问题时变得灵活,从而提高现有的学习算法,它会随着获得的数据进行更新和快速的学习。这改变了传统的深度学习模式必定需要庞大的数据量的情况,意味着深度学习可以在少量样本的情况下,得到不错的结果。
写在最后:
相信在未来,元学习将进一步推动少样本学习领域的发展。同时,随着科技的发展,少样本学习和深度强化学习必将会融合成一体,只有这样才符合人类学习,真正提升人工智能技术的水平。
最新资讯
热门视频
新品评测