谷歌发布 AI 框架 SimCLR,有效提高自监督和半监督学习的技术水平

  • A+
所属分类:技术资讯

技术编辑:北京卡尔博客出版:卡尔博客
谷歌的一个研究小组详细介绍了一种称为SimCLR的框架,该框架最近改进了无监督学习方式,这是一种将无监督学习问题(即AI模型对无标记数据进行教育的问题)从无标记数据集创建标签,然后转换为监视问题的技术。
在预打印的这篇论文和随附的补文中,谷歌表示,SimCLR用有限的注释数据实现了图像分类的新记录,简单到可以包含在现有的监督学习管道中。
这对将计算机视觉应用于标签数据有限领域的企业来说可能是好消息。
AI框架SimCLR
SimCLR可以从一个未标记的语料库中学习基本的图像表示,并将其微调为一小部分标记的图像,以完成分类工作。通过比较学习,将模型同时最大化同一图像的不同变体视图之间的协议,并将不同图像的变体视图之间的协议最小化,可以学习这些表示。
SimCLR首先从原始数据集中随机提取采样,通过裁剪、颜色扭曲和模糊将每个采样转换两次,以创建两组相应的视图。然后,使用机器学习模型计算图像表示,使用模块生成图像表示的投影,从而最大限度地提高识别同一图像的不同转换的能力。最后,在培训前阶段之后,您可以将SimCLR的输出表示为图像或自定义为标记的图像,以实现特定任务的良好绩效。
谷歌表示,在实验中仅测试了1%的标签时,SimCLR在一个测试数据集(ImageNet)上实现了85.8%的准确度,此前最好的方法是77.9%。
据调查,对大型无标签图像数据集的事前训练可以提高计算机视觉工作的性能。研究科学家廷臣和谷歌研究副总裁兼工程研究员、图灵奖获奖者Geoffrey Ting Chen在一篇博文中写道:“尽管简单,SimCLR还是极大地推动了自我监控和半监督学习的技术水平。”
SimCLR作者简介
SimCLR的titing Chen于2017年6月加入谷歌,2019年作为研究科学家加入谷歌的大脑团队。在个人媒体信息展示上表示,2013年毕业于北京邮电大学,2019年3月在加州大学洛杉矶分校获得了计算机科学系博士学位。
作者个人网站:http://web.cs.ucla.edu/~ tingc.github地址:https://github.com/google-res.资料来源:https://venturebeat.com/2020//.

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: