Meta发布AI图片学习模型I-JEPA：可自我学习推理焦点资讯

首页 > 资讯 > > 内容页

Meta发布AI图片学习模型I-JEPA：可自我学习推理焦点资讯

2023-06-16 11:03:16 来源：站长之家

站长之家（ChinaZ.com）6月16日消息:Meta的首席人工智能科学家Yann LeCun已经讨论了几年能够在很少或完全不需要人类的帮助下学习世界模型的深度学习系统。现在，这个愿景正在慢慢实现，因为 Meta 刚刚发布了 I- JEPA 的第一个版本，这是一个机器学习（ML）模型，通过对图像的自我监督学习来学习世界的抽象表示。

【资料图】

初步测试显示，I-JEPA在许多计算机视觉任务上表现优秀。它也比其他最先进的模型更高效，仅需要训练的计算资源的十分之一。Meta已经公开了训练代码和模型，并将在下周的计算机视觉和模式识别（CVPR）会议上展示I-JEPA。

自我监督学习

自我监督学习的想法受到人类和动物学习的启发。我们很多知识都是通过观察世界获取的。同样，人工智能系统应该能够通过原始观察学习，而无需人类标记他们的训练数据。

自我监督学习已经在一些人工智能领域取得了显著的进展，包括生成模型和大型语言模型（LLMs）。在2022年，LeCun提出了“联合预测嵌入架构”(JEPA)，这是一种可以学习世界模型和常识等重要知识的自我监督模型。JEPA在重要方面不同于其他自我监督模型。

生成模型（例如DALL-E和GPT）旨在进行细致的预测。例如，在训练期间，文本或图像的一部分被遮盖，模型尝试预测确切的缺失单词或像素。尝试填补每一个细节的问题是，世界是不可预测的，模型经常陷入许多可能的结果中而无法前进。

相比之下，JEPA不是关注像素级的细节，而是试图学习和预测高层次的抽象，例如场景必须包含什么以及对象如何相互关联。这种方法使模型在学习环境的潜在空间时不易出错，成本也大大降低。

“通过在高抽象级别上预测表示，而不是直接预测像素值，我们希望直接学习有用的表示，并避免了生成方法的局限性，”Meta的研究人员写道。

I-JEPA是LeCun提出的架构的基于图像的实现。它使用“抽象预测目标”来预测缺失信息，可能会消除不必要的像素级细节，从而使模型学习更多的语义特征。

I-JEPA使用Vision Transformer（ViT）对现有信息进行编码，这是一种用于LLM中的Transformer架构的变体，但是对图像处理进行了修改。然后，它将此信息作为上下文传递给预测器 ViT，该预测器为缺失的部分生成语义表示。

Meta的研究人员训练了一个生成模型，用于从I-JEPA预测的语义数据中创建草图。在下图中，I-JEPA在蓝色框外的像素作为上下文，然后预测了蓝色框内的内容。生成模型然后创建了I-JEPA预测的草图。结果显示，I-JEPA的抽象匹配了场景的真实情况。

虽然I-JEPA不会生成写实的图像，但它可以在机器人和自动驾驶汽车等领域中具有许多应用，其中AI机器人必须能够理解其环境并处理一些非常合理的结果。

一个非常有效的模型

I-JEPA的一项明显好处是其内存和计算效率。预训练阶段不需要其他类型的自我监督学习方法中使用的计算密集型数据增强技术。研究人员能够使用16个A100GPU在不到72小时内训练出一个拥有632百万参数的模型，约为其他技术的十分之一。

“经验证明，我们发现I-JEPA可以不使用手工制作的视图仿真来学习强大的即插即用的语义表示，”研究人员写道。

他们的实验表明，I-JEPA在图像分类、物体计数和深度预测等计算机视觉任务中需要远远较少的微调，即可超越其他最先进的模型。研究人员能够使用仅占1%的训练数据在ImageNet-1K图像分类数据集上进行微调，每类仅使用12至13个图像。

“通过使用具有较少刚性感应偏置的更简单的模型，I-JEPA适用于更广泛的任务，”研究人员写道。鉴于互联网上未标记数据的高可用性，I-JEPA 等模型对于以前需要大量手动标记数据的应用程序来说非常有价值。

项目网址:https://ai.facebook.com/blog/yann-lecun-ai-model-i-jepa/

（举报）

标签：

Meta发布AI图片学习模型I-JEPA：可自我学习推理 焦点资讯

Meta发布AI图片学习模型I-JEPA：可自我学习推理 焦点资讯

世界微头条丨5月居民消费价格同比小幅上涨

亚马逊的5部黄暴大尺度美剧，越看越上瘾，碾压HBO 焦点速递

环球最资讯丨沪宁沿江高铁首趟检测列车发出 全线开通运营进入倒计时

迪士尼烟花直播_迪士尼烟花

特斯拉：6月16日至30日购买Model 3现车有限时激励

世界速递！进企业到现场 高邮专班服务 "沉到底" 项目推进"快起来"

【天天聚看点】中信保诚人寿董事长黎康忠辞职 年内公司已在多地发生被告案件

盘前情报丨支持恢复和扩大消费一系列政策措施有望出台，机构建议配置黄金珠宝板块；五部门组织新能源汽车下乡活动，汽车销量和盈利预计逐渐回升_世界球精选

【环球报资讯】中产阶级消亡史

厦门三大气象设施揭牌 观云测雨添利器 世界新消息

新业态让闲置资产再生“金”

肺部真菌感染能活多久

美丽乡村的“只此青绿”，VR全景带你身临其境

我为群众办实事丨英发新苑北门外摊贩占道严重 高新城管：巡查整治

当前速看：马卡报称穆萨仅能回收10M至15M，要不瓦伦西亚再试试？

国美电器、梵音瑜伽等7家企业因失信被深圳市消委会“点名”

高温来袭用电走高 能源保供聚力攻坚

世界关注：1158万人！今年高校毕业生数量再创历史新高！找工作更难了...

热点在线丨6月15日氧化钬出厂参考报价下滑

盘中异动 | 华安中证细分医药ETF涨2.08%

今头条！瑞士舞蹈团在沪上演《幸福的降落伞》

简讯：明修栈道暗度陈仓是谚语吗（明修栈道暗度陈仓是孙子兵法中的哪一计）

上午“逆水行舟”下午“顺水飞舟”，广州国际龙舟邀请赛6月17日挥桨逐浪

他们曾参与培训谷歌AI，抱怨工资低、时间赶之后被开除了-焦点播报

天天关注：市场监管总局部署开展优化平台协议规则专项行动

Anker安克推出新款TWS耳机，60小时超长续航！|世界热门

微头条丨国家统计局：1—5月份全国房地产开发投资45701亿元

通辽市科尔沁区：优化营商服务 赋能高质量发展

山西汾酒史上最大手笔分红！拟分红超40亿元，分掉去年一半净利 世界热资讯

Meta发布AI图片学习模型I-JEPA：可自我学习推理 焦点资讯

世界微头条丨5月居民消费价格同比小幅上涨

亚马逊的5部黄暴大尺度美剧，越看越上瘾，碾压HBO 焦点速递

环球最资讯丨沪宁沿江高铁首趟检测列车发出 全线开通运营进入倒计时

迪士尼烟花直播_迪士尼烟花

Meta发布AI图片学习模型I-JEPA：可自我学习推理 焦点资讯

世界微头条丨5月居民消费价格同比小幅上涨

亚马逊的5部黄暴大尺度美剧，越看越上瘾，碾压HBO 焦点速递

环球最资讯丨沪宁沿江高铁首趟检测列车发出 全线开通运营进入倒计时

迪士尼烟花直播_迪士尼烟花

特斯拉：6月16日至30日购买Model 3现车有限时激励

世界速递！进企业到现场 高邮专班服务 "沉到底" 项目推进"快起来"

Meta发布AI图片学习模型I-JEPA：可自我学习推理焦点资讯

Meta发布AI图片学习模型I-JEPA：可自我学习推理焦点资讯

环球最资讯丨沪宁沿江高铁首趟检测列车发出全线开通运营进入倒计时

世界速递！进企业到现场高邮专班服务 "沉到底" 项目推进"快起来"

【天天聚看点】中信保诚人寿董事长黎康忠辞职年内公司已在多地发生被告案件

厦门三大气象设施揭牌观云测雨添利器世界新消息

我为群众办实事丨英发新苑北门外摊贩占道严重高新城管：巡查整治

高温来袭用电走高能源保供聚力攻坚

通辽市科尔沁区：优化营商服务赋能高质量发展

山西汾酒史上最大手笔分红！拟分红超40亿元，分掉去年一半净利世界热资讯

Meta发布AI图片学习模型I-JEPA：可自我学习推理焦点资讯

环球最资讯丨沪宁沿江高铁首趟检测列车发出全线开通运营进入倒计时

Meta发布AI图片学习模型I-JEPA：可自我学习推理焦点资讯

环球最资讯丨沪宁沿江高铁首趟检测列车发出全线开通运营进入倒计时

世界速递！进企业到现场高邮专班服务 "沉到底" 项目推进"快起来"