「AI 教母」李飞飞:世界是三维的,我们需要尊
起源:创业邦起源丨学术头条(ID:SciTouTiao)]article_adlist-->在人工智能(AI)范畴,斯坦福年夜学教学李飞飞被称为“AI 教母”。她在深度进修反动中施展了主要感化,多年来始终努力于创立 ImageNet 数据集跟比赛,该数据集跟比赛请求人工智能体系辨认 1000 个种别的物体跟植物。2012年,一个名为 AlexNet 的神经收集在 ImageNet 比赛中取得了冠军,其杰出的表示震动了全部人工智能研讨界。从当时起,神经收集在互联网上供给的大批收费练习数据跟可供给史无前例盘算才能的 GPU 的推进下,开端获得冲破。在 ImageNet 呈现之后的 13 年里,盘算机视觉研讨职员控制了物体辨认技巧,并开端研讨图像跟视频天生技巧。李飞飞与别人独特创立了斯坦福以工资自己工智能研讨院(HAI),并持续推进盘算机视觉的开展。就在往年,她开办了一家始创公司--World Labs,该公司能够天生用户能够摸索的 3D 场景。World Labs 努力于付与人工智能“空间智能”,即天生 3D 天下、在 3D 天下中停止推理并与之互动的才能。李飞飞在人工智能顶会 NeurIPS 上宣布了题为“From Seeing to Doing: Ascending the Ladder of Visual Intelligence”的宗旨报告,论述了她对呆板视觉的愿景。宗旨报告链接:https://neurips.cc/virtual/2024/invited-talk/101127在报告前,李飞飞接收了 IEEE Spectrum 高等编纂 Eliza Strickland 的专访。内容如下:Eliza Strickland:为什么将报告标题定为“攀缘视觉智能的门路”(Ascending the Ladder of Visual Intelligence)?李飞飞:我以为,直不雅地说,智能有差别水平的庞杂性跟进步性。在报告中,我想表白的是,在从前的多少十年里,尤其是深度进修反动的十多年里,咱们在视觉智能方面所学到的货色令人惊奇。咱们的技巧才能越来越强。Judea Pearl 提出的“因果关联门路”也给了我启示。报告另有一个副题目,“从看到做”。人们对这一点还不敷懂得:无论是植物仍是 AI 智能体,“看”都与互动跟“做”亲密相干。这跟言语是差别的。言语从基本上说是一种交换东西,用来通报思维。在我看来,这些都长短常互补但同样影响深入的智能模态。ES:你的意思是说,咱们会天性地对某些气象做出反映?李飞飞:我说的不只仅是天性。假如你看一下感知的退化跟植物智能的退化,就会发明这两者之间有着深入的接洽。每当咱们可能从情况中取得更多信息时,退化的力气就会推进才能跟智能的开展。假如你不克不及感知情况,你与天下的关联就会十分主动;你是吃仍是被吃,都长短常主动的行动。然而,一旦你可能经由过程感知从情况中获取线索,退化的压力就会真正增年夜,从而推进智能的开展。ES:你以为这就是咱们发明更深刻的呆板智能的方法吗?让呆板感知更多情况?李飞飞:我不晓得“深刻”是不是我想用的描述词。我以为咱们正在发明更多的才能。我以为它正变得越来越庞杂,越来越有才能。我以为,处理空间智能成绩是迈向片面智能化的基本跟要害一步,我对这一点坚信不疑。ES:我看过 World Labs 的演示。你为什么想研讨空间智能并构建这些 3D 天下?李飞飞:我以为空间智能是视觉智能的开展偏向。假如咱们真的要处理视觉成绩,并将其与做某些事接洽起来,有一个十分简略、高深莫测的现实:天下是 3D 的。咱们生涯的天下不是立体的。咱们的物明智能体,无论是呆板人仍是装备,都将生涯在 3D 天下中。就连虚构天下也变得越来越 3D 化。假如你与艺术家、游戏开辟者、计划师、建造师跟大夫攀谈,即便他们是在虚构天下中任务,此中年夜局部也是 3D 的。假如你能静下心来,认清这个简略而深入的现实,那么毫无疑难,破解 3D 智能成绩就是基本地点。ES:我很猎奇 World Labs 展现的场景是怎样坚持物体的长久性跟遵照物理定律的。这感到像是一个令人高兴的提高,由于像 Sora 如许的视频天生东西依然在探索这些货色。李飞飞:一旦你认同了天下的 3D 性,良多事件就天然而然地产生了。比方,在咱们宣布在交际媒体上的一个视频中,篮球被投放到一个场景中。由于它是 3D 的,以是你能够领有这种才能。假如场景只是 2D 天生的像素,篮球将无处可去。ES:或许,就像在 Sora 中一样,它可能会呈现在某个处所,但随后就消散了。在实验推动这项技巧的进程中,你们面对的最年夜技巧挑衅是什么?李飞飞:不人处理过这个成绩,对吧?这十分十分难。在 World Labs 的演示视频中,你能够看到咱们用一幅梵高的画,以同一的作风天生了它四周的全部场景:艺术作风、灯光,乃至街区会有什么样的建造。假如你转过身去,它就酿成了摩天年夜楼,那就完整不压服力了。它必需是 3D 的。你必需在此中导航。因而,它不只仅是像素。ES:你能说说你用来练习它的数据吗?李飞飞:良多。ES:你在算力累赘方面能否面对技巧挑衅?李飞飞:算力需要很年夜。这是大众部分无奈累赘的。这也是我很愉快可能以私营部分的方法来做这件事的局部起因。这也是我始终推进大众部分算力拜访的局部起因,我的亲自阅历夸大了翻新与充分资本的主要性。ES:假如能付与大众部分权利就更好了,由于大众部分平日更乐意为本人跟人类的好处而取得常识。李飞飞:常识的发明须要资本的支撑。在伽利略时期,是最好的千里镜让地理学家观察到了新的天体。是胡克(Robert Hooke)认识到缩小镜能够改良成显微镜,并发明了细胞。每当有新的技巧东西呈现,都有助于常识的探寻。而当初,在人工智能时期,技巧东西波及算力跟数据。对大众部分来说,咱们必需意识到这一点。ES:假设咱们能够让人工智能体系真正懂得 3D 天下,这将给咱们带来什么?李飞飞:它将为人们开释大批的发明力跟出产力。我想用一种更高效的方法来计划我的屋子。我晓得良多医学用处都波及到懂得一个十分特别的 3D 天下,也就是人体。咱们老是在念叨将来人类将发明呆板人来辅助咱们,但呆板人在 3D 天下中导航,它们须要空间智能作为年夜脑的一局部。咱们还探讨了虚构天下,它将容许人们观赏处所、进修观点或文娱。这些都应用 3D 技巧,尤其是混杂技巧,咱们称之为 AR。我想带着一副眼镜穿过公园,它能告知我对于树木、小路跟云的信息。我也想经由过程空间智能进修差别的技巧。ES:什么样的技巧?李飞飞:我举一个简略的例子,假如我在高速公路上爆胎了,我该怎样办?当初,我须要翻开一个“怎样换轮胎”的视频。但假如我能戴上眼镜,看到我的车产生了什么,而后在领导下实现这个进程,那就太酷了。你还能够斟酌烹调,你能够斟酌雕琢——风趣的事件。ES:你以为在咱们有生之年,咱们还能在这方面走多远?李飞飞:我以为这将在咱们的有生之年产生,由于技巧提高的步调十分快。你们曾经看到了从前 10 年带来的变更。这无疑预示着接上去会产生什么。访谈链接:https://spectrum.ieee.org/fei-fei-li-world-labs原文作者:Eliza Strickland,IEEE Spectrum 高等编纂,重要报导人工智能、生物医学工程等主题。]article_adlist-->]article_adlist-->]article_adlist-->
申明:新浪网独家稿件,未经受权制止转载。 -->