第94章 显而易见的局限
15岁,成为国宝级天才科学家 作者:佚名
第94章 显而易见的局限
肖宿对这些喧囂一无所知。
他正在实验室里,调试“小智”系统的新版本。
周瑾、苏芮、刘浩然、林砚四个人围在他身边,大气不敢出。
“肖哥,明天的ppt……”周瑾小声提醒。
“准备好了。”肖宿头也不抬,“昨晚改完了。”
“那……你要不要提前演练一遍?我们可以当听眾。”
“不用。”
肖宿敲下最后一行代码,按下运行键,“讲一遍就行了,浪费时间。”
屏幕上的程序开始执行,数据流飞快滚动。
肖宿看著那些跳动的数字和图形,眼神专注。
他其实並不紧张。
数学是清晰的,逻辑是严密的,该讲的讲清楚就行了。
至於台下坐的是院士还是学生,对他来说没什么区別。
如果真要说有什么期待……那就是希望提问环节,能有人问出真正有价值的问题。
……
报告会当天下午一点,京大百年讲堂外已经排起了长队。
不是夸张,是真真正正的长队,从讲堂正门口沿著林荫道蜿蜒出去上百米,全是拿著学生证或邀请函等待入场的人。
有京大本校的学生,有从华清、沪交、金陵大学赶来的外校师生,甚至还有几位白髮苍苍的老教授,在助手的搀扶下站在队伍中。
“我的天,这阵仗……”
一个京大数院的大二学生踮著脚往前看,“比明星演唱会还夸张。”
他旁边的室友拿著手机狂拍:
“废话,这可是肖神!十五岁登上《数学年刊》的男人!你看前面那几个,是不是华清的姚院士?我在新闻上见过他照片!”
队伍前方,姚毅智院士確实站在那里。
他穿著朴素的夹克衫,戴著老花镜,正和身边的几个博士生低声討论著什么,完全没在意周围投来的目光。
倒是他身后的几个年轻人有些紧张,毕竟是第一次在这么多同龄人注视下排队。
钱卫华院士来得稍晚一些,带著国家算力研究院的两个研究员,直接从工作人员通道进去了。
总不能真让院士在外面排队。
一点二十分,讲堂大门打开,检票开始。
人流缓缓涌入。
八百个座位,不到十分钟就坐满了八成。
前排最好的位置留给了受邀嘉宾和学校领导,姚院士坐在第三排正中央,钱院士在第四排。
两人隔著几排座位点头致意,算是打过招呼。
学生们抢座的速度堪比超市大减价。
有人为了占座连午饭都没吃,进来后赶紧从包里掏出了麵包和矿泉水。
有人带了笔记本、录音笔、甚至还有带小型摄像机的。
虽然按规定不能录像,但总有人想碰碰运气。
讲堂里嗡嗡的交谈声像蜂群。
话题只有一个:肖宿。
“你说肖神等会儿会紧张吗?台下这么多大佬。”
“紧张?你看佐藤事件他紧张了吗?直接围脖甩清单打脸,那叫一个乾脆利落。”
“也是……不过这次不一样啊,现场提问,万一答不上来怎么办?”
“答不上来?兄弟你是没看肖神的论文吧?他那套理论,我敢说台下能完全听懂的不超过五十人。还提问呢,能问出像样问题就不错了。”
“臥槽,这么夸张?那我岂不是来当气氛组的?”
“自信点,把『岂不是』去掉。咱们就是来见证歷史的,听懂多少算多少。”
一点五十分,陈景明、顾清尘、江明远跟著一眾京大领导入场,在前排嘉宾席就座。
江明远满脸红光,看著座无虚席的讲堂,心里已经在盘算今年的招生宣传片该怎么剪了。
一点五十五分,讲堂里的灯光暗了下来,只留下讲台上的照明。
嘈杂声渐渐平息,所有人都屏住呼吸,看向舞台侧方的入口。
一点五十八分,肖宿出现了。
他还是那身打扮,浅灰色t恤,深色牛仔裤,黑色双肩包。
走上讲台的步伐平稳,放下背包,插好u盘,打开ppt,调试麦克风。
整个过程行云流水,花了不到一分钟。
两点整。
肖宿抬起头,看向台下。
八百多双眼睛聚焦在他身上,那种被注视的压力足以让任何人紧张。
但他的语气依旧平稳。
“我是肖宿,今天讲群论在自监督特徵解耦中的应用,以及周氏猜想证明中的方法技巧。”
没有开场白,没有感谢致辞,除了名字外没有多余的自我介绍,直接进入正题。
台下静了一瞬,然后响起低低的笑声和议论。
“这也太直接了吧……”
“肖神风格,符合人设。”
“我喜欢,不浪费时间。”
讲台上,肖宿已经点开了ppt第一页。
標题很简单:“群作用下的特徵空间统一表示”。
“传统多模態学习的问题在於,不同数据类型的特徵空间是异构的。”
肖宿的声音通过麦克风传遍讲堂,清晰而平静。
“图像用卷积神经网络提取特徵,文本用transformer,语音用梅尔频谱。这些特徵向量维度不同,结构不同,度量不同。强行融合就像把苹果和橘子加在一起算总数,没有意义。”
他在白板上画了两个不相交的圆圈,分別標註“图像特徵空间”和“文本特徵空间”。
“我的思路是,引入群论作为统一框架。”
肖宿切换ppt,出现了一个复杂的数学结构图。
“所有数据模態,经过编码器映射到同一个群表示空间。在这个空间里,图像旋转、文本语法变换、语音时移,都可以看作群作用。”
台下,姚毅智院士眼睛一亮,迅速在笔记本上记下几个关键词。
“关键在於对称性约束。”
“每个数据模態都有其內在对称性。”
“图像有旋转、平移、缩放对称;文本有语法、语义对称。”
“自监督学习的目標,是在保持这些对称性的前提下,解耦出独立的特徵因子。”
他调出了一段代码演示。
屏幕上,一个简单的神经网络正在训练,输入是未標註的图像和文本对,输出是解耦后的特徵向量。
“训练过程中,系统会自动发现不同模態特徵之间的对应关係。”
肖宿指著屏幕上的损失函数曲线。
“这是群等变约束损失,这是特徵解耦损失。两者结合,就能实现跨模態的自然对齐。”
钱卫华院士身体前倾,盯著屏幕上的公式。
他是搞超算出身的,对算法效率极其敏感。
而肖宿展示的这个框架,计算复杂度明显低於传统的多模態融合方法。
“具体到实现细节……”
肖宿开始深入技术核心。
接下来的三十分钟,他像拆解精密的机械一样,將整个群论框架一层层剥开。
从李群在流形上的作用,到特徵空间的纤维丛结构,再到自监督信號的构造方法……
讲堂里的气氛开始变得有些微妙。
前十几分钟,大部分学生还能勉强跟上,毕竟肖宿讲得深入浅出,而且还用了很多直观的比喻。
二十分钟后,大多数学生已经开始眼神涣散了。
那些“李代数”、“表示论”、“上同调”之类的术语,像天书一样在头顶飞舞。
“我……我听不懂了。”
一个数院大三的学生痛苦地捂住脸,“虽然我们已经在上抽象代数了,但肖神讲的东西,好像跟教科书上的不是一个次元啊……”
他旁边的室友更惨,已经选择放弃治疗,开始在笔记本上画小人了。
“没事,听不懂正常。我怀疑咱们系一半的教授现在也在硬撑。”
確实,中后排的教授们表情各异。
有的频频点头,显然跟上了思路;有的眉头紧皱,努力消化那些新颖的概念;还有的已经在翻看提前列印的论文,试图对照理解了。
姚毅智院士的笔记本已经写了三页。
他偶尔会停下来思考几秒,然后快速写下新的想法。
身后的博士生们就没这么轻鬆了,一个个如临大敌,拼命想跟上节奏。
“现在看一个具体应用。”
肖宿切换到了“小智”系统的演示界面。
屏幕上出现了那个简洁的对话窗口。
肖宿先输入了一个很简单的水果分类问题,小智在几秒钟的时间里就能够自动完成思考並作出回答。
这看似简单的一幕,却让懂行的人脊背发麻。
聪明的网友可能要问了,这么简单的问答,现在的deepmind、openai等顶尖机构的ai模型都能轻易做到,有什么特別的呢?
答案就在於小智回答肖宿问题的答案,事先並没有在训练数据中明確標註,而是系统通过特徵解耦自主“理解”的。
类似openai这样的顶尖模型,其实本质上走的是“记忆匹配+概率推测”的路子,它们之所以能给出正確答案,不过是记住了“吃=减少”“收到=增加”的固定关联,熟记了苹果对应红色、橘子对应橙色、梨对应黄/绿的统计规律,靠著海量训练数据中的样本匹配,找到最贴合问题的回覆,如同背会了答题模板,却从未真正理解问题的本质。
它的数据內容多了,回答的答案正確的概率也上升。
但是,又因为它的资料库杂乱的內容太多,导致最后连开发者都无法知道它会给出什么答案,也就是“黑箱”。
这也是有些人工智慧会被聪明的网友称作人工智障的原因。
它们的局限是显而易见的。
无法真正拆解问题中的核心特徵,更无法建立特徵间的独立关联,一旦遇到超出训练样本的场景,比如顏色特殊的水果、复杂的数量组合,就会出现卡顿、判断偏差,甚至混淆不同特徵的边界。
但肖宿运用群论实现的自监督解耦框架,彻底打破了这种局限。
第94章 显而易见的局限
肖宿对这些喧囂一无所知。
他正在实验室里,调试“小智”系统的新版本。
周瑾、苏芮、刘浩然、林砚四个人围在他身边,大气不敢出。
“肖哥,明天的ppt……”周瑾小声提醒。
“准备好了。”肖宿头也不抬,“昨晚改完了。”
“那……你要不要提前演练一遍?我们可以当听眾。”
“不用。”
肖宿敲下最后一行代码,按下运行键,“讲一遍就行了,浪费时间。”
屏幕上的程序开始执行,数据流飞快滚动。
肖宿看著那些跳动的数字和图形,眼神专注。
他其实並不紧张。
数学是清晰的,逻辑是严密的,该讲的讲清楚就行了。
至於台下坐的是院士还是学生,对他来说没什么区別。
如果真要说有什么期待……那就是希望提问环节,能有人问出真正有价值的问题。
……
报告会当天下午一点,京大百年讲堂外已经排起了长队。
不是夸张,是真真正正的长队,从讲堂正门口沿著林荫道蜿蜒出去上百米,全是拿著学生证或邀请函等待入场的人。
有京大本校的学生,有从华清、沪交、金陵大学赶来的外校师生,甚至还有几位白髮苍苍的老教授,在助手的搀扶下站在队伍中。
“我的天,这阵仗……”
一个京大数院的大二学生踮著脚往前看,“比明星演唱会还夸张。”
他旁边的室友拿著手机狂拍:
“废话,这可是肖神!十五岁登上《数学年刊》的男人!你看前面那几个,是不是华清的姚院士?我在新闻上见过他照片!”
队伍前方,姚毅智院士確实站在那里。
他穿著朴素的夹克衫,戴著老花镜,正和身边的几个博士生低声討论著什么,完全没在意周围投来的目光。
倒是他身后的几个年轻人有些紧张,毕竟是第一次在这么多同龄人注视下排队。
钱卫华院士来得稍晚一些,带著国家算力研究院的两个研究员,直接从工作人员通道进去了。
总不能真让院士在外面排队。
一点二十分,讲堂大门打开,检票开始。
人流缓缓涌入。
八百个座位,不到十分钟就坐满了八成。
前排最好的位置留给了受邀嘉宾和学校领导,姚院士坐在第三排正中央,钱院士在第四排。
两人隔著几排座位点头致意,算是打过招呼。
学生们抢座的速度堪比超市大减价。
有人为了占座连午饭都没吃,进来后赶紧从包里掏出了麵包和矿泉水。
有人带了笔记本、录音笔、甚至还有带小型摄像机的。
虽然按规定不能录像,但总有人想碰碰运气。
讲堂里嗡嗡的交谈声像蜂群。
话题只有一个:肖宿。
“你说肖神等会儿会紧张吗?台下这么多大佬。”
“紧张?你看佐藤事件他紧张了吗?直接围脖甩清单打脸,那叫一个乾脆利落。”
“也是……不过这次不一样啊,现场提问,万一答不上来怎么办?”
“答不上来?兄弟你是没看肖神的论文吧?他那套理论,我敢说台下能完全听懂的不超过五十人。还提问呢,能问出像样问题就不错了。”
“臥槽,这么夸张?那我岂不是来当气氛组的?”
“自信点,把『岂不是』去掉。咱们就是来见证歷史的,听懂多少算多少。”
一点五十分,陈景明、顾清尘、江明远跟著一眾京大领导入场,在前排嘉宾席就座。
江明远满脸红光,看著座无虚席的讲堂,心里已经在盘算今年的招生宣传片该怎么剪了。
一点五十五分,讲堂里的灯光暗了下来,只留下讲台上的照明。
嘈杂声渐渐平息,所有人都屏住呼吸,看向舞台侧方的入口。
一点五十八分,肖宿出现了。
他还是那身打扮,浅灰色t恤,深色牛仔裤,黑色双肩包。
走上讲台的步伐平稳,放下背包,插好u盘,打开ppt,调试麦克风。
整个过程行云流水,花了不到一分钟。
两点整。
肖宿抬起头,看向台下。
八百多双眼睛聚焦在他身上,那种被注视的压力足以让任何人紧张。
但他的语气依旧平稳。
“我是肖宿,今天讲群论在自监督特徵解耦中的应用,以及周氏猜想证明中的方法技巧。”
没有开场白,没有感谢致辞,除了名字外没有多余的自我介绍,直接进入正题。
台下静了一瞬,然后响起低低的笑声和议论。
“这也太直接了吧……”
“肖神风格,符合人设。”
“我喜欢,不浪费时间。”
讲台上,肖宿已经点开了ppt第一页。
標题很简单:“群作用下的特徵空间统一表示”。
“传统多模態学习的问题在於,不同数据类型的特徵空间是异构的。”
肖宿的声音通过麦克风传遍讲堂,清晰而平静。
“图像用卷积神经网络提取特徵,文本用transformer,语音用梅尔频谱。这些特徵向量维度不同,结构不同,度量不同。强行融合就像把苹果和橘子加在一起算总数,没有意义。”
他在白板上画了两个不相交的圆圈,分別標註“图像特徵空间”和“文本特徵空间”。
“我的思路是,引入群论作为统一框架。”
肖宿切换ppt,出现了一个复杂的数学结构图。
“所有数据模態,经过编码器映射到同一个群表示空间。在这个空间里,图像旋转、文本语法变换、语音时移,都可以看作群作用。”
台下,姚毅智院士眼睛一亮,迅速在笔记本上记下几个关键词。
“关键在於对称性约束。”
“每个数据模態都有其內在对称性。”
“图像有旋转、平移、缩放对称;文本有语法、语义对称。”
“自监督学习的目標,是在保持这些对称性的前提下,解耦出独立的特徵因子。”
他调出了一段代码演示。
屏幕上,一个简单的神经网络正在训练,输入是未標註的图像和文本对,输出是解耦后的特徵向量。
“训练过程中,系统会自动发现不同模態特徵之间的对应关係。”
肖宿指著屏幕上的损失函数曲线。
“这是群等变约束损失,这是特徵解耦损失。两者结合,就能实现跨模態的自然对齐。”
钱卫华院士身体前倾,盯著屏幕上的公式。
他是搞超算出身的,对算法效率极其敏感。
而肖宿展示的这个框架,计算复杂度明显低於传统的多模態融合方法。
“具体到实现细节……”
肖宿开始深入技术核心。
接下来的三十分钟,他像拆解精密的机械一样,將整个群论框架一层层剥开。
从李群在流形上的作用,到特徵空间的纤维丛结构,再到自监督信號的构造方法……
讲堂里的气氛开始变得有些微妙。
前十几分钟,大部分学生还能勉强跟上,毕竟肖宿讲得深入浅出,而且还用了很多直观的比喻。
二十分钟后,大多数学生已经开始眼神涣散了。
那些“李代数”、“表示论”、“上同调”之类的术语,像天书一样在头顶飞舞。
“我……我听不懂了。”
一个数院大三的学生痛苦地捂住脸,“虽然我们已经在上抽象代数了,但肖神讲的东西,好像跟教科书上的不是一个次元啊……”
他旁边的室友更惨,已经选择放弃治疗,开始在笔记本上画小人了。
“没事,听不懂正常。我怀疑咱们系一半的教授现在也在硬撑。”
確实,中后排的教授们表情各异。
有的频频点头,显然跟上了思路;有的眉头紧皱,努力消化那些新颖的概念;还有的已经在翻看提前列印的论文,试图对照理解了。
姚毅智院士的笔记本已经写了三页。
他偶尔会停下来思考几秒,然后快速写下新的想法。
身后的博士生们就没这么轻鬆了,一个个如临大敌,拼命想跟上节奏。
“现在看一个具体应用。”
肖宿切换到了“小智”系统的演示界面。
屏幕上出现了那个简洁的对话窗口。
肖宿先输入了一个很简单的水果分类问题,小智在几秒钟的时间里就能够自动完成思考並作出回答。
这看似简单的一幕,却让懂行的人脊背发麻。
聪明的网友可能要问了,这么简单的问答,现在的deepmind、openai等顶尖机构的ai模型都能轻易做到,有什么特別的呢?
答案就在於小智回答肖宿问题的答案,事先並没有在训练数据中明確標註,而是系统通过特徵解耦自主“理解”的。
类似openai这样的顶尖模型,其实本质上走的是“记忆匹配+概率推测”的路子,它们之所以能给出正確答案,不过是记住了“吃=减少”“收到=增加”的固定关联,熟记了苹果对应红色、橘子对应橙色、梨对应黄/绿的统计规律,靠著海量训练数据中的样本匹配,找到最贴合问题的回覆,如同背会了答题模板,却从未真正理解问题的本质。
它的数据內容多了,回答的答案正確的概率也上升。
但是,又因为它的资料库杂乱的內容太多,导致最后连开发者都无法知道它会给出什么答案,也就是“黑箱”。
这也是有些人工智慧会被聪明的网友称作人工智障的原因。
它们的局限是显而易见的。
无法真正拆解问题中的核心特徵,更无法建立特徵间的独立关联,一旦遇到超出训练样本的场景,比如顏色特殊的水果、复杂的数量组合,就会出现卡顿、判断偏差,甚至混淆不同特徵的边界。
但肖宿运用群论实现的自监督解耦框架,彻底打破了这种局限。