前沿科技
我去看NBA 中国赛,结果被阿里云AI 变成了球队“第六人”
朋友们,以后谁再跟我炫耀他去看NBA比赛,只是晒门票和山顶照,我都会笑而不语。NBA中国赛时隔六年回归,作为一个老球迷,原本我只想一睹球星的风采,买几件球衣和纪念品在朋友圈炫耀一番。但接下来发生的事,直接把我多年的观赛经验给「Duang」一下,干刷新了。在比赛官方暂停,全场灯光一暗,大屏幕亮起。我跟周围人一样,下意识整理了下发型,以为是老套的Kiss Cam环节要来了。结果,神奇的事发生了。镜头先是扫过观众席,定格在一个穿着篮网队球衣的粉丝身上,马上AI就把他变成了真人手办,出现在球场大屏幕上。一样的发型,一样的球衣,连激动得有点傻的表情都神同步。全场先是愣了半秒,然后爆笑,接着就是此起彼伏的「Wow!」原来是阿里云和NBA在搞事情。除了比赛现场AI的酷炫展示,球场外给球迷粉丝准备的NBA House展区更是人头攒动。APPSO在现场体验了一圈,我发现在这届NBA中国赛,AI才是隐藏的MVP。说实话,虽然有着AI媒体编辑和NBA球迷的双重身份,但一开始我对「AI+体育」这概念是不太感冒的。为啥?这些年见过太多为了AI而AI的东西——看着挺唬人,用起来嘛...emmm,你懂的。不过在比赛开始没多久我就被惊到了。球员一次突破抛投,全场沸腾!就在大家意犹未尽时,大屏幕突然回放了刚才的瞬间。但这不是普通的回放。画面仿佛被凝固了,镜头360度环绕着空中的球员,他滞空的每一块肌肉线条、球衣的褶皱都清晰可见。时间在这一刻被切片、被拉伸、被重构,那种视觉冲击力,让我起了一身鸡皮疙瘩。这就是传说中阿里云的「360度实时回放技术」!感觉就像《黑客帝国》里尼奥躲子弹的经典镜头。搬到了NBA现场:时间仿佛凝固,镜头360度旋转,你能从任意角度观察同一个瞬间。当然,不同于电影里精心设计的特效,我在NBA赛场上看到的则是实时生成的比赛画面。通过环绕赛场布置的多机位阵列,结合通义大模型驱动的空间智能算法,可以捕捉并进行云端三维重建。由此呈现出赛场球员们「时空凝结的环绕视角」和「时间切片的轨迹捕捉」的两种视觉效果。从捕捉到大屏播出,整个流程只需15秒。换言之,你可能还没反应过来刚才发生了什么,回放就已经制作完成并播出了。这是NBA中国赛首次应用此项技术,也是现场观众首次可通过大屏直观看到AI驱动的沉浸式赛事回放。有些平时在直播里被遮挡的细节,比如球员起跳前的蹬地动作,空中的身体对抗,这些都能通过AI重建清晰呈现。这对于篮球技术分析爱好者来说,妥妥的黑科技。而最令我狂喜的,是我不仅能看比赛,甚至还有机会成为全场最靓的仔。球场大屏还会通过现场摄像头捕捉身穿球衣的球迷形象,随后由阿里云AI生成专属「球迷潮玩」——穿着主队球衣,配合动作,以「球星收藏手办」的形式展现在屏幕上,并与真人同框对比。这是NBA赛场上呈现的的首个AI-CAM Show,是将赛事观看与球迷互动的一次深度重塑。基于阿里云强大的人工智能平台PAI与通义大模型算法,NBA团队真正做到了让球迷成为主角表达心中热爱,让每个人都有机会拥有此生难忘的梦幻瞬间。让我康康哪个幸运儿登上大屏幕了。现场的氛围组直接拉满,每次大屏上出现球迷Q版形象,周围都会响起欢呼声。以往的NBA那些游戏环节,大多数人都是看客。但这个AI手办不一样,它让我感觉自己不是观众,而是赛场上的「第六人」,每个普通球迷都有了成为焦点的可能。这波操作,属实是把人性拿捏住了。赛场外,NBA House的互动区同样也布置了「AIGC手办一体机」。我直接站到镜头前拍一张照片,十几秒钟后,屏幕上就会生成一个穿着主队球衣、脸和我高度相似的Q版手办形象。这感觉,比我抢到限量版球鞋还满足,因为是真正属于我自己的、独一无二的NBA周边。我在现场体验了好几次,发现基本不需要担心抽卡和翻车,通义大模型的精准控制、就像一个经验老道的画师,不仅能够保持AI手办风格生成的一致性,基本能做到精准还原,整个视觉效果,直接帅到没朋友。在我回酒店的路上,我发现朋友圈和小红书开始被各种「脑洞大开」的AI手办刷屏了。各种「NBA手办生成」、「我变成Q版球星啦」的帖子铺天盖地,网友们也是玩得不亦乐乎。AI手办就像一种新的社交货币,让每个球迷都能在自己的主场C位出道。当然,好比赛得配好解说,但你有没有想过自己成为解说?这不是开玩笑,还真能实现。同样在场外的互动区,我就体验了一个名为「CosyVoice 2.0 X NBA球迷AI解说体验」的项目:录制10-15秒的任意语音,然后系统就能用我的声音给NBA经典瞬间配解说。此外,系统还支持多语言切换,想用中文解说、英文解说、甚至地道的广东话解说都行,AI全都能高保真模仿出来。好家伙,体验完AI解说的我,终于理解了张卫平的快乐。现场突然人群骚动,原来是「马政委」马布里来打卡了。他也生成了的专属AI手办,老马笑得合不拢嘴,还当场打印出了一张实体闪卡,估计是他第一次亲手给自己做「球星卡」。那表情,就像个拿到新玩具的大男孩。你的「高光时刻」,才是AI给体育最好的礼物从澳门回来路上,我一直在想一个问题,为什么这次NBA中国赛给我感觉这么不一样?表面上看,是阿里云给赛事加了一堆炫酷的AI特效。但实际上,它是在重新定义「观赛」这件事本身。以前,看球是单向的。我们坐在看台上或屏幕前,球员在场上挥洒汗水,我们在场下呐喊打call。中间隔着一道无形的墙,你是你,比赛是比赛。但现在,AI把这道墙打破了。比方说AI手办让你不再只是观众,也成了「赛场的一部分」。你的形象出现在大屏幕上,你的手办被打印成实体卡,你的创作在社交网络上传播。这种参与感,是前所未有的。而「360度实时回放」带来的沉浸感,也是传统转播无法比拟的。通过AI解说,你甚至可以成为比赛的「叙述者」。这才是这次NBA中国赛最有意思的地方:AI不只是提升科技感的气氛组,而是在改变「人与体育」的关系,让它变得更可触摸、可互动、可分享。你不需要懂什么是「通义大模型」,不需要知道什么是「三维重建」,你只需要拿起手机拍张照,或者抬头看看大屏幕,就能享受到AI带来的体育乐趣。NBA有句经典的广告语:Where amazing happens(奇迹诞生之地)。在AI时代,能够给体育赛事创造奇迹的,可能不再只是那些球队和球星,它会变成一个巨大的、开放的、可参与的「数字游乐场」。每个人都能在其中找到自己的位置,创造自己的故事,留下自己的印记。回想起大屏幕上那个酷炫的「我」,我突然开始想象:未来的某一天,我们是不是可以戴上AR眼镜,和AI生成的艾弗森一对一斗牛?我甚至不只能把这个过程制作成AI手办图片,还能3D出来珍藏。是不是可以让AI分析我的投篮姿势,然后生成一套专属的训练方案?是不是可以在虚拟的球馆里,和全世界的球迷一起「云观赛」,每个人都有自己的专属视角?这些听起来像科幻的场景,在看过这次NBA中国赛之后,我觉得并不遥远了。好了,不说了,我得去朋友圈更新我的AI手办九宫格了。
10小时前
6
19岁,她融资1.2亿
报道I投资界PEdaily“我最近刚满19岁,从大学计算机专业退学创业,致力于创建高质量的代码数据,为AI大模型提供支持。”这句话出自Serena Ge,一位华人面孔的00后女孩。现在,她是AI数据公司Datacurve的联合创始人兼CEO——公司成立仅一年,却已拿下1770万美元融资(约合人民币1.26亿元)。悄然间,一场属于00后的AI创业潮正在席卷全球。19岁女生,大学创业AI“卖铲人”2006年,Serena Ge出生于中国,后来随父母到加拿大生活,很早的时候就萌生创业的念头。高中时,因热爱攀岩,她研发出一款个性化训练的攀岩App,颇受攀岩爱好者好评。此后,她还带领一支23名高中生组成的团队,共同开发一款面向青少年的效率类网页应用,项目获得加拿大道明银行支持。2022年,她考入加拿大滑铁卢大学,就读计算机专业。然而,Serena很快发现校园主流氛围是“毕业后找份体面的稳定工作”,这与她渴望投身前沿科技、亲手创造未来的冲动格格不入。转折出现在2024年。当时凭借AI智能体项目UncleGPT,她收到了创业孵化器Y Combinator的邀请,几乎毫不犹豫,便毅然选择辍学。也是这一年,Serena与同为亚裔的校友Charley Lee,共同创立AI数据公司Datacurve。这次创业缘起于她曾在AI大模型独角兽Cohere实习经历,担任机器学习工程师。期间她发现同行很难获得专家级的标注数据——受限于成本等原因,AI标注公司不会招聘高素质的软件工程师来做最基础的数据标注工作。“大模型之所以存在瓶颈,就是因为缺乏丰富的、精心挑选的高质量标注数据。”Serena称这正是Datacurve想要破解的数据难题。与依赖庞大的外包团队的Scale AI不同,Datacurve的数据收集模式颇为有趣,以“赏金猎人”系统吸引熟练的软件工程师完成最难的数据获取部分。简单来看,在Datacurve的“赏金平台”Shipd上,超过1400名程序员来应对算法、测试、UI/UX流程等任务挑战,每解决一个任务,用户可获得5到50美元不等的费用。这种激励机制旨在奖励质量和速度,截至目前公司已发放超过100万美元赏金。“这是一款面向用户的产品,而不是单纯的数据标注工作,”Serena表示,工程师参与其中的最大动力并非金钱。实际上,数据标注的报酬永远低于软件开发等服务。因此公司的核心竞争力在于提供良好的用户体验,并让更多高质量的程序员加入其中。公司表示,随着大语言模型不断演进,人工智能不再只需要简单的数据标注,而是大量的训练数据和评估数据。公司通过游戏化平台提高数据生成及标记的精准度,进而完成高质量的数据交付。目前该团队只有约10人左右,还在招聘中。公司表示成立两个月时收入就超过了100万美元,如今已为超过一半的基础模型实验室以及Facebook、苹果、亚马逊、谷歌等公司提供高质量的代码数据,助力训练下一代更先进的大语言模型。刚刚融资1个亿直至最新融资,Datacurve闯入了创投圈视野。近日,公司完成一笔1500万美元的A轮融资,由风投机构Chemistry VC领投,其他投资者还有Y Combinator、Afore Capital、Homebrew等机构,以及来自DeepMind、OpenAI、Anthropic、Vercel和Coinbase等公司的投资人参与。“这是我们投资过增长最快的初创公司之一。就在上周,Datacurve刚刚签署了迄今为止最大的合同。”Chemistry合伙人Mark Goldberg回忆第一次见到Serena的情景,对她的勤奋记忆犹新。更早之前,公司完成了270万美元的种子轮融资,由Y Combinator、Y Combinator、Afore Capital、Pioneer Fund等机构支持,Coinbase前首席技术官Balaji Srinivasan参与了投资。至此,短短一年时间,这个00后创始人团队累计融资1770万美元,约合人民币1.26亿元。AI界有一个著名的梗:“有多少人工就有多少智能。”数据标注公司大多拥有庞大的外包团队来提炼数据,也被戏称为“赛博富士康”。但某种程度上,数据标注公司们专注于AI最刚性的环节:无论技术如何演进,模型训练始终离不开“干净”的数据,这正是数据标注不可替代的根本原因。发展至今,数据、算法和算力,是AI的三大基石。如果说英伟达是算力的卖铲人,那么数据标注公司便是数据的卖铲人。相比之下,她的竞争对手更为人熟知——Scale AI。今年6月,Meta斥资约150亿美元入股,Scale AI估值一举超过290亿美元。这里不得不提到同样是华裔的Edwin Chen,他所创办的Surge AI正在进行10亿美元首轮融资,对应估值升至约240亿美元(约合1712亿元人民币)。而他因持有公司约75%的股份,身家达到180亿美元,首次登上《福布斯》美国富豪榜,成为今年最年轻的亿万富翁。“这仅仅是开始。我们将利用这笔资金,加速基础模型的发展——通过为大语言模型提供前沿训练数据,推动AI能力的边界。”Serena称坚信AI的进步,不仅受算力限制,更受数据质量与复杂度的制约。AI江湖,00后杀疯了不知不觉,00后创业融资上亿已不再是传奇,几乎每天都在上演。就在上周,Axiom Math正式完成首轮6400万美元(约合人民币4.6亿元)融资,由B Capital领投,Greycroft、Madrona和Menlo Ventures等机构参与,投后估值3亿美元(约合人民币20亿元)。缔造Axiom的正是00后洪乐潼(Carina Hong)——在广州出生长大,她曾就读于著名的华南师大附中,多次拿下奥数竞赛奖牌。后考入麻省理工学院,硕士毕业于牛津大学,又来到斯坦福大学攻读博士学位。不久前,两位来自麻省理工的00后——22岁的华裔女生Jessica Wu和23岁的尼尔·德什穆克,所创立的Sola Solutions拿下硅谷知名风投的融资。官网显示,融资包括由Conviction领投的350万美元种子轮,以及由a16z领投、Conviction跟投的1750万美元A轮,总计2100万美元(约合人民币1.5亿元)。还有AI标注公司Mercor,正在寻求约百亿美元的估值。此前公司已完成两轮融资,B轮后估值约为20亿美元。公司创始人是三位退休的00后。大二那年,三人在宿舍里创立Mercor,后来决定从哈佛及乔治敦大学退学全职创业。类似的故事,也在国内上演。今年初,三个来自清华的“00后极客”——闵宇恒、程颐、李宜哲创业做机器人,零次方诞生。如今公司一举完成天使+和天使++轮亿元级融资,集结河创投、同创伟业、力合科创、水木基金、瑞穗力合、拉尔夫创投等知名机构。我们看到,还有灵初智能的联合创始人陈源培、UniX AI创始人兼CEO杨丰瑜、重隼科技创始人蒋正豪……越来越多年轻面孔不断涌现。时不我待。“AI不等人,晚一步,就真的错过了风口。”这些创始人大多从小就开始编写代码,他们认为人工智能是千载难逢的机会。有人放弃名校学位辍学创业,甚至有人放弃考大学就带着梦想,杀入了AI赛道。这群年轻人身上,叠加着许多令人惊叹的标签:天才、辍学、勤奋、极客、一人公司……20岁的独角兽公司CEO不再稀奇,带领数十人乃至上百人团队的00后比比皆是。正如一位硅谷投资人所说:“如今19岁创业,都不算早。”他们夜里锻炼健身,白天写代码,中午谈融资,晚上上线Demo——这是Z世代创业者的日常。他们以惊人的速度,正重塑AI的未来。真格基金合伙人刘元曾指出:“AI让创业门槛被重新定义。技术让所有人站在同一条起跑线上,而这一代年轻人最大优势是——没有包袱,学习快,动手更快。”后浪奔涌,这是属于这一代人的时代机遇。
11小时前
4
四家明星Agent公司创始人辩论:少谈点“通用”,对大家都好
在AI创造者嘉年华期间,语核科技创始人&CEO翟星吉、Flowith联合创始人&CMO拐子、Macaron创始人&CEO陈锴杰、RockFlow创始人&CEO赖蕴琦与硅星人合伙人王兆洋,进行了一场线下的“辩论”。这场讨论几乎涵盖了今天关于AI Agent创业最重要的一切。以下是对话实录,经不改变原意的编辑:通用的迷思王兆洋:我觉得取辩论的本质而不是取辩论的形式,通用和垂直这个话题,基本上大家参加的Agent局里都会遇到。有点像是一个框,什么东西都能往里装。但它其实对应的一个很有意思的话题——到底Agent是什么?陈锴杰:先主持人定义一下什么叫通用,什么是垂直。对我来说,Personal Agent相对于ChatGPT来说已经收窄。翟星吉:我一直觉得你们就是垂直的Agent。陈锴杰:对于旅行的Agent来说又扩大了。拐子:我觉得算是创作的Agent。翟星吉:你看都是垂直的。王兆洋:从表面来看好像Flowith和Macaron都是通用,语核像垂直。没有一个产品,从一开始做的时候,是从通用还是垂直,而是先找到你想做的东西。直到后面某个时刻,可能会开始思考通用和垂直的这个话题。先从陈锴杰开始讲讲,我们为什么会做这个产品,这个产品在哪个时刻你开始想起通用和垂直?陈锴杰:我开始抛砖引玉。在这个辩题之前,我都没想过是垂直还是通用。今年初,我们看到AI做生产力这个方向已经把很多事情解决的不错了。但用户在生活上有很多的需求,没有被很好满足。为什么呢?我们发现,第一是记忆,AI不懂你,给你的东西可能是正确,但没有用的。第二点,因为没有小工具来辅助你。比如,记录体重变化。你跟豆包聊天记录自己的体重变化,听上去就是很离谱的事情。假如用户想借用AI的能力,又想给你一些建议分析,又不想在聊天范式下做太多东西。那我们的Personal Agent帮你做mini app。所以,从这个角度思考,我们想解决用户生活的问题。王兆洋:为什么要用Agent来做生活?陈锴杰:我觉得大家都希望生活里有一个私人助理。虽然我不是富豪,但是我也能想象一下富豪的生活。我今天想要买个什么东西,我给我助理发个信息,他就买了。明天我要出去玩,所有行程给我安排好。我想要的就是这个——如果能很理解我过往的旅行偏好,他说不定能帮我把这个事情做得非常好。我觉得大家是有这个渴望的。王兆洋:拐子呢?拐子:首先,我觉得通用和垂直Agent为什么现在这么火?因为当时Manus发布的时候,视频里面讲了是这是“第一个AI Agent”,把通用Agent带入这个话题池当中。我们发第一个Agent是去年8月份。那时候,我们给它的名字代词叫Oracle,定义是AI for DeepWork。我们希望大家既能用它做深度的调研性的工作,也能做内容创作领域的。比如说有些新闻工作者要去做新闻调研,可以帮你输出一份高质量的研报;有自媒体的工作者,可以帮你做短视频、图文。可能最后还有一个方向是偏代码方向。它可以帮你做一些产品的原型图,或者小的一些vibe coding的产品原型。在我眼里这个范式不太通用,是偏向于创作的。当然我觉得所有的AI大模型都是在创作,都是在预测下一个Token会吐什么东西,或者预测我们下一个代码会写什么东西。“预测”这个词可能不太精准,但是我觉得主要还是说,我们去“写”出来下一个东西是什么,我觉得AI大模型有点像写字的感觉。王兆洋:“写字”算是已经比较通用方向了。拐子:对,它可能可以做的东西比较多。尤其在我们内部定义当中,我们会觉得通用Agent真的是要到什么事都能做。因为其实我觉得General AI Agent这个词,来源于AGI。我们对AGI的理想是贾维斯。你要它给造钢铁侠,它真能造。如果我们有“创作通用Agent”,我会愿意叫“创作通用Agent”,但是我觉得我自己不是很想说通用Agent,因为这样会让用户特别的模糊。因为我演讲说的那几个创作场景,一定是用的好的。但是用户会因为有“通用”这个词,他进你的产品之后,反而不知道要干什么了。所以我们在每次发布的时候都不喜欢自己叫General Agent,我们在特定的场景下输出的东西可能跟Manus这样的东西输出的差不多。大家会拿我们横向类比,把我们放入通用Agent这个范畴之内。如果再给我们一次机会,我们还是会叫整个创作领域的Agent。创作领域分通用,那就是场景的通用;垂类的探索我们会做,但是可能还是聚焦在创作这件事情当中。王兆洋:“通用”这个词并不是一开始,可能是因为被整个行业卷出来的。Flowith出来特别早,有一种叙事甚至是说:当对手出来的时候,它会看到创作这个事情已经被Flowith解决得很好了。陈锴杰:如果是创作Agent,Lovart也很有名。能不能对比一下Flowith和Lovart的区别?拐子:首先我们俩肯定不是竞品。我觉得我们是个范式创作Agent,Lovart还是偏设计师。如果我给它想一个Slogan:“人人都可以成为设计师”。它还是偏向于视觉创作领域,尤其是图片创作。我们是图文视频都可以做,尤其是代码Coding也可以做。我觉得他们很垂,我们是范式创作。王兆洋:星吉这边呢?你一开始怎么思考的?翟星吉:我们从去年开始做这个方向的时候,就定义一定是垂直的。因为我们认为,Agent或者AI在企业里面一定是生产力工具,从做to B以后更加明确了,AI在生产力形式上会替代掉某些事情。基于这个早期的认知,我们就想要在去年探索出来2-3个比较有价值的场景,就是垂直的场景。这也从几个角度去思考:第一个角度,我们看到未来它可能是每个员工都是垂直的,就是每个Agent都是垂直到每个岗位上去干;第二个角度,作为创业公司,我们得聚焦。这是很原始的商业逻辑,我们得聚焦在相对看起来没那么宏观的叙事上,去做一些我们更擅长的事,把它做穿。到今年年初的时候,有一些更清晰的认知。就是我们发现,比如说你去任何一个岗位,特别是比较高级的岗位,你去拉一个刚毕业的很优秀的博士生过来,他是做不好这个岗的。他得在这个岗位上有一些培训训练,有所谓的Knowhow和经验积累之后才能做好的——更加坚定了,我们一定得聚焦到某个特定的岗上去积累我们的Knowhow、积累我们的数据,基于我们的数据去做工程化或者模型化的工作,最终来达到我真的是在这个岗上能去教出来一个可交付的结果,这是我们一定要去做所谓的垂直本身这件事一个很重要的原因吧。王兆洋:有意思。我今天还特别注意了,大家在分享里提Manus的次数。我们上个月跟Manus交流,他也提到了我刚才提的问题,跟刚才你们分享的很像。Manus分享的是说,一开始也是说要做哪个场景。但后来它有一个思路是,我一旦选了单一的场景,用户可能只在那个场景需求发生的时候才打开我的产品。那我怎么样再去留住他?比如说,邮件的产品我就每天打开一次,所以可能变成了所谓的通用这么个东西。这是它给的一个叙事的解释。他也不是一个先入为主讨论的话题,而是后来慢慢就是大家想要去有一个分类的时候,出现了两个划分。或者说,市场竞争后出现了一些概念,才去讨论的。陈锴杰:我回应一个,我其实感觉是大家都在逃避一个事情——把这个话题转化成了通用还是垂直,大家都在逃避竞争。当我们讲垂直的时候,我们想说的就是:我是这个领域的,你是那个领域的,我们不打架,然后我们都能做,大家都能融资,都能发展。我觉得Manus在这个问题上,可能尤其艰难。因为在海外做General Agent,是明牌正刚ChatGPT。肯定有一些细节区别,但在很多用户心中可以等价替换了。PPT、视频生成,这些东西ChatGPT我相信肯定也都会有的,它今天的用户量你也挡不住。我Q3开始的时候还跟团队说,你们要知道ChatGPT已经有3亿DAU了;Q4刚来就说,你要知道ChatGPT有4亿DAU了。很多东西变化太快了。如果我们是通过这个词来思考竞争关系,我觉得其实是一种逃避吧。我在想的是,假设我有很多场景里面要解决的问题跟ChatGPT也差不多,我有什么不同的解决方案,或者更好的解决方法。我觉得可能是这个问题的本质。翟星吉:这个很重要。你在这个解决问题的时候,看到了其他Agent在解决这个问题上的缺陷,或者不满足用户的点。然后你觉得OK,我可以做一个东西,可以在这个方面去把它做得更好,能更加贴合这个用户。某种意义上是这个场景里面用户的专家,你是有足够多的Knowhow。你知道它会怎么用,所以你可以帮它定义这个产品应该怎么用,应该怎么做,进而在这个场景下面能达到更好的交付结果的优势,所谓的就是你提出来更好的解决方案。在吞噬一切的模型面前,Agent何去何从王兆洋:刚才聊到ChatGPT,可能未来是它的Agent跟各位Agent之间的竞争。刚才听的时候,我列了这么一句话:“在模型面前,通用Agent是不是伪命题?”这个刚才分享里也涉及到了,比如拐子也分享了从模型需要一个Agent来解决更进入到Action这个角度的问题,但是还是难以避免这样一个话题:模型越来越强,Agent会不会被吃掉?尤其是模型几家厂商下厂,还提出了模型加Agent的概念。从拐子开始吧。你们起名字真的是神出鬼没的,上一个还叫Agent Neo,这个就叫太监了。我问一个问题,为什么要做太监不叫皇上?拐子:我们产品名肯定不会叫太监,太监是内部的代号,刚才只是开个玩笑。我们内部很喜欢《黑客帝国》这部电影,其实我觉得技术定义上,或者一个更好的名词是Listener Agent。它是个聆听者,也更加直接更加易懂。太监是开个玩笑的意思,因为在中国语境方便理解。但我觉得上线之后所有的宣发还是叫聆听者这种感觉会更好一些。王兆洋:回到这个问题,对应模型和Agent之间的关系。好像Agent自我阉割成了太监,而不是去抢皇上的位置。拐子:首先我们先抛开刚刚发的新Agent,回到模型是不是Agent这个概念上。我觉得可能有一点:模型当然有可能在未来变成一个他们眼中的Agent,这个是非常有可能的,甚至像O3、O4的模型,我们看到很多能力都是达到Agent能力。我觉得这个问题对我来说它肯定很重要,但在用户那里不重要。用户关心的,只是帮他解决问题的是什么东西?我觉得,大家关注Agent是因为它比传统的大语言模型更进一步:它把输出一张图片,一段文字,一个5秒钟的视频,变成了输出到我手上可以交付的结果。无论是PPT,或者视频,或者其他什么东西,甚至也可以把各种东西全部结合在一起,这个绝对是在以前的用户体验上是更进一步的。这其实是Agent在做的事情:当然有可能以后模型会做这样的事情,当然有可能。但是我想说,首先从市场端角度考虑,,首先这玩意儿就是市场非常非常大,太大了。因为全世界做无论是知识性工作者也好,媒体工作者也好,还是用手机、用电脑的用户,都是agent的用户,他们需要用这个东西变现去赚钱。所以我觉得,在模型面前,通用Agent当然有可能受到威胁,但它不会是一个伪命题。因为模型再去做类似事情的时候,可能也是用的类似Agent方式。当然有可能成为一个模型去做,但最终依然是Agent实现的方式——我们知道他要调用,它要有记忆,在现在的模型训练架构上是做不到这样的事情。王兆洋:不可能是原生模型就能解决。拐子:对,“模型Agent”存在。我们把前半句话删掉,“通用Agent是不是伪命题”?我不知道。用户其实不太Care这个词。我觉得还是我们业内的人,或者一些媒体,或者投资人更关注这个词。因为我离市场是更近的,我觉得用户不太在意这个词。他在意的他这个Agent到底为他解决什么问题?它是为我做个PPT还是为我做Excel表格?还是什么都能给我做?可能我打开它的使用场景到底是什么我要在什么时间打开它,这个是我觉得所有产品现在都开始在关注的一个问题。王兆洋:你好像不光是CMO的身份,还有产品经理的角色。拐子:因为我自己本身是学计算机出身,我觉得思考产品这件事情就是在你团队的市场营销当中的。如果我们只做市场营销,买量就好了,或者做PR、做宣发就行了。但是我觉得现在新一轮的AI营销当中,一定不是只靠买量或者靠放量去取胜,或者只靠红人营销这种东西。这些当然要做,我一直会觉得如果只做这些事情都是大厂的机会了——谷歌他们占据了世界最好的营销资源,但是现在很多AI产品依旧没有找到PMF。甚至我觉得99%的产品依旧都是在很早期很早期的阶段,甚至世界最厉害的ChatGPT或者Manus这样的产品,大家都还在很早期的阶段,大把的机会。王兆洋:必须要参与到产品的定义里面去。拐子:是的,这样子才能知道你的用户是谁。因为CMO我觉得要离用户很近,要不然我都不知道产品是什么,我就不知道我的用户长什么样。王兆洋:这可能也是你们跟大厂竞争的好的机会,大厂里的CMO没有像你这么忙。我问锴杰一个问题。你刚才在演讲里也Diss了一下“太监”,说不需要太监,Macaron直接理解你。我理解你的意思是说,足够多的场景出现之后,其实通用就实现了。但这个事情,你真的能穷举吗?如果场景穷举到足够多走向通用,这是不是有点奇怪?尤其在模型他被大家认为是全知全能的背景下。陈锴杰:明白,没有Diss。大家其实是在不同的维度上去收集Context。作为“倾听者”能够从“生活声音”这个方向,去收集Context这肯定是非常好的手段。如果能24个小时,这个很理想,用户不一定会同意。我们收集Context的方式很不一样。我们希望通过用户不管是饮食记录、健身记录,还是日记,还是自己的旅行规划,用这些场景作为他的Context来做后面所有的事情。今天很多产品,我觉得都在不同的角度去思考Context的问题。特别是能不能把以前用户习惯中已经存在的Context用好,比如说相册,我觉得就是一个还没有大家被开发出来的Context的金矿。王兆洋:连苹果都没做得很好。陈锴杰:对,因为里面有非常非常多的数据。谷歌能拿到相册,可能谷歌的动作也比较难,因为监管很用力。但是其实,有很多东西在相册里,有很多生活相关的。我觉得大家其实是在思考Context从哪里来,不管是“倾听者”还是Macaron。回到刚刚的问题,通用、Agent和模型,这几个词放在一起,我们到底在讨论什么?我可能觉得,对通用和模型的关系,今天市场是有一些不同的想法的。去年,我们谈通用,是真的觉得它是什么东西都能做的,那时还是预训练为主。但等到RI\O1以后,预训练已经不是模型智能提升的主线了。模型智能的提升主要是靠强化学习、在后训练继续提升他的能力。如果他是强化学习,他就必定有一个对标的题目库。他一定要打题目,不管这个题目是有标准答案的、AI评价的,还是人类评价,他一定是有一个题目。在这个过程当中大家定义什么Beachmark,其实就会让这个题目产生不同的“Taste”——其实大家的Taste已经分化了。像Anthropic,它All in Coding以后,今天写的代码就是要更好。OpenAI也不是不想追,不是不想抢,还得等它故障的时候才能捞一点用户量出来。GPT5、Codex写代码就是没有Claude写得好,因为他没有在这个方向做足够的强化学习。反过来也是一样。OpenAI回答一些通用的问题,聊天和内心疗愈和How To的问题,就是比其他家做的更好。Anthropic也不想去竞争这个事情,因为也搞不来。所以你看,大模型都已经有分化的场景,我觉得我们再去讨论它是不是叫通用已经不是太有意义了。我们主要就是看他覆盖了多少?作为创业公司我们覆盖的就小一点。我就只能覆盖生活。可能是生活管理、生活规划,把你生活的衣食住行这个小方面;Flowith可能是创作方面,就是方向选择的不同。在模型面前,通用是不是伪命题,我觉得模型都不“通用”了。我们就好好干我们的领域,找到我们的课题就好了。只服务一个场景的Agent是不是预制菜?王兆洋:既然你们都辩不起来,我们就更犀利一点,“只服务一个场景的Agent是不是预制菜?”赖蕴琦:RockFlow是做投资交易的Agent,讲到我这个场景,大家就会觉得是垂直的。因为在我们这个场景里,不会说你帮我买个奶茶。所有的Agent就是解决一个任务或者完成一个事情,我觉得它只有场景的区别。上周五,有一个用户跟我们反馈说,他说“Bobby应该先问我今天喝酒没有,我刚才一键清仓下太快了,把所有都卖掉了。我下太快了,我不是想清仓的。所以我就希望他以后能问我一句,你今天喝酒没有。”我觉得这个答案,都不需要问,从他们的Agent里就可以拿到答案。在不同场景下,我觉得可以很好使用的,甚至可能包括金融和医疗,他们的Agent都非常垂直,但其实他们也能互通——比如说你的身体状态不好的时候,确实不应该交易。其实我可以得到你更多的健康Data,让你的交易Agent可能更懂你这会儿的状态,做很多相应的改变和相应的变化。我其实也比较认同:不太有真正的通用和垂直的区别。你到底在为用户解决什么问题?只要你能解决这个问题,就是很有价值的产品。王兆洋:我觉得RockFlow这种产品,像是你把AI放到了本来就已经有的体系里。而不是说从模型能力开始,从今天所有人都非常兴奋的技术进步里面,重新思考我怎么样做一件事情。因为我们台上其他三家,应该都是ChatGPT3.5之后诞生的公司,RockFolw是之前想在金融领域做一个,甚至还带一点类似媒体属性的公司。尤其是我们都知道金融行业里面一旦涉及到交易,你的ROI跟你不涉及到交易的ROI是完全不一样的。所以这个我也比较好奇,于是有了个预制菜的比喻。好像这个Agent也是前面很多东西都准备好了,然后加上了一个AI的东西。赖蕴琦:我觉得这个问题提的特别好,我简单讲一下我的历程。我应该是比各位都大一些,我在出来之前工作了十年。十年中大概有四五年是做AI的产业,有四五年做AI的一级市场投资。所以我其实之前一直在做AI相关的事情。你说的非常对。第一部分RockFlow不是从2023年或者大模型之后才有的公司。从我的背景,你应该能想到我当时为什么要做这家公司。当时我要创业的时候,打开所有我们生活中用的APP,像Tiktok,它都是个性化的。但是无论你打开任何一个的Trading APP都不是。我9岁就开始交易,我对这个事情很敏感,我发现这个事情很不对。我当时觉得RockFlow就两个事情,一个是ALL In ONE,就是我一个平台可以交易所有的行为。第二个叫做AI Native。我是从机器学习那一代做推荐系统“凤巢”出身的。一开始,我们是2011年Q4开始做这件事情,有这么一个递进的过程,用机器学习的能力去实现个性化的体验。因为这个很有意思,今天很多00后的创业者或者投资人,尤其是投资人,上来跟我说他觉得现在还没有什么落地的应用。他说这个事情我就很懵,因为想说整个移动互联网都是被推出来的,怎么没有应用了呢?因为我的技术负责人也很懵,他原来是百度深度学习研究院的Leader。他说,我是谁,我这十年做了什么?当大家定义AI的时候,首先代际之间有不同的定义。回到你刚才说的,我们这个产品确实比较特殊。我一开始想改变,用现有的AI能力去实现这个产品的个性化和更简单的体验。直到今天,我依然会告诉大家所有To C的产品本质上都是做产品的公司,不是做技术的公司。今天有没有大模型,我们都应该把用户好用这件事情放到绝对的第一位。如果确实这个场景,是不用大模型可能更好用,我觉得对所有创业者来说没有任何一个人是为了做AI而做AI的。一定还是说我要去满足用户的需求而做。所以,这个可能是我今天对这个产品什么样好的产品一个定义。大模型出来的时候我们做的第一个产品叫交易GPT。如果有老的用户应该知道,我们个性化的推送交易机会,当时叫交易GPT,Trading GPT,第一个用大模型做交易类产品的。王兆洋:当时就是“全世界第一”了?赖蕴琦:对,在这个过程中我发现一个非常重要的事情,为什么做现在这个Bobby?因为依然不够简单。即使我把Rock Flow做成一分钟开户一分钟入金,非常简单的交互的页面,我发现用户依然还会有很多的问题:比如他不知道怎么下条件单?不知道当一个事件发生的时候跟他的持仓有什么关系?不知道当他睡着的时候,账户里的持仓该怎么管理?不知道当他看到拉布布排队的时候,他可以买些什么?他们依然在认知买什么和怎么买上有很大的问题。我们在2023年的9月份的时候就立项了这个产品。所以现在的Bobby,是在座做的最久的Agent产品。因为这个垂类比较特别,金融和医疗是相对于比较难做的两个垂直领域。所以我们用了接近两年时间去搭建我们这套Agent架构,才在往上长出了第一个叫Bobby的产品。我们马上会发出只有Bobby体验的产品,在Web端可以直接用,没有trading app,就是对话式的。我们发现越来越多的用户,能够直接通过对话,了解发生了什么,应该买什么,怎么选期权,再到交易,直到都用对话完成。所以其实我们是有一个演变的过程:技术做的很简单的时候,依然发现用户还是用不起来;到Agent这样通过自然语言的交互能力时,拆解这个产品,了解如何把大家的个性化需求更好的满足;Bobby出来以后,我们定义了这个产品认为应该是能够比1.0的Rock Flow更好的,上线以后发现,it works。对于绝大多数的人,无论是有一些投资经验,还是几乎没有投资经验的人来讲、Agent的形式是能帮助大家更好的完成他在投资上很多很多需求的。我觉得我们也是一个范式,也算是给一些相对比较垂类的创业者一些不同的经验吧。王兆洋:我听下来是可能用了新的这波AI的自然语言交互能力,加上你们一直在做的更新。最后做了你们最想做的Agent这个产品“Bobby”。之前一直的痛点是,没有办法像今日头条或者淘宝这样的千人千面,让大家个性化的去得到自己交易的信息。我之前在一家财经媒体,我们当时推出一个付费的产品,就是给这些做交易的人。因为在国内,媒体很难做付费的,但是那个付费很好。因为做交易的人对信息非常敏感,他比别人早知道5分钟他就可能多很多盈利。这个导致说,信息这个东西是不是个性化,反而不是什么好事。比如,你认为这个信息对他没什么帮助,然后就不给他推,然后他就变成了韭菜。会不会反而Bobby,会带来了更多的韭菜?赖蕴琦:不会,投资是一个非常个性化的事情。这件事情,我认为今天在这个行业大家最大的一个想法上的不同:每个人都会说投资是为了赚钱,就像你买衣服也是为了好看——我会经常举这个例子。但如果每个人的好看都是一致的,淘宝就不应该有淘宝,他就应该做优衣库,他应该自己生产SKU,投资也一样。赚钱这件事情对每个人来讲定义是完全不同的,它是风险收益。有人一年希望翻倍,我可以接受损失本金的风险,所以所有的投资中的赚钱都叫做风险收益。如果每个人,他的生活不一样、三观不一样,他在投资风险这件事情中的收益目标会完全不一样。所以,在投资这个平台上,它真正交易的商品不是股票,也不是一个标准化的信息,而是个性化的交易机会。所以我觉得这是可能我创立Rock Flow和Bobby,跟很多前辈友商或者其他金融行业,想的不一样的地方。王兆洋:我今天去体验了一下,觉得非常神奇——没想到Rock Flow给我的体验跟Macaron体验是最相同的,它给你充足的情绪价值。你上去他会给你说你这个选项非常棒,我们来一起做空英伟达吧。但我不太相信它能做到这件事情。我对星吉也是这个问题。你非常有勇气,在自己的PPT里把遇到的质问都放进去了。最核心的质问可能就是RPA这件事情,它“是不是SaaS的还魂?”翟星吉:是的,回到这个问题的本身,如果让我给一个直接的答案:肯定是,它肯定是预制菜。但是这个预制菜不是Work Flow层面的。因为本质上模型是数据的产物,Agent或者模型能做的事也是数据的体现,是环境中数据的体现。本质上来说只服务一个场景的Agent,是因为它有这个场景下更多更好的数据。比如说我们现在所谓的通用的base model,它有很强的泛化性,这是建立在两个基础上:第一个基础上是它的架构,以及它的参数规模带来了所谓的涌现,然后带来了一些能力。第二,再往下更基础的是它的语料,它的数据,它有整个互联网事件上所有的数据,基于这些数据可以让它去做类似的事情。但是你比如说再到进一步,为什么O系列和R1会发?本质上是我基于强化学习我标了一批更高级的数据,更高质量的数据,更长思维链的数据可以让我有一个类似react的能力。同样的,所谓的垂直的Agent,或者垂直的东西,能在垂直场景下有了更好的表现,本质上来说就是作为垂直的厂商在这个场景下有了很多数据,很多Knowhow。然后大家把所谓的数据也好,Knowhow也好,变成产品的过程中去服务于用户更好的体验。变成所谓的产品过程中可能体现了两个东西:第一个就是要通过工程化去做,我通过Work Flow,通过Agent架构,通过Context管理;第二种,我有一个更泛化的能力,我把数据变成Agent的微调,或者后训练等手段,把它变成模型本身的一部分。但本质上来说回到初始的二问题,我回答问题比较坚定,它是预制菜。王兆洋:所以预制菜被污名化了是吗?翟星吉:预制菜也蛮好的,就是产品和价格的问题。用一句话说清什么是agent王兆洋:有意思,刚才我们聊到很多产品的细节。我开玩笑说去年这个时候我们在旧金山参加Tech week,十个人里面有九个是Founder,五个做agent。翟星吉:另外四个做什么?王兆洋:还没想到自己也可以叫agent的公司。现在可能九个都是Agent。我基本上见到每一个Agent公司的Founder,都会问一个方面的问题?能不能用你自己的一句话来告诉我什么是Agent?我先抛砖引玉,希望能引出更好的。我觉得有两个是我觉得非常棒非常妙的总结:一个是Anthropic的朋友,他说Agent就是Models using tools in a loop。很精炼的一句话,顺着他这句话就能解释做这件的事情。另外一个Genspark的co-founder,在我们的活动上说的。这更多是从产品角度给的一句话,他要做的Agent是把Cursor给开发者带来的体验带到所有行业。这些我目前听到比较好的,现在同样的问题给四位,看谁先?陈锴杰:我觉得比较简单,能帮你做事就是Agent。而且你也没说AI——我们如果做媒体,经常找Agency就是帮我投放,它就是Agent,只是不是AI而已。我觉得就是能做事。今天有的事情很简单,可能聊天就能实现。帮我做个照片,你如果打包一个界面,放在市场上说,我做一个“照片Agent”也可以。只要能做事就好。我觉得没有什么其他复杂的东西。王兆洋:你看anthropic怎么定义,他做的事情也可以理解,不用再纠结更多technical的东西。陈锴杰:因为我觉得今天的“实现”是会变的。你今天是in a loop,明天可能是in a tree。今天Cursor,明天Cursor做黄了之后,我相信会换成其他词,变来变去。归根到底,你今天做的东西能够帮用户把复杂任务做掉,然后它后面的实现方式。我随便想一下:未来可能有一种Call Center,大模型会给人类的Call Center打电话,让人类帮大模型做一些大模型不好做的事情,再返给大模型。那这个你说叫什么?当然也有可能是一种Agent。拐子:Human in a loop。王兆洋:拐子想好了吗?拐子:刚刚讲了两个特别的务实、非常具体,尤其是对业内的从业者来说一句话就能听懂Agent在干什么。我稍微抽象一点。我之前看到一句话,这不是我原创的,他是说“是一个可以感知环境的智能实体”。说白了就是拿Context。一方面收集Context,一方面储存Context。我觉得刚才说的特别好,能帮你干事的就是Agent。但是我觉得后面还有一个很重要的东西,anthropic的观点我觉得能同意50%,但我觉得Multi-Agent一定是未来。当然Multi-Agent也有他的局限性,协作性cooperation和冲突,很多事情都会成为阻碍。但我觉得在我生命有限时间应该能被解决,一定会发生。王兆洋:目前flowith还是单一agent?拐子:我们接下来马上就要发multi-agent了。我觉得我们要做大胆尝试的,Multi Agent一定是未来,证明单一的In the loop会发生改变。包括cursor也有可能。因为这个产品形态,完全为了代码IDE加上单一的Agent去做的。现在很多程序员会诟病,比如像Cursor右下角显示一个进度条,你的Context到了一定的数据,幻觉率会增高。所以Context可能是一个限制级的新的条件。未来模型能不能解决是一方面;Cursor自己能不能想一些办法解决,在Agent能不能想一些办法解决?都是新的尝试。王兆洋:一会儿也会聊到。Agent在模型之外到底在做哪些技术的事情,可以深入地聊一些。翟星吉,我问这个事情之前,你们有这样想过用一句话来解释agent吗?翟星吉:坦率的讲,我以前没有特别的用一句话抽象的。但我觉得大家的观点在某种意义上趋同,站在更高的视角,站在组织或者结构视角,我认可Macaron讲的——什么技术不重要,重点是你希望用Agent带来的是社会的变革、组织的变革,带来全新的生产力。所以从结果来说,很简单。真正的能去交付掉以前一个人去做的事,不仅仅能做,还能做好,能完全的交付掉,我觉得这就是一个Agent。就像刚刚讲的,可能未来完全是Multi-Agent系统,某些人本身就是一些Agent的doers。因为本质上人也是一个金字塔结构的组织。在组织里面是不断的去一层一层协调的,有项目管理PM这样专门为了组织而存在的一些角色。项目经理就是最终结果负责的人,项目经理是一个Agent,下面干活的人也是一个Agent,然后他们构成一个Multi-Agent系统。王兆洋:扣题了,人人都是Agent。赖蕴琦:我同意锴杰说的,解决问题的节点,都可以称之为Agent。王兆洋:挺有意思,Agent这个词。在这波AI,尤其是OpenAI开始,带了一个坏头。他发明了很多概念,非常炫酷的概念,一天一个。我印象最深的是,有一次Open AI被《纽约时报》起诉,说它盗用语料。Open AI给的解释里面甚至用了“反刍”这个词,来解释他明明就是盗窃语料没有给对方版权费的行为。但在这么一系列的各种概念里面,结果Agent这个词最后变成了一个今天的。我加上今天这场,这个月有四场Agent主持。Agent这个词很有意思,上个月在硅谷正好在斯坦福做Agent交流,我有个朋友是斯坦福考古学的博士后。我问你为什么过来听这个?他说Agent这个词是我们人类学里的词。他解释了一下,除了人以外的物体,你可能赋予了它某种人类的属性,让它能干一些事情。从这个延展出了Agency也好,旅行社也好,或者帮你中间做一些事情的中介。这个让我突然意识到,很多人工智能的或者计算机背景的人,在用一个其他领域的词的时候,其实根本不Care它这个词从哪来的。刚才的回答让我意识到,我们真正做这个事情一段时间之后,又回到本源了——陈锴杰说的Agent,可能在人文社科领域的定义。很有意思的是,同样的问题给Genspark、Simular、Lovart。我在台下就听到两种不同的声音:一种是我们文科生背景的,大家觉得这个很有意思;另外几个也是做Agent创业的,小声嘀咕说这是什么问题?我们为什么要关心这个?但其实我觉得它是很有意思的融会贯通,最后真的交叉在一起。能想象RockFlow长成Macaron的样子吗?王兆洋:接下来可以从产品角度去聊一聊。因为一开始是辩论嘛,我自己列了两两成对的话题。先是RockFlow跟Macaron:你能想象RockFlow长成Macaron的样子么?我其实会觉得有点那个味。赖蕴琦:我们就是很像的。RockFlow的第一个slogan讲的就是,投资是一种lifestyle。我上周还把陈锴杰的访谈转给我们同事:这是跟我们说话感觉、理念上非常非常像的一家公司,因为投资也是在生活中方方面面——你的认知转化成交易。回答你之前的那个问题,很难趋同。举个例子,前几天我在贵州做公益,跟几百个CEO在一起。那一次我跟大家讲,某一个Crypto公司可能会有一个很大的变化,发现全场就一个人买,但当天涨了20个点。所以我讲了同样的话,但我的信息只Match到了那个人,其他七八个人都没有这个概念,所以他也不会听到这个事情。你会发现第二天,有另外一个人量子计算的创业者,表达说量子计算怎么怎么样,当天另外一个人就去操作了相应的事情。所以你会发现即使是看起来大家的认知水平、学历水平都差不多的情况下,依然他对于自己投资偏好,甚至品类是有明显差别,即使这两条信息都可以赚钱。所以其实投资很多时候我们叫做赚认知范围内的事情,这个很重要。很多人他感受不到自己,AI很多时候比你更了解你自己,所以其实我觉得我们本来就挺像的。陈锴杰:我也觉得挺像的。因为Macaron里面,我们未来也会想象插入很多不同的MCP的Agent。我们现在也有对接一些外卖这样的Agent,未来类似交易这样的场景都有可能长进来,本身其实是蛮像的。而且所谓的通用垂直,说不定最后有个大入口,大家做的所有垂类全部插进去。我觉得也不是没有这样的可能性。王兆洋:其实我看RockFlow的资料,有一个很有意思的是,你好像比较明确的说我是给年轻一点的投资者。这也是历史上从来没有的吧,没有一款Trading APP告诉你说,我是针对女性的或者男性的,针对18岁到20多岁的。但现在可以了。包括Macaron,从生活角度。对于情绪这件事情,可能所谓年轻人会更容易对这个事情买单?变成一个你在可能比较成熟,或者之前没有缺口的行业可以撕开裂痕的一个方法?这个可能也就是AI这波产品才会有的机会。赖蕴琦:我很同意,你前面聊到说,技术和人文社会学完全Mix。这个点上非常典型。为什么我们会上来先做GenZ?因为投资是一种生活方式,这个事情不需要去教育,就是这样的。所以才会有Robinhood大战华尔街这些事情。这个事情的底层是什么?第一,因为年轻一代,经济基础会更好的,所以他们的成长过程有更足的底气。第二,确实这些新一代的用户会觉得,这就是我的生活方式,这是我想去表达的东西。他不存在一个可能80、90之前的“一致性”——所以他会有更多的愿意,去表达的诉求,更多想要去表达“我是谁”这样一件事情。当他的个性化需求极其强烈时候,所有很多的以前的APP展现形式。我今天讲的Agent,其实在解决很多APP展现形式的问题。比如说携程,我们订酒店订机票是基于以前做产品“最大公约数”抽象设计出来的。你会发现说,大家需求很不一样。就像大家去旅行,以前可能穷游和有钱一点游,现在发现说大家游去一个地方的主题非常不同。如果每一件事情他的主观需求很明确,你用以前那种产品基于功能的产品形态就解决不了了。所以其实最好的一个表达是Agent这样的技术能力。支持Agent的产品,带给了满足一代人新的心理、生活等各个方面的个性化需求。他们就碰上了。所以今天不仅是RockFlow,包括美国很多人做Fintech领域的从业者,很多都是20-30岁的年轻人。因为他们的需求和这样的满足方式是非常Match。这是我的领域和锴杰的领域的共同点。王兆洋:锴杰在接受我们采访时有提到,如果是100分的话,这个产品你自己给自己打8分,不是非常准备好的产品。我让Macaron给我做一个我看球记录的,我每次看完足球比赛,跟你说比分。但他做了踢球的很简陋的东西。OK,Macaron这个东西很漂亮,年轻用户说情绪价值很不错,聊的也挺好的,他没有交付我想要的,我可能可以接受。但RockFlow可以吗?它给我的建议,让我亏钱了。不可能说这个产品给了我情绪价值我就不在意这个了。这个是非常现实的,也没有去回避的话题。赖蕴琦:100分满分,我现在打分也就是5分、6分、8分这样的水平。王兆洋:这也是我想聊的。产品不成熟的情况下,可不可以做增长?赖蕴琦:回答您刚刚的问题:AI是做不了0到1的。所以对于一个东西的看法和想法,开始一定是用户自己表达的。Bobby等所有产品,因为是有监管的要求,每一步会跟你确认的。他只是告诉你基于你问他的东西,告诉你一些相应的fact。比如,你说帮我选个牛人我直接跟单。我发现最后跟单,其实是最大的需求。在你表达这个需求以后,他会给你结论、告诉你推导的过程、你要确认,所有的下单是有两次确认的。所以这个场景反而好做,因为监管是有明确要求的,你就按它的方式做就好了。就刚才讲到的,我不是帮你做选择,而是在你的逻辑下我告诉你:你的想法,对应的在投资中的Action是什么。王兆洋:很讨巧啊,按照金融监管的方式,一个有交易属性的产品不太好讨论情绪价值,也根本不能像刚才那样说我在饭桌上一个建议就能让你赚20%。但现在我是金融+AI了我可以把这些都甩给AI了。语核和Flowith可不可以互相替代?王兆洋:Flowith是自由画布,它是你们首创的东西。背后也隐藏着一件事情:刚才说的后来发现有不错的场景,非常适合用我的这个产品去做干嘛不做?在B端里面,刚才我们说的简称为数字员工的话,Flowith是不是也可以完成这些任务?反过来也是,如果你能够把一个垂直的领域抽象的很好的时候,是不是也变成了跟生产力相关的,另一个版本的Flowith?翟星吉:我觉得完全没有太大的关系。王兆洋:没有关系是说它也替代不了你,你也替代不了它。翟星吉:对。Neo之前弄的无限画布的交互,我蛮喜欢的。本质上它跳脱出了大家对ChatBot或者Chat UI的一种交互的惯式——这是我们很认可的,我觉得Agent不一定是要通过Chat去展示,它可能有许多更加适合于它特定场景交互模式和交互方式。我们的垂直Agent,很多时候它的要求不是一个Chat,可能是通过GUI触发。我觉得我们俩可以借鉴的地方,但从本身从场景或者产品来讲,我觉得完全可能没有任何的、潜在的、可以被替代的可能性。拐子:我想Cue一个词,是我们今天一直在潜移默化地提的一个词,Taste。无论是Macaron、RockFlow,还是语核,我觉得我们的taste都是好的,但都是不一样的。我觉得我们的Taste跟团队的基因有点关系——首先我们几个人都挺特立独行的。我们2023年开始做画布,Derek发Neo的时候,他发了一条即刻,说人们根本不知道我们当时有多痛苦。非常痛苦:我们大概有两万个内存用户80%的差评率,就是这么恐怖。画布是天然不被人所喜好的一种交互方式。我们还是更喜欢微信的聊天框,用小红书,各种各样的社交软件。我们是被传统的GUI“去个性化”了的。但我们出发点是不一样的。我们还是觉得人和AI最终交互方式应该不是这个东西。我们想做一种新的尝试。基于此,这条支线上还有很多。我们觉得Agent是未来的方向,我们觉得还会发生什么,我们为什么要做知识库、Agent,我们为什么要做这些东西。我觉着围绕着最开始Flowith这个名字诞生,因为我们想,人的思维是多线程的,我们觉得AI未来的思维好像只有多线程才可能去创新。当然,你说要在专业领域场景当中,B端或者量化交易场景当中,我们是不是应该解决幻觉?我觉得是。但我觉得古往今来优秀的设计师,比如说第一个造出来苹果,或者造出来最近IOS新版本的液态玻璃的团队,好像都在画布这种场景当中更容易发生,这是人机协同的平台。画布当然现在被我们验证了,可能有很多产品在做画布的东西。我觉得我们跟语核本质上在做完全不一样的事情,出发点不一样。可能未来我们做Agent可能做得很好,或者很差。但我们都还会想,我们出发是因为要做画布这样的东西。我们最近其实回到画布了,我们做了很多画布新的东西,会在下一版本里面去更新。王兆洋:你说新的版本,哪怕是声音进入,也是在自由流动在画布里?拐子:我觉得不能算完全自由画布,因为Neo的生成像一个尚方宝剑一样,一直往下(流)。我们想做到一个是Agent既重要又不重要的一种感觉。从产品理念上来讲,用户在打开一个画布上,会有打开一个Figma/profile文件组的一种感觉。比如说,我是设计师,今天要为硅星人这个活动要设置一组UI,加上小红书图文加上公众号图文的东西——你可以在一整套画布做完。你可以调用不一样的工具,可以是Agent,也可以不是。你可以打组,或者有细胞有丝分裂的感觉。这些小红书我可以喂给下一段Agent等工具,变成更加自由的画布。你可以是跟GPT聊天得出来的结果,你也可以是跟Agent聊天得出来的结果。在画布上更加自由——无论是语言输入、图片输入、视频输入,都显得不重要,我们会让它更自由一点。而且UI、审美这些东西,我们团队还是比较注重的,因为我们是纯做C端的。尤其刚才我们在讨论,AI用户趋于年轻化,大家对审美要求是非常高的,所以我觉得有一个审美的产品还是非常重要的。“Agent公司也配谈AGI?”王兆洋:下一个话题。除了模型的一些技术之外,Agent这些公司在技术方面到底做什么样的事情?或者你们重点放在哪里?我发现有一个很有意思的现象,很多去讲PPT的时候还会引用一张图,应该是两年前Lilian Weng文章里,最早列出来Agent的结构:中间是Agent,上面是Memory,下面是Action,左边是Tools,右边是Planing。我很好奇,这个东西是不是已经过时了?如果没过时,按照这样四个区分的话,你们觉得现在技术上,更需要突破的是哪个?刚才也提到很多,Context这边需要突破。Manus CTO也发了一篇影响比较大的,讲上下文工程里面做的脏活累活。各位可以跟大家分享一下。陈锴杰:我觉得今天的核心点不是那四个模块在专注什么,因为反正大家都在做。今天的技术上的核心点其实是:你在做Context engineering还是在做Reinforcement learning。基本上是两个大的派别,然后Context engineering其实代表的就是Manus他们做的很多东西。这里面其实他有很多的论点,可能最重要的论点就是,你如果做Context engineering,你的迭代速度非常快。你可以“以天为单位”来修改你的提示词、你的Work Flow、你的公司调用。王兆洋:从技术角度,好像AGI只有技术模型才能实现?陈锴杰:首先AGI已经实现了,如果你对AGI的定义是图灵测试,或者能够完成复杂任务。要实现怎么样才算AGI呢?上路开车,还是要帮你把家里收拾了。这个AGI一会儿再谈。回到Context engineering和Reinforce machine learning。Context enginnering代表派别就是Manus,然后Reinforcement learning的代表派别就是,,从纯应用公司来看就是Tinking Machine Lab比较典型一点。他们做的也是比较偏后训练Reinfocement learning这块。这两个的特点其实不太一样,如果你觉得做Context engineering肯定很快,是没错,它的缺点你的整个系统优化不一定是向着唯一的函数去走。做engineering最常出现的问题就是翘翘板。当你把某一个问题用某一种流程按下去之后,它在另一个特性上表现开始变差。比如说时间变长是最常见的tradoff,或者模型要变贵才能解决一个问题。或者是当你把模型注意力关注到某一个方面的时候,在另一方面自然而然效果会发生变化,或者体验会发生变化。这是Context engineering不好的地方。强化学习反过来好的地方很明显,你只要有一个唯一指标,你这个指标就能不断被模型优化迭代。但这个唯一指标很难定,就是你得找到最好的题目,不管是你要写代码,还是要解数学,这个题目得出的好。算法其实也不容易,你要在700B的模型的模型上做强化学习,你要攻克的难关是非常多的。今天国内可能只有DeepSeek、Kimi、字节,比较能证明在在这么大的模型上做强化学习。可能很多大家看到的其他公司其实做的都是更小规模的强化学习。所以它本身这个技术是难的,找到指标是难的,但是对指标的优化是非常自然而然的事情——有点像抖音推荐视频会自然而然推荐的越来越准。这里面当然也有一个和刚刚Context engineering的对照,它的时间会更慢一点,除非你做很多优化——像我们为了做应用,其实是在牺牲了一些准确度的情况下,把算力的计算量和卡的需求量砍到了原来的1/10,流程化学习,牺牲了一些效果上,但是把训练时间砍断了,比起3-6个月,我们大概2-3天能训练一次。王兆洋:其实Macaron大家太多关注粉色泡泡,而不关注你后面怎么调校的问题。陈锴杰:对,因为这些东西用户看不到,要不是问到我也不会主动讲。后面为了把训练变快,跟上用户的迭代节奏。我们发布到现在大概一个月,这一个月里面已经迭代了很多个版本和功能。为什么能做到这样?就是因为我们强化学习是牺牲了一点之后,做了很大的效率优化。所以我觉得这两个是今天重要的对比,而不是我在做哪个方向。最后谈一个AGI。我觉得今天已经AGI了,今天我们不是Work toward AGI,已经都是Work from AGI了。我们要用AGI来干什么?当然你也可以说AGI是要干嘛干嘛才能AGI,我觉得那些都不是很重要。今天AI已经不是很强,但是一直在进步,进步的也很快,在这个里面到底做什么价值、做什么场景其实我觉得更重要——比起我们配不配这个问题。王兆洋:我觉得这个还是很有意思,如果认为AGI已经实现了,去做一个产品的角度,可以更好的理解Macaron为什么长这个样子。陈锴杰:对。今天做的小应用,像刚才说的,要记观看足球,记成踢足球,这是今天它不够聪明的体现。但我相信所有人对AGI的相信是:这个问题今年不解决,明年也会解决,要不然后年解决,它不会太久。拐子:你刚才说的那个四宫格,有点像我们的底层架构那种感觉,大家或多或少follow这种模式去思索。刚刚Macaron也说了,有几个大家比较关注的点,以及有两个主要方向,我是比较认可的。我分享一下,在Context Engineering这条路上,我们也是比较典型的代表——我们上次发了Neo,主打无限上下文。我承认这个无限肯定有营销的噱头在,但它的上下文突破,肯定是传统模型的十倍百倍都有可能的。因为我们也做了非常多的工程优化。我分享两个小点:一个是当时我们在设计产品设计的时候,我们想了一个场景:人是怎么写论文的?写论文是先去做Literature Review,然后再写Body Paragraph。你引用了很多文献到里面,最后才写了最后一个自然段和最开始的自然段。一切不是按顺序出发的。而且你在写完这些之后,会分门别类的把每一个顺序去进行修改。这就引出了我们当时产品最想有的逻辑:首先,你工作不一定非要按照我们传统AI工作的方式去做,你的思维结构是可以被打乱的。按照更符合完成这个任务的指标去做。这是你Agent当中在Context部分需要衡量的事情,不同任务的步骤是不一样的,但是AI是不知道的。第二是,你在最后完成这个任务之后需要Refine。现在这个产品很多都有了,像Cursor写完代码后会优化。但是在优化的过程中你会发现,代码优化的轮次过多,你模型上下文的Token就会爆炸,会很贵。这个地方你到底要做什么样的工程优化?选什么样的模型?什么样的任务场景?会要做非常多的任务适配任务场景。而且这个Refine也不是那么好做的——什么时候需要Refine什么时候不需要Refine?是主动发起,用户发起,还是我们发起?这个东西都是工程当中需要做的特别多的地方。这个Refine模型我们都做了快一个月左右。要做的好还是要做很久的,因为要测很多场景。我觉得还有一个点,在tools上,tools其实就是MCP。MCP的概念很火,我帮大家科普一下:在我的观念里,MCP就是螺丝钉的型号,统一了螺丝钉接口,让所有螺丝钉都可以用在这个凳子上。大家希望有更多的tools出现,MCP这个生态虽然火了,但很多问题依然没有被解决。比如说,我想拿到特定场景的信息,或者有更优质的信息源。我们现在很多tools都是在解决一个问题:我们想获得更多的信息,无论是Browser Use、Computer Use还是Phone Use,或者说是爬虫、RPA或者其他东西,其实最后很重要的问题就是需要获得优质、精准的信息来源。一方面技术要解决,一方面刚才说的Context要解决的事情。在技术上要解决的话挺难的。有刚刚像Macaron说的,时间的问题。Computer Use、Phone Use是非常耗Token,成本非常高的事情。而且在未来,可能不太科幻的事情。因为你很难想象Agent或者模型足够强了,你让它操控一台显示屏——因为它完全是基于人类的显示器交互方式去做的。但如果我们把显示器去掉只留一台计算机的话,好像我们可以是去使用的。在这些tools选择以及我们要不要自己做tools,这就是Agent公司需要做很多的事情:因为有可能,你做一个tools之后,第二天模型给推了一个更牛逼的出来,直接这个tools就白费了。很有可能发生的。做什么tools,什么tools可能大模型厂家会做,什么tools他们不会做?我们这个时候只考虑文字模型,还要考虑图片、视频、3D各种多模态的模型?甚至以后,比如像Genie这样的世界模型出现之后,这都是你Agent生态当中的一环,它们怎么样符合你架构当中的一些东西?这一方面是模型的事情,一方面是你对tools的事情。翟星吉:我觉得这个问题本质上,其实是大家的场景不一样,就是所有在自己实践里面都碰到不一样的点,大家努力的方向都不一样。像我们我们把它分为三层吧。第一层,其实很多时候是被忽略掉的。特别是To C的Agent,被忽略掉的内容的解析能力。不管是复杂的各种Excel的各种文档还是流程图,还是各种音视频的录音录屏等等一系列的东西,看起来要读它模型好像很简单,实际上很难。因为人是一种复杂的生物,人在看到信息的时候是会进行大量的推理工作的。举个例子,我们常看各种PPT,PPT里面就有很复杂的各种架构图,就是第一层、第二层、第三层,横着看竖着看,这是我们很经常人类去用的表达方式。但事实上现在模型对于理解这类信息的能力很差。再比如说,有个人去讲PPT,录了个屏。人再去听的时候,一方面要看这个PPT本身的信息,另一方面还会看这个人讲的信息,再综合起来,再去推理、再去思考,得到它的信息。这其实都是我们在很多方面的第一个点:最基础的点,叫内容解析能力,这是经常被大家忽略,但事实上如果你在对一些对结果准确率要求很高的场景下,这是会很难很难的一类要解决的Case。第二层,跟上下文管理相关的。我们会在不同的方向去做一些努力,除了常规的上下文管理以外。举个例子,在一个岗位工作里面,人类去用不同的资料,它的组织方式是不一样的。就举我们产品里面的例子,比如说我们是一个解决方案专家,他需要常用到的资料中:一类是公司介绍、产品介绍。这样一类PPT的介绍信息,它里面的每一个段落、每一页片子的上下文跟前面后面的逻辑关联性是没那么强的。还有一类,可能面向某一个案例做了一个最佳实践,做了一个PPT的标杆案例。它是一个很完整的内容,是最开始介绍客户本身是什么,然后介绍客户本身的背景、痛点,然后再是路径、客户的评价最终的效果等等一系列的东西——它是很完整的上下文,不能从里面任意的拿一点信息出来去随便用,必须要被重新的组织,被重新的架构。对于这两类信息,其实大家如果真正在做Agent的过程中就会发现,其实人类在处理这两类信息,不管是在去初次理解它的时候,还是在理解完了之后再加工再输出的时候,人的逻辑都完全不一样。这就意味着,其实我们要在一些特定场景下,一个垂直的岗位下,要把Agent做好,你要预知很多你面向这个岗位本身能接触到的一些知识和信息的理解。把你的理解,转变成所谓的“信息的构建”和“组织生成的方式”的一些预制算法也好、逻辑也好,然后让它可以变得开箱即用——这是保证准确率很重要的前提。第三个层面,你的Agent里面,我相信大家不管Macaron还是Flowith应该内置了一些workflow的tools。这个是大家对某些场景的先验知识的封装。因为在某些场景下,人类是有足够的先验知识,能稳定的以很高效的方式去输出的。大家在这个场景里面就会积累大量的先验的路径,把它封装成一个tools,类似MCP的东西,然后再给你上层的Agent去调用。这也是大家在各自里面做了很多的工作——包括你把它封装成一个Work flow可能就是很基础的工作,有很多场景封装不成Work Flow,你就需要做更大量的工作去保证它的泛化性。就要去涉及到数据的标注,数据的合成等一系列其他的工作了。王兆洋:RockFlow最后讲讲我们就结束了。赖蕴琦:我快速总结一下,前面几位在技术层面上表达很多了。这个事情的本质要因你的业务场景而定。所以你其实理解你的业务场景中要定义的关键问题是什么?然后基于这个关键问题去找最重要的,最好解决的技术方案,或者最关键的技术点去提升它。比如刚刚讲的Agent,Multi-Agent,我们的架构设计中高度抽象、分很多不同的具体的场景。但像刚刚讲到的下单,计算购买力这些明确的事情,不需要太发挥,它一定是一个很明确的work flow,而且它越不发挥越好。现在还没有在RockFlow交易的话,你问的很多问题他是有想象力的,不能把它写死在Work Flow里面——所以他应该有可创造的可能性,我们不能用产品去表达定义这个需求。所以,核心就是抽象你场景的需求,去定义这个需求中关键的问题,去解决到底用哪几个关键技术点去解决是最好的。所以,我觉得对每个公司来讲还是匹配你业务和场景的一个问题。我再说说第二个问题,我觉得AGI一定会到来的,我非常同意。整件事情,技术上的进步不是今天就是明天,不是后年就是大后年。我们现在能做的,所有在座的各位,所有我们能做的事情,就是我们只要在今天的技术水平上,尽可能地把我们能给用户提供的产品提供出来,我觉得这件事情就非常值得大家互相鼓励。所以还是这句话,我觉得勇敢者先享受世界。
16小时前
2
被庞加莱猜想吞噬的数学家们
翻译|武晓宇来自希腊的苦行僧20世纪50年代,第二次世界大战刚刚结束,普林斯顿高等研究院和同地区的普林斯顿大学成为“新数学”拓扑学的研究圣地。在这个时代,亨利·怀特黑德(J.H.C.Whitehead,1901-1960)、拉尔夫·福克斯(Ralph Fox,1913-1973)、所罗门·莱夫谢茨(Solomon Lefschetz,1884-1972)等知名拓扑学研究者声名鹊起,而其中有一位占据了特殊位置的研究者,他就是来自希腊的数学家赫里斯托斯·帕帕基里亚科普洛斯(ChristosPapakyriakopoulos,1914-1976)。1948年,帕帕基里亚科普洛斯带着破解庞加莱猜想的雄心,离开因战乱而满目疮痍的祖国希腊,远渡重洋来到美国。20世纪50年代中期,他成功证明了三个对破解庞加莱猜想至关重要的定理。这其中,他关于“德恩引理”(Dehn’s Lemma)的论文尤为著名,以其精妙的证明方法赢得了极高的评价。当时,许多人都坚信,首个成功证明庞加莱猜想的人必定会是“帕帕”。“帕帕”是数学家同仁们给他起的爱称,因为他的名字太长了。即使抛开庞加莱猜想相关的研究,帕帕在校园中也是一个非常有名的人物。这份名气更多来源于他对时间的严格管理。他每天早上八点准时出现在餐厅吃早餐,八点半开始研究工作。十一点半进餐厅吃午餐,十二点半继续工作。下午三点,他会准时出现在公共休息室喝下午茶,而到了下午四点,他又会回到办公室继续埋头研究。当时就读于普林斯顿大学研究生院的西尔万·卡佩尔(SylvainCappell,1946-)博士告诉我们,那时候每天早上上学时,他都能在同样的地方看到帕帕的身影。“每天早晨,帕帕都会沿着这条小路步行前往数学系的那栋楼,他经过这里的时间总是接近早上八点,精准得让人可以用来校准手表。他总是随身携带一个小巧的棕色公文包,里面装着他的研究资料,内容绝对保密。他经常边走边自言自语,手势生动、表情丰富,仿佛灵感瞬间迸发,然后抓住念头一边走一边与自己展开讨论。他的生活规律得近乎机械化。据我所知,他将自己所有的时间都投入到数学,尤其是拓扑学的研究中。他为了证明庞加莱猜想,几乎放弃了一切其他事情。”当时,普林斯顿大学曾邀请帕帕担任教授,并给出了破格的待遇,只需要他每周承担三小时的教学任务。然而,帕帕婉拒了这一邀请,他表示自己只想作为研究员,专心致志地攻克庞加莱猜想。这种选择使得他与周围的人渐行渐远。他在研究院附近租了一间公寓后,几乎完全沉浸在与庞加莱猜想的“战斗”中,即使是休息日也足不出户。总是独自一人生活的帕帕,不知何时开始被人们称为“苦行僧”。“上午的时候他几乎从不与人交谈,午餐也是独自一人。有时,我或者其他年轻学生曾尝试靠近他,与他共进午餐,但他似乎不喜欢被打扰,总是匆匆吃完后立即返回研究室。“他的责任感非常强。这个社会给他支付工资,又发放研究费用支持他的工作,他觉得这是一种恩惠。而且,他不用承担教授的工作,也不需要教育学生或处理日常琐事,他把这些看成是学校给予自己的特权。因此,他认为自己必须投入全部精力攻克这个伟大的问题,直到最终解决它。”当时也在研究拓扑学的卡佩尔博士,是为数不多的与帕帕关系亲近的年轻人之一。他回忆说:“当时我年纪尚轻,和他的年龄差异如同父子,那时候的我无忧无虑,毫无顾忌。也许正因如此,他心情好的时候偶尔会主动和我搭话。”帕帕唯一会在人前露面的时间,就是每天的下午茶时间。当时,在普林斯顿大学有个传统,大家每天下午三点聚集在公共休息室喝茶、聊天。无论是数学家、物理学家还是历史学家,各领域的研究者都会聚在一起,畅谈最新的研究成果。帕帕在下午茶会上的行为模式则每次都一成不变,毫厘不差。“他会在下午三点整准时来到休息室,坐在靠近暖炉的同一把椅子上,开始阅读《纽约时报》。读完后,他会把报纸整齐地放回桌子上,方便其他人取阅,然后稍微喝点茶,简短地参与大家的讨论。如果有人靠近,他也会回应,但从不谈论自己的事情。他甚至不愿让别人知道自己刚才读的是报纸的哪一部分。这或许是因为他希望周围的人不要打扰自己,这样他就能专注于一个问题点上。”对于帕帕的这种有些极端的隐私保护主义,就连和他较为亲近的卡佩尔博士也感到惊讶。“帕帕把论文的原稿锁在抽屉里。有一次,他稍微打开了一点抽屉,让我看了一眼,但马上又迅速合上了。我觉得他这种不愿与人讨论、不愿分享研究的做法太孤僻了。要知道,数学研究生活中的一大乐趣,正是与他人分享和讨论。”来自德国的年轻的对手帕帕并不总是沉默孤僻的。卡佩尔博士提到,有一次在下午茶时间,帕帕的眼睛熠熠发光,显得异常兴奋。这是因为,当时公共休息室里来了一位年轻的数学家,而这个人恰好也在研究庞加莱猜想。当时,受到帕帕成功解决“德恩引理”的启发,有不少年轻数学家来到普林斯顿,试图以此为基础,挑战庞加莱猜想的证明。来自德国的沃尔夫冈·哈肯(Wolfgang Haken,1928-2022)博士也是其中一员。提到哈肯博士,许多人可能会立刻想到他解决了世界著名难题“四色定理”的辉煌成就。1852年,弗朗西斯·格思里(Francis Guthrie)提出了一个命题:世界上任何一张地图,只需要四种颜色就可以确保相邻的区域颜色不同。然而,这一命题的数学证明在之后的一个多世纪里始终未能完成。直到1976年,哈肯博士与肯尼思·阿佩尔(Kenneth Appel)博士使用当时仍属罕见的电子计算机,正式宣布证明了四色定理。但是,当时这一结果引发了激烈的争议。人们质疑,使用“计算机”这一黑匣子得出的证明是否完全可靠?这样一个无法完全由人类亲自检查的庞大证明,能否被数学界认可?这些问题在当时引起了数学界的广泛讨论。无论如何,当哈肯博士来到普林斯顿高等研究院时,他还是一名年轻的拓扑学研究者。一边是被誉为“最接近庞加莱猜想的人”的帕帕,另一边是奋力追赶他的哈肯博士。很快,这两位数学家之间展开了激烈的较量。2007年7月的一个星期天早晨,我们来到美国芝加哥市郊,拜访了沃尔夫冈·哈肯博士。哈肯博士早在十年前便从伊利诺伊大学退休,现在他在家中继续数学研究。博士带我们走进了二楼的书房。书桌上摆放着一个巨大的宇宙模型,还有一台计算机。计算机的屏幕上不断弹出计算结果,显然博士目前的研究仍与计算机密不可分。实际上,哈肯博士曾计划过,如果佩雷尔曼的庞加莱猜想证明失败,他就反过来尝试证明“庞加莱猜想是错误的”。在数学中,证明一个命题为“真”(正确),需要建立一个完备无漏洞的逻辑结构,能在任何情况下成立。但是,如果要证明一个命题为“伪”(错误),只需找到一个反例,展示其逻辑上的错误即可。博士的构想是,如果庞加莱猜想是错误的,那么让计算机进行海量运算,运气好的话或许能发现一个反例。“我完全没有想到佩雷尔曼的证明能够成功。当时,我犹豫着是否要用计算机重新开始我的庞加莱猜想研究。现在回想起来,幸好那时迟迟没有下定决心,因为如今我们已经知道庞加莱猜想是正确的。多亏当初的犹豫,我才没有把时间浪费在无意义的研究上。”如今,庞加莱猜想已经被确认是一个正确的命题。哈肯博士庆幸自己的好运,这一次他没有再次陷入过去那样的泥沼,而是能够全身而退。打开书房里的柜子,我们看到了堆积如山的旧论文,这几乎涵盖了哈肯博士近五十年的心血。博士逐一指着这些论文的标题给我们看,几乎全都与庞加莱猜想有关。“这篇论文是第三次追加发表的成果。因为证明的关键部分一直没有实质性的进展,所以我只能先将部分内容单独发表。之后的几年,我陆续发表了其他几篇论文,当时我真的觉得自己已经非常接近庞加莱猜想的核心了。当然,最终这些证明还是错误的……”哈肯博士第一次接触庞加莱猜想是在大学时期。起初,他以为这只是一个很简单的问题,但很快他就发现,这个猜想如同无底深渊,一旦投身其中,便再也无法脱身。“刚看到庞加莱猜想时,我觉得它看上去非常简单,以至于我认为无法证明它的原因,要么是我太笨,要么是我不够努力。现在回想起来,只能说当时的我真是太年轻、太天真了……““回想起来,其实四色定理的研究也有类似的过程。20世纪初,德国著名数学家赫尔曼·闵可夫斯基(Hermann Minkowski)听说了四色定理的传言,认为‘这么简单的问题之所以没有被证明,一定是因为还没有一流的数学家参与研究’。于是,他开始亲自着手研究四色定理。““那个时候,哥德尔不完全性定理还没有出现,所以人们根本没有‘数学中可能存在无法证明的命题’这样的概念。闵可夫斯基当时觉得,问题的解决应该很简单,只是研究者的思维受到了干扰,无法找到清晰的解法。然而,他经过一年多的研究后最终放弃,并感叹道:‘或许是上帝不想让我们继续研究下去了吧。’““作为数学家,要想取得成功,在某种意义上必须保持极大的乐观。但即使是最出色的乐观主义者,有时候也可能陷入巨大的错误之中。”无声的对决当时,有一个共同问题困扰着哈肯博士和帕帕,即在宇宙空间中那根绳子打结的点。收回环绕宇宙一圈的绳子时,绳子在宇宙中复杂地缠绕在一起就会打结,形成结扣。如果不解决结扣的问题,就无法证明庞加莱猜想。然而,无论是哈肯博士还是帕帕,都始终找不到合适的解决方法。在哈肯博士的形容中,“所谓庞加莱猜想的陷阱,就是这样一个过程。刚开始,证明的98%看似轻而易举,但总是在最后一步失败。你往往会想到其他可能的解决思路,于是立即投入新的研究。但当你发现这个新思路行不通时,又会涌现新的点子。就这样,精神被不断地搅乱,逐渐深陷其中不可自拔。最初的希望最终被绝望取代,让人变得越来越难以抑制自己的怒火。”有一次,帕帕难得邀请卡佩尔博士一起吃饭。当时,他显得非常兴奋,还对卡佩尔博士说道:“我的工作取得了重大进展,虽然还没有完全证明庞加莱猜想,但我已经非常接近成功了。”然而,几个月后,当卡佩尔博士在大学里再次见到他时,他却完全没有提及研究进展的事情。很可能,他在证明中发现了某些致命的缺陷。从那以后,帕帕开始闭门不出,很少出现在公众面前。那段时间里,看电影是帕帕唯一的消遣活动,这还是他的主治医生给他的建议。医生劝他最好偶尔远离数学,接触一下数学以外的其他世界。帕帕是极为认真的人,他听从了医生的建议,每周都会固定去普林斯顿大学附近的电影院看一次电影。“他会在每周固定的时间去电影院,总是坐在最后一排。他对电影的内容毫不在意,无论是儿童片、喜剧片还是色情片,他都照看不误。对于他来说,这似乎是他生活中唯一不涉及数学的活动。”然而,就在这期间,一件令人震惊的事情发生了。哈肯博士宣布,他已经证明了庞加莱猜想!这一消息让帕帕内心深受冲击。卡佩尔博士告诉我们:“当时,帕帕非常焦虑。他一直被称为‘最接近庞加莱猜想的人’,这种荣耀和周围的期待使他陷入一种偏执的心理。他认为自己必须在所有人之前完成这个命题的证明。与此同时,各大数学杂志陆续得知该消息,纷纷向哈肯博士发出询问。“我的那篇论文确实很出色,几乎所有人都以为我已经成功证明了庞加莱猜想。一些顶级杂志甚至直接邀请我发表论文,并且表示可以跳过审查环节。也许是因为传闻中大家都相信我的证明是正确的,所以他们判断直接刊登也没有问题吧。不过,幸好当时我答复他们:‘不行,我认为论文仍有可能存在错误,我希望能够让其他学者先审查这篇论文。’”事实证明,谨慎是必要的。就在提交论文的两天前,哈肯博士发现论文中存在一个重大错误,于是及时撤回了自己的证明,避免了一场灾难。然而,这短短几天内发生的事,却给他那位严谨的竞争对手帕帕带去了极大的心理冲击。“证明在最后一刻崩溃,这真是一件非常丢脸的事情。”哈肯博士承认,“不过,这个错误是我自己发现,而不是被别人指出的,这让我稍微保住了一点颜面。尽管如此,帕帕基里亚科普洛斯依然连续三个晚上难以入睡。他非常愤怒,认为我急于求成以至仓促发表论文。在这一点上,我完全无法反驳他。”这次失败让哈肯博士也陷入了困境。他因为急于修正论文中的错误而患上了暴食症,未能完成证明的焦虑也使他经常与周围的人发生矛盾。最终,哈肯博士开始转变想法,他坚信庞加莱猜想本身就是错误的。“我当时在想,我曾认为自己已经完成了庞加莱猜想证明的98%,但事实并非如此,甚至可能连门槛都没有摸到。毕竟,我的研究仅举出了一些非常简单的特殊例子,却连这些例子都无法证明正确性。因此,我决定系统地去寻找反例。”所谓反例,就是假设一根绳子环绕宇宙一圈后能够成功收回,但这并不一定意味着宇宙是球形的。哈肯博士利用当时尚未普及的电子计算机,开始研究是否存在“非球形的宇宙中绳子仍可收回”的反例。有一天,哈肯博士向帕帕透露了自己的想法。“当我说‘庞加莱猜想可能是错误的命题’时,帕帕的脸色变得前所未有的难看。因为对他而言,如果这个命题被证明是错误的,那么整个世界对他来说将变得毫无意义。他对庞加莱猜想怀有一种类似宗教信仰般坚定的信念,而我的这句话无疑击碎了他的全部信仰,这对他来说是非常恐怖的。”自那次交流之后,帕帕对哈肯博士的研究变得过度警惕。卡佩尔博士回忆起一次与帕帕一同听哈肯博士讲座的情景,当时帕帕的脸涨得通红,显得十分焦躁不安。“那次讲座中,哈肯博士介绍了利用计算机解决复杂数学问题的想法。帕帕听后明显非常生气,我试图劝他:‘别这么激动,哈肯博士并没有针对庞加莱猜想发表任何意见,你完全不用担心。’然而,他并没有听进去,反而滔滔不绝地对我说:‘你难道看不出来他们的真正意图吗?哈肯博士他们想要说服数学界相信,用计算机解决那些伟大的数学难题是可能的。或许下周他们就会宣布,已经用计算机证明了庞加莱猜想。如果我们现在接受这种观念,到那时还能提出反驳吗?他们绝对是在混淆视听。’”“一周后,我在公共休息室里看到了帕帕,他坐在自己惯常的位置上,显得平静许多。我问他:‘现在不担心有人用计算机解开庞加莱猜想了吗?’他很冷静地回答我:‘我当然担心,但周末的时候我认真思考了一下,我相信数学有自我防御的能力。’”“帕帕始终坚信数学的深奥与力量。他认为数学是人类智慧历经漫长时间积累的结晶,在某种意义上,数学本身就有生命蕴含其中。”卡佩尔博士还记得,那个时期帕帕向他坦白了一些往事。“当时为什么会聊到那个话题,我已经记不清了。有一次,他对我说:‘年轻时,我在希腊有个恋人,但因为父母反对,我们最终分手了。来到美国后,我觉得必须将自己的一切奉献给这道闻名于世的伟大命题,它已经成为我的生活重心。’然后他补充道:‘如果有一天我能够解开这个难题,我或许会回到祖国,寻找一位适合自己的伴侣,共度余生。为了这个目标,我必须尽快证明庞加莱猜想。’“这番话令我深受震撼。在我的印象中,帕帕一直是一位个性独特的人,沉浸在完全专注于庞加莱猜想的生活中。但他也曾像普通人一样感受过爱,也有过普通人的烦恼。他也有家人,也曾担心父母对自己恋爱关系的干涉。而这些感情,他始终深藏在心底,从未表露。“虽然帕帕是一位决心将一生奉献给特定研究方向的独特研究者,但我终于意识到,他并非缺乏人类的正常情感。如果他选择了另一种人生,一定能够给一位女士幸福。”一位是倾尽一生,试图证明“庞加莱猜想正确”的人;另一位则是利用最新技术,试图确认“庞加莱猜想错误”的人。这两位道路截然不同的“宿敌”之间的较量,却以意外的方式戛然而止。帕帕患上了胃癌,离开了人世。在帕帕的公寓里,人们发现了一本遗稿,约160页。这似乎是一本关于三维宇宙的书的草稿。在草稿的某一章中,标题写着“庞加莱猜想的证明”,但从那之后,所有的页面都是空白的。哈肯博士回忆说:“与庞加莱猜想的战斗,也是一种随时可能让人‘走火入魔’的经历。”而让哈肯博士能够勉强保持理智的,正是家人一些若无其事却意味深长的话。“家里人都叫我‘庞加莱病患者’,孩子们甚至会说‘爸爸现在得了庞加莱病,没法说话了’。正是这些戏谑和调侃,才让我没有越陷越深。如果当时家人对我说‘爸爸的研究是人类历史上极其重要的工作’之类的话,那结果一定会很可怕。是我的家人,把我从那个深渊中拉回到了正常的世界。”最终,哈肯博士成功地摆脱了“庞加莱病”。他中断了对庞加莱猜想的研究,转而攻克了另一个难题。“我曾经长时间专注于庞加莱猜想的研究,但后来终于意识到,我的研究方法已经走入了死胡同,再也无法顺利推进了。就在这个时候,德国数学家海因里希·黑施(Heinrich Heesch,1906-1995)联系了我,邀请我尝试解决四色问题。他提到,我之前向他建议的一个关于计算机设置的小改动,大幅提升了运算效率,使其达到了原来的20倍。这让我感慨不已:‘太不可思议了!相比在庞加莱猜想上苦苦耗费一年时间,在四色问题上只用了一天的时间,甚至只是愉快地度过一个下午,就取得了这么大的进展!’当时,我内心萌生了一个念头:或许我可以重新开始。“最终,我在庞加莱猜想的研究中陷入了绝望的深渊,而四色问题的成功让我得以摆脱庞加莱猜想的阴影。我庆幸自己没有完全被‘庞加莱病’拖垮,而是成功地恢复了过来。”哈肯博士在四色问题上的突破,发生在帕帕去世仅仅一个月后。摆脱“庞加莱病”,需要一个新的难题。这样看来,数学家始终没有能够摆脱“继续挑战难题”这种病。在探访这两位数学家的故事之后,我们来到普林斯顿大学的公墓。据说,帕帕基里亚科普洛斯博士可能被安葬于此。然而,这里并没有相关的下葬记录。帕帕在美国没有亲属,也没有举行葬礼。即便是与他交好的数学家们,也不知道他的墓地究竟在哪里。帕帕的一生是否真的充满不幸?对此,卡佩尔博士给出了否定的回答:“帕帕生前曾多次对我说,他从未想过要将自己的人生方式推荐给他人,但他自己对此感到满意。我非常理解他的心情。数学家为难题所吸引,对难题情有独钟的情感是普遍存在的。“数学家的生活,常常是在‘苦乐交织的现实世界’与那个特别的‘数学世界’之间来回穿梭。能够打开‘数学世界’大门的人寥寥无几,但‘数学世界’中存在着永恒的真理。只有完全理解这些真理的人,才能目睹那里的完美与纯粹的美。这种美好就如同一个晶莹剔透的水晶迷宫。迷宫的墙壁反射出夺目的光芒,使数学家们深深着迷,不知不觉地沉浸其中。“帕帕超越了大多数的数学家,他选择将自己一生中的大部分时间留在了‘另一个世界’。他只是偶尔为了饮食才返回现实世界……在那个世界中,他找到了最珍贵的宝物——庞加莱猜想。他本想将那纯粹而极致的美记录下来、描述出来,可惜未能如愿。然而,这样的遗憾在科学世界里并不罕见。”某位年迈数学家的述怀20世纪50年代到60年代,迷恋庞加莱猜想的数学家远不止帕帕和哈肯博士两人。当时任职于普林斯顿高等研究院的教授迪恩·蒙哥马利(Deane Montgomery)博士曾提到,有一个周末他接连收到三位数学家的私密请求:“我解开了庞加莱猜想,请暂时替我保密。”随后,为验证这些声明的真伪,蒙哥马利博士花费了大量心力。无数的数学家被庞加莱猜想的“魔力”所吸引,他们的人生轨迹也发生了翻天覆地的变化。在美国西海岸俯瞰太平洋的城市伯克利,居住着另一位与庞加莱猜想“较量”了大半生的数学家——约翰·斯托林斯(JohnStallings,1935-2008)博士。“我并不认为佩雷尔曼的证明就完全正确。”斯托林斯博士粗声说道。他对庞加莱猜想已被解决的消息持怀疑态度。“过去的事我都忘了,现在我不谈数学,只弹钢琴。”斯托林斯博士多次以此回绝采访请求。最终,我们只说服他同意拍摄一段钢琴演奏视频。获得音乐系的许可后,我们走进了一间练习室。博士坐到钢琴前,从双肩包里拿出一本破旧的乐谱,封面写着“勃拉姆斯,Op.10”。他开始演奏。音乐悲壮而深沉,却又不时流露出如阳光穿过树影般柔和的旋律。望着博士那专注而安然的神情,我们逐渐沉浸其中。忽然,他在键盘上飞舞的手戛然而止。“不知道庞加莱本人是否意识到,他的这个猜想让那么多数学家都失败了。”斯托林斯博士低声说道,目光中透着一丝感慨。“无数的数学家追随庞加莱的预言,最终到达了某个难以言喻的神奇世界。”博士随后轻声念出庞加莱在他论文末尾处留下那句话:“Maiscettequestion nousentraîneraittrop loin(这个问题必将引领我们到达那遥远的世界)。”“给你们看一篇有趣的论文吧。”演奏结束后,博士从双肩包中取出一本论文集,显然是为这次采访特意准备的。他翻开其中的一篇文章,题目是《证明庞加莱猜想的失败之路》(How Not to Prove thePoincaréConjecture)。这篇论文发表于20世纪30年代,论文中详细记录了许多挑战庞加莱猜想的数学家共同面对的无尽恐惧。斯托林斯博士为我们朗读了一段:“尽管错误显而易见,但他们却无法察觉证明中的漏洞。原因要么是过度自信与兴奋,要么是对失败的恐惧干扰了正常思考。衷心祈祷未来的年轻数学家能找到避免这些陷阱的方法。”庞加莱猜想这道充满魔幻魅力的世纪难题,可以比作1851年赫尔曼·梅尔维尔(Herman Melville)创作的小说《白鲸》中的巨大白鲸——莫比·迪克。在这部小说中,亚哈船长(亚哈船长的一条腿被莫比·迪克咬掉,之后用假肢代替,自此他执着于复仇)与船员们赌上性命来追捕莫比·迪克,最终却葬身于茫茫大海之中。斯托林斯博士,更像是那名幸存的叙述者伊什梅尔。他年轻时,庞加莱猜想或许是他心中必须猎取的目标,但随着岁月流逝,这个目标逐渐变成了一头不可战胜的“魔兽”。庞加莱猜想的挑战仍将继续,而下一代数学家注定会接过这场“追逐”的接力棒,前赴后继,追寻着那个“遥远的世界”。
19小时前
4
苹果拟收购Prompt
最新消息显示,苹果公司正与美国计算机视觉初创企业Prompt AI进行最后阶段谈判,准备收购该公司的顶尖人才以及核心技术。泄露的音频显示,Prompt管理层已经在周四(10月9日)的全体会议上通报了这项即将达成的交易,公司表示最终未能加入苹果的员工将获得补偿,并鼓励他们申请苹果的其他岗位。Prompt成立于2023年,联合创始人为公司现任CEO Tete Xiao(加州大学伯克利分校计算机科学博士、知名人工智能研究员)和公司总裁Trevor Darrell(伯克利人工智能研究实验室BAIR创始人之一)。成立当年,Prompt便在AIX与Abstract Ventures领投的种子轮融资中筹集了500万美元。目前,Prompt有11名员工,其中10人的名字和职位都显示在公司官网上。其主打产品是“Seemour”应用,该软件可连接家庭安防摄像头并提供智能识别功能,能帮助摄像头识别人、宠物、其他动物或物体,并对异常活动发送警报、生成文字描述,甚至回答用户有关摄像头前发生事件的问题。Prompt高管在全体会议上透露,这家公司此前也曾接触过其他潜在买家,包括埃隆·马斯克旗下的人工智能公司xAI与脑机接口公司Neuralink。高管还在会议中提到,公司投资人将在交易中获得一定补偿,但“无法完全收回前期投资”。同时,公司要求员工在找到新工作或与朋友家人交流近况时,不得提及苹果的名字。Xiao在会议上坦言,Prompt AI的技术和Seemour应用表现良好,但商业模式无法持续。公司计划下架Seemour,并通知用户所有数据将被删除、隐私将受到保护。分析预计,Prompt的技术与团队未来将并入苹果HomeKit智能家居部门,为苹果家庭视觉感知与安全生态体系提供更强的技术支撑。近年来,硅谷科技巨头频频通过“并购式雇佣”(acquihire)的方式吸纳顶级人工智能专家,以增强自身的AI研发实力,同时避开潜在的监管风险。先前,Meta就通过这种方式带走Scale AI的创始人与高管团队,谷歌也以此获得Windsurf的高层团队和技术授权。苹果此次收购Prompt的规模虽小,但也属于该策略的又一新例。苹果历来避免大规模收购。自创立以来,其最大的一笔交易仍是2014年以30亿美元收购Beats Electronics。苹果更倾向于低调收购小团队,将其技术与人才融入产品线开发。一些分析师认为,苹果在AI领域的进展缓慢,部分原因正是这种“不愿大笔出手”的策略。年初至今,苹果股价累计下跌约2%,表现落后于主要股指和其他科技巨头。
1天前
1
引力一号再度成功发射,“降本为王”时代,东方空间为何执着固体火箭?
10月11日消息,据中国航天报,今日10时20分,我国太原卫星发射中心在山东海阳附近海域使用引力一号遥二运载火箭,将搭载的吉林一号宽幅02B07星、数天宇星01-02试验星顺利送入预定轨道,飞行试验任务获得圆满成功。引力一号火箭是全球起飞推力最大固体运载火箭,也是我国首个海上成功发射的捆绑构型运载火箭。由东方空间自主研制,2024年1月11日首飞圆满成功,创造了全球最大固体运载火箭、中国运力最大民商火箭、中国首型捆绑式民商火箭等多项纪录。该型火箭采用三级半构型,高度约为30米,起飞质量405吨,起飞推力600吨,近地轨道运载能力6.5吨,500公里太阳同步轨道(SSO)运载能力4.2吨。其中,火箭配套的4型7枚固体大推力发动机由中国航天科技集团有限公司四院研制。吉林一号宽幅02B07星是由长光卫星技术股份有限公司研制的高分辨、大幅宽光学遥感卫星。吉林一号宽幅02B系列卫星作为目前国际上最轻的超大幅宽亚米级光学遥感卫星,可为用户提供150千米幅宽、0.5米分辨率的高清卫星影像产品,具备可批产、大幅宽、高分辨、高速数传的特点。此次发射的引力一号(遥二)火箭,相比之前首飞的引力一号(遥一),有诸多内在提升:1.可靠性、稳定性以及对多种轨道、多个发射点的适应性有了“明显升级”;2.在这一过程中,东方空间也构建了面向批量化生产的质量和安全管控体系,推动人才梯队支撑多型号常态化发射和敏捷研制并行推进。此次发射任务成功的同时,也让商业航天领域对其动力路线的选择多了些争议讨论。关注的核心,是东方空间为何选择固体火箭,而非当下更主流的液体火箭。成本上,固体火箭一次性使用,每公斤发射成本比可回收液体火箭高五成以上,难适配未来高频组网的低成本需求;虽然东方空间称其省去燃料加注、隐性成本低,但业内担忧长期成本控制难跟上竞争节奏。技术路线上,全球商业航天以液体火箭为主,国内占比超七成,液体燃料比冲高、可复用、性能拓展空间大。引力一号靠捆绑提升运力,却难及规划中的液体火箭,有人担心固体火箭投入会分散液体可回收技术研发精力,错失市场机会。场景适配方面,固体火箭24小时快速响应、海上发射安全是优势,但当前八成商业发射是卫星组网,更需低成本大运力,对快速响应需求少;应急任务多由国家队承担,商业空间有限,且海上发射额外成本难靠固体火箭摊薄。当然,东方空间的选择并非单纯的“固液之争”,而是民商企业在技术积累初期的现实选择——固体火箭可依托成熟的军工技术快速实现产品落地(引力一号发动机由航天科技四院研制),通过“以固体火箭打开市场、用液体火箭承接未来需求”的“三步走”战略完成技术迭代。这种“过渡性技术路线”能否成功,取决于其固体火箭能否在液体火箭成熟前抢占细分市场,以及后续液体型号的研发进度能否跟上行业节奏。这也正是争议的核心:在商业航天“降本为王”的赛道上,“先立足再突破”的策略是否比“直接对标国际先进”更具可行性。
1天前
3
三代诺奖得主接力,人造一个迷你版“薛定谔猫”
2025 年的诺贝尔物理学奖授予了三位科学家,表彰他们“发现电路中的宏观量子力学隧穿效应和能量量子化现象”。这三位科学家分别是:出生于英国剑桥的约翰·克拉克,出生于法国巴黎的米歇尔·H·德沃雷特,和生于美国约翰·M·马丁尼斯。得奖时,三位都是美国加州大学的教授。三位学者得诺奖的工作并不是获奖近期做出来的,而是在40年前。1985年左右,他们在美国加州大学伯克利分校的实验室里,通过一系列开创性的实验证明,量子世界的奇异特性可以在一个大到可以握在手中的宏观系统中具体实现。他们的超导电子系统可以从一种状态隧穿到另一种状态,就像直接穿过一堵墙一样。他们还证明了,该系统吸收和释放特定大小的量子化的能量,正如量子力学所预测的那样。此外,他们的得奖工作,还与另外两位诺贝尔物理奖得主有关,可以算是站在巨人的肩上了。一、从约瑟夫森结开始具体来说,2025年诺奖得主的超导电子系统之关键部分是约瑟夫森结,与其相关的约瑟夫森效应,是在上世纪60年代被另一位22岁的年轻人发现的。年轻人叫布赖恩·约瑟夫森,是英国理论物理学家,剑桥大学物理学名誉教授。他以在超导和量子隧穿方面的开创性工作而闻名,获得了1973年诺贝尔物理奖。图1:约瑟夫森(1973年诺奖得主)在卡文迪许实验室发现约瑟夫森效应约瑟夫森出生于英国,父母都是犹太人。他读研究生时成为剑桥大学卡文迪什实验室凝聚态理论小组的成员。科研生涯尽管顺利,但约瑟夫森毕竟太年轻,一旦提出什么新想法,不可能不受到物理大伽们的质疑。在他发现约瑟夫森效应的过程中,与两位前辈:巴丁和安德森的学术交往便颇富戏剧性。那是1962年,那年,将在1977年获得诺奖的菲利普. 安德森39岁,在1956年和1972年获得诺奖的约翰·巴丁54岁,约瑟夫森才22岁。物理大伽和小研究生有了交集。在一个超导实验中,电路被设计用来接收“普通”的隧道电流,即单个电子形成的电流,库珀对本身似乎并不会穿过氧化物。然而,约瑟夫森却有了一个想法,他计算库珀对本身是否也有可能穿过氧化物屏障。通过计算,约瑟夫森发现了一些令人惊讶,似乎不太符合直觉的结果!一是即使电压为零,也会有超电流穿过这个“结”;此外,一旦施加电压,超电流就会发生振荡。这年,恰逢安德森从美国到剑桥访问一年,讲超导课程。安德森当年在固体物理界已有些名气,约瑟夫森对他的课程感兴趣而深入研究。于是,约瑟夫森向教课的安德森,展示了他用多体微观理论得到的计算结果。安德森检查了该理论并同意约瑟夫森的结论。然而,美国物理学家巴丁,当时却反对约瑟夫森的工作,并立即提交了一篇文章,认为“不可能存在这样的超流体”。巴丁于1956年1972年,两获诺贝尔物理学奖,第二次诺奖就是因为他为解释常规超导而建立的BCS理论。对这样一位超导界的大神,约瑟夫森却坚持自己的观点,据理力争,颇有“初生牛犊不怕虎”的精神,令巴丁这位权威对他几乎也刮目相看。不过,安德森一回到贝尔实验室,就联系了另一位实验科学家约翰·罗威尔。他们修改了外部电路配置,并在短时间内观察到了超电流还提交了论文发表。约瑟夫森预言的特殊超导现象:约瑟夫森效应被证实。1962年,约瑟夫森的计算结果发表在《物理快报》上,论文名字为《超导隧穿中可能出现的新效应》。同年,他当选为剑桥大学三一学院研究员,并于1964年以题为超导体非线性传导的论文获得博士学位。所以,安德森教授的超导课,促成了约瑟夫森1973年的诺贝尔奖,安德森后来也获得了诺贝尔物理奖。有趣的是,学生的诺奖比老师的还早了4年。约瑟夫森无疑是位物理天才,令人们遗憾的是,他发现超导量子比特,但最后却患上“诺贝尔病”。所谓“诺贝尔病”,通常用来形容诺奖得主经常出现的怪癖,使他们晚年追逐伪科学,或产生某种疯狂的想法。从20世纪70年代初开始,约瑟夫森将注意力转向主流科学界之外的问题:进行超验冥想,探索量子神秘主义。他开始相信造物主的存在,认为冥想可以带来神秘和科学的洞察力。约瑟夫森效应讲的是一类量子隧穿效应。电子的一般量子隧穿效应在1927年就被发现了,乔治·伽莫夫于1928年,用量子隧穿效应解释原子核的阿尔法衰变。然而,而超导中的超电流,是成对电子的无耗散流动。约瑟夫森则经过计算,预测到超导中的库柏对能够和普通电子那样,产生量子隧穿,即约瑟夫森效应。约瑟夫森第一个预测到库珀对的隧道效应。自旋电子对形成的“库柏对”是超导性的来源,根据1957年巴丁等人提出的BCS理论,低温超导中的电子并不是单个地进行运动,而是弱耦合稳定地配对在一起成库珀对。两个配对电子的自旋,一上一下,它们的动量也是数值相等而方向相反。两个电子成双成对纠结成一体,可以不受阻碍地快速移动而形成超导。因此,在约瑟夫森的预测之前,人们仅知道非超导状态的电子可以借由量子隧穿效应流过绝缘层,而真正了解到超导状态下的库柏对也有这种隧穿现象存在,是在约瑟夫森预言,安德森等实验证实之后,见图2。图2:约瑟夫森效应二、“迷你版”薛定谔猫的设想约瑟夫森效应的发现和解释,将量子隧穿现象,从单个电子的行为扩展到了超导状态下的“库柏对”,但它仍然是单个“粒子”的微观量子行为,从宏观角度看,难以理解。自量子力学诞生以来,其结论就一直挑战着人们的直觉。最著名的例子是量子力学中的叠加态,人们经常用“薛定谔猫”的思想实验来描述它。薛定谔的思想实验旨在揭示这种情形的荒谬性,比如,在原子核的衰变中,粒子处于“衰变”与“未衰变”的叠加态,如果将此与宏观世界的物体,比如一只猫的生死联系起来,便会有一只“既生又死”的猫。这在现实世界中是不可能的,我们从未见到过。在宏观现象中,观察不到量子叠加态和量子纠缠态,是因为宏观物体与周围环境存在着无法避免的相互作用,这种相互作用会极快地破坏微观的叠加态和纠缠态,人们称之为“波函数塌缩”。那么,如何将量子力学中的微观现象与我们常见的宏观现象联系起来呢?物理学家们从未停止此类的思考。也就是说,“薛定谔猫”的思想实验,用真实的猫肯定是无法实现的,不可能在实验室中证实猫的量子特性。但能否在实验室里,用某种方法创造出一个“迷你版”的薛定谔猫呢?图3:安东尼·莱格特(2003年诺奖得主)这便是英国物理学家安东尼·莱格特当年提出的一个大胆设想。安东尼·莱格特是量子力学领域的杰出物理学家,因其在超流体和超导领域的贡献而闻名,与他直接相关的是他在低温物理和量子现象方面的研究,特别是在液体氦的量子行为方面。他的工作深入探究了量子态,例如超流氦的准粒子和与液体氦的自旋有关的量子效应。他的研究也涉及量子自旋材料中的自旋动力学和相关量子现象,特别是在材料的低温相变中的作用。因为他“对超导体和超流体理论做出的先驱性贡献”,荣获2003年诺贝尔物理奖。在20世纪70年代末,他预言,在超导电路中,或许可以观测到一种被称为“宏观量子隧穿”的现象。因为超导电路电阻极低,它与环境的耗散耦合非常微弱,这为维持宏观量子态提供了可能。莱格特关于约瑟夫森结宏观量子隧穿的构想,为实验物理学家们指明了方向。而2025年诺奖得主80年代的工作,第一次实现了这一构想。三、2025年诺奖得主的工作莱格特大胆设想不容易,要真正在实验室里做出来,就更不容易了。不过,这在1980年代,由美国加州大学伯克利分校的三位科学家实现了。约翰·克拉克生于英国剑桥。1968年在英国剑桥大学获得博士学位后,在加州大学伯克利分校获得了一个博士后研究职位,随后担任过助理教授、副教授,以及物理学教授,整个学术生涯都在伯克利大学度过。当时,克拉克的博士后研究员米歇尔·H·德沃雷特从法国移民到美国,加上他的来自美国的研究生约翰·M·马丁尼斯,三人组成了一个强大的团队。他们的目标就是验证莱格特的猜想:在一个简单的“电流偏置约瑟夫森结”系统中,寻找宏观量子效应存在的确定性证据。这类实验的挑战是巨大的,任何来自外界的微小噪声都可能改变系统,导致错误的结论。最后,他们的一系列实验研究颇有成效。他们至少观察到了这些电路中的两种量子效应:能量量子化和系统的宏观量子隧穿。前者是典型的量子现象,意味着电路只能存在于某些离散的能量状态,就像原子中的电子一样,见图4左下图。后一个就更有趣了,意味着电路可以从一个状态“跳跃”到另一个状态,而无需跨越势垒!这是量子隧穿的宏观版本,有效地突破了经典物理学中认为不可逾越的障碍。因为在经典物理学中,一个球没有足够的能量的话,是不可能滚过一座山的。除非山下挖有隧道,而微观量子世界中,不用挖隧道,总有一定的概率,粒子能跳过去。克拉克三人的电路仍然可以隧穿!至关重要的是,他们的电路系统足够大,已经可以算是“宏观” 实体,因此,他们第一次观测到了“宏观量子隧穿”现象,他们的演示有力地证明了量子力学并不仅仅局限于原子尺度。克拉克的团队利用约瑟夫森结,将超导体的独特特性与量子隧穿现象相结合,创建了一个表现出量子行为的宏观电子电路。这个宏观电路行为类似于单个微观粒子。最初,电路系统处于一种电流流动而没有任何电压的状态,原因是基于超导体的性质:即使没有外部电压,电流也会在其中流动。从经典角度看,处于这种初始状态的电路,犹如被困在一道无法跨越的高山下,状态似乎无法转换。但他们的实验,却给出了奇迹般的结果:零电压状态可以自发地,从这种初始态,跃迁到电压不为0的状态。换言之,电路隧穿到了另一个状态!量子隧穿现象,说明电路处于电压“为0”和“不为0”的两种状态之叠加态,它们按照一定的概率互相转换,如同“薛定谔的猫”。三位科学家进行的实验表明,这些大量粒子的共同行为,看起来如同单个微观粒子的量子行为。尽管这种由许多库珀对组成的宏观系统仍然比现实中的猫要小很多个数量级,但对于量子物理学家来说,它与薛定谔猫的宏观行为已经非常相似了。图4:2025年诺奖得主的工作 图片来源:©Johan Jarnestad/瑞典皇家科学院克拉克团队开创的宏观量子效应,代表了应用物理学的显著进步。他们的系统涉及大量的粒子,它们共同构成了一个宏观系统,但仍然保留着量子特性:具有量子化的能级,并且能够从一个状态隧穿到另一个状态。从理论上表明了,一个由大量粒子组成的宏观系统,包括流经超导电路的大量电子,可以用一个波函数来描述。这个波函数决定了在特定状态下观察到该量子系统具有某些特定属性的概率。他们的工作在之后的几十年里产生了深远的应用,例如,人们利用类似系统中的两个最低能量状态作为固态量子比特。这种超导量子比特电路,是目前热门研究的量子计算机的基础。三位获奖者之一的约翰·马丁尼斯,便曾经在谷歌从事利用超导量子比特构建量子计算机的工作。2019年10月23日,马丁尼斯及其团队在《自然》杂志上发表了一篇题为《使用可编程超导处理器实现量子霸权》的论文,其中他们介绍了如何使用一种量子比特的量子处理器,首次实现量子霸权。
1天前
110
“湿件”登场:生物混合机器人开辟“第二赛道”
在电影《阿丽塔:战斗天使》里,医生用一束能量唤醒了只剩一颗大脑的少女,将她置于一个全机械的躯体中。这个科幻的“唤醒”场景,如今正在全球顶尖的实验室里,以另一种形式上演。电影情节是完整的大脑与机械躯体的融合,而在实验室里,科学家们操作的则是机器人更微缩、更基础的生命单元。然而,两者背后的核心逻辑是相通的:能否用活的生物组织,作为驱动机器人的“灵魂”?近日,发表于《科学·机器人》的一项突破性研究,对这一问题给出了初步答案。美国伊利诺伊大学香槟分校、西北大学等机构的联合团队,成功开发出一款光遗传调控的神经肌肉驱动生物混合爬行机器人,在现实世界中迈出了“湿件”控制机器的关键一步。一、“湿件”如何被唤醒?我们熟悉的机器人,由物理躯体和程序代码构成。然而,在实验室最前沿的舞台上,一个全新的角色已经登场——“湿件”。“湿件”与其名字一样形象,特指活的生物神经系统或细胞组织,因其富含水分与生命特质而得名。和我们熟悉的硅基芯片不同,这些“湿件”天生就具备自组织、自适应、超低能耗等特性,无需复杂编程即可处理信息并做出反应。那么,这种“生物智能”如何被驾驭?《科学·机器人》上的这款生物混合爬行机器人,提供了一个精妙的范本。它的构建始于一个精心设计的“躯体”。研究人员采用3D打印技术,使用PEGDA水凝胶为机器人制作了结构支架。这个支架不仅是细胞的载体,其不对称的腿部设计更是一种“结构智能”,能将微观的肌肉收缩高效转化为宏观的定向爬行。就像人的骨骼决定了我们的基本形态与运动方式一样,这个微小的支架决定了机器人未来的“生命形态”。生物混合机器人的肌肉驱动示意图在支架之上,研究团队培育了两个核心生命单元,分别是经过光遗传学改造的神经元与骨骼肌组织。神经元扮演“生物控制器”的角色,而肌肉则作为“生物执行器”。关键在于,两者之间成功形成了功能性的“神经肌肉接头”,就像一座天然的生物桥梁,使得电信号能够无缝传递,建立了真正的生命连接。从此,“大脑”的指令可以直接传递给“身体”。神经肌肉接头(NMJ)的钙成像控制这一微小生命系统的,是集成的无线供电微型LED。通过特定波长的蓝光进行刺激,研究团队实现了对神经元集群的远程、无创、精准唤醒与控制。这套系统,带来一场机器人控制逻辑的根本性颠覆。传统的机器人遵循“传感器-芯片-电机”的路径,它的核心是计算,每一步都由预设的代码决定。而生物混合爬行机器人则是“光信号-神经元处理-肌肉收缩”的路径,核心是基于生命系统内在逻辑的生物反应。机器人的操作决策权从确定的代码,移交给了动态且有活性的生物组织本身,这展示了一种控制核心从“软件”向“湿件”转移的可能性。二、从机器到生命:为何称它为“第二赛道”?当这个“湿件”系统被唤醒,最令人惊叹的并非其能动,而是其“如何”动,也就是那些超越了传统机器逻辑、充满生命特质的行为方式。那么,这些特质具体体现在何处?其答案,正隐藏在这个生物混合爬行机器人如婴儿学步般稚拙却复杂的行为中。例如,给它一束光,它就能自主爬行,在光刺激停止后,它并不会立即停下,而是能继续爬行长达20分钟,仿佛其神经元记住了刚才的指令,也展现出生命系统特有的短时程可塑性。单神经递质神经肌肉接头(NMJ)机器人:光刺激关闭后的自主爬行双神经递质神经肌肉接头(NMJ)机器人的自主爬行更奇妙的是,当加快光刺激的频率,它反而慢下来了。这不是故障,而是它正在展现生命系统特有的“非线性响应”。就像我们在疲惫时越想努力效率越低一样,其神经网络内部正在发生着复杂的互动,最终产生了这种看似“任性”的行为。神经肌肉接头机器人的颤搐这种难以预测的特性,恰恰是它最迷人的地方。科学家称之为“涌现行为”,意思是整体表现出了各个部件简单相加所不具备的复杂特性。这就像无数个简单的水分子汇聚在一起,却形成了波涛汹涌的海浪。此外,它还在无人干预的情况下,于培养皿中保持了超过两周的功能活性,展现了生命内在的韧性。对比来看,我们熟悉的传统“硅基”机器人如同精密的钟表,其精髓在于绝对控制,但需要持续供电、动作僵硬,学习新技能必须重新编程,而且一旦损坏往往难以自我修复。而这款“碳基”生物混合爬行机器人,走的完全是另一条路。其能耗极低,具备天生的生物柔韧性和相容性,而且其神经网络带来的可塑性,为未来机器人实现具有生命特质的能力提供极大可能。重点是,这些不是靠编程实现的,而是生命物质与生俱来的禀赋。我们正在见证的,不是技术的改良,而是一场认知的革命。从此,机器人不再只是冰冷的机械,它们开始拥有了生命的特质,比如会记忆,会任性,会疲惫,也会坚持。这或许就是“湿件”带给我们的最大礼物,不是要造出更强大的机器,而是要创造出更有温度的生命伙伴。三、从实验室到产业化生物混合机器人虽处于实验室阶段,但其产业生态的基石已经开始快速构建。目前,政策、资本与产业链正形成合力,为其铺平未来走向市场的道路。在政策布局上,上海市科学技术委员会在2025年专门设立了“先锋者计划”,针对生物混合机器人领域进行项目征集与资助,第一批的4个项目被予以立项,资助总额400万元。同年3月,浦江创新论坛也以“从实验室到产业化的跨越”为主题,探讨了生物混合机器人的未来应用场景和重大命题。政策的明确信号迅速获得了市场的回应。在资本投入方面,行业分析报告显示,2025年上半年针对生物混合机器人领域的风险投资额达37亿美元,同比激增210%,这些资金主要流向了神经接口设备、活体材料等核心环节,为技术转化注入了关键燃料。在产业赋能的具体路径上,生物混合机器人的发展轨迹,与仿生学的产业化路径有着某些相似之处。回顾仿生学的发展历程,我们看到的是一条从基础研究到产业变革的清晰路径。比如,研究鸟类飞行的原理,不仅造出了飞机,更催生了万亿美元规模的航空产业;分析蝙蝠回声定位机制,不仅帮助我们发明雷达,更奠定了现代自动驾驶技术的感知基础。如今,生物混合爬行机器人正在这条路径上实现新的突破,它不再满足于外部形态的模仿,而是将生命系统亿万年进化出的内在智慧,直接转化为机器架构的核心部件。基于此,医疗领域被视为最现实的突破口。传统手术机器人是体内挥舞精密器械的“巨人”,而生物混合爬行机器人则可能成为潜入人体的“微雕师”。它们能凭借生物相容性,在特定场景下发挥不可替代的作用。例如,搭载干细胞模块的生物混合机器人有望穿透血脑屏障,实现帕金森病等神经疾病的靶向治疗与修复,其价值正在于利用生命系统的固有特性,解决传统机械无法逾越的生物学障碍。环境监测则是另一个极具潜力的方向。相较于在无人机或探测车这些外来者,生物混合爬行机器人能像一片落叶般融入敏感的生态系统,执行任务后自然降解,实现“来过,却未曾打扰”的无痕监测。然而,当技术突破照亮应用前景的同时,也必然将其引发的伦理思考投射到我们面前。当这些“湿件”系统开始表现出学习能力,甚至某种程度的自主性时,我们不得不思考一个问题:它们究竟是工具,还是某种新形态的生命?这个问题与基因编辑的争议有些类似,但此次无疑更加复杂,因为我们面对的是创造一个兼具生命与机器特性的全新实体。回望科技发展史,从原子能到人工智能,每一项颠覆性技术都经历过从狂热到理性,从放任到规范的过程,生物混合爬行机器人技术正处在类似的历史节点。四、结语尽管目前研发的生物混合爬行机器人相比电影中的阿丽塔还相差甚远,但它标志着,我们不再仅仅用代码定义机器人的行为,而是开始学习与生命本身合作,利用神经系统的内在智慧来创造机器。从唤醒一个爬行机器人,到未来可能唤醒更复杂的生物混合系统,“湿件”开启的“第二赛道”,既通向技术的星辰大海,也指向产业的深层重构。在这条充满未知的赛道上,每一次微小的突破,不仅是在探索机器的未来形态,更是在重新定义下一个十年的产业格局。
1天前
14
智元、原力无限双双拿下亿元大单,具身智能“落地时刻”到了?
智元机器人与原力无限再下两单。近日,智元机器人与龙旗科技正式官宣合作,双方将围绕工业场景的具身智能机器人应用开展深度合作,龙旗科技向智元机器人下达数亿元金额的智元精灵G2机器人框架订单,预计部署近千台该型号机器人。据了解,智元精灵G2前期将重点应用于平板产线,实现具身智能机器人在消费电子组装制造场景的批量落地。智元机器人方面表示,智元精灵G2可在柔性抓取、多工位协同、产线数据联动等环节发挥AI交互和协同功能。智元机器人旗下产品同日,原力无限智能科技(杭州)有限公司与时华文旅控股集团在杭州正式签署战略合作协议。此次合作项目金额为2.6亿元,双方将围绕“机器人+文旅”战略赛道展开全方位合作,共同打造全国首批具身智能智慧景区样板工程。公开资料显示,原力无限是ELU科技集团旗下品牌,专注于智能机器人与具身智能技术研发,其基于自主研发的Hyper-VLA端到端多模态大模型,构建了“一脑多身多场景”的战略体系。原力无限称,此次合作标志着具身智能从“验证期”进入可复制、可规模化落地的阶段,推动具身智能从“实验室”向商业化推进。今年下半年,国内有多笔亿元级人形机器人订单达成:9月11日,深圳慧智物联与智平方达成战略合作,计划未来三年内部署逾1000台具身智能机器人,订单金额接近5亿元;9月3日,优必选宣布获得国内知名企业2.5亿元具身智能人形机器人产品及解决方案采购合同,合同以人形机器人WalkerS2为主,今年内启动交付;7月,智元机器人与宇树科技共同中标中移(杭州)信息技术有限公司2025年至2027年人形双足机器人代工服务采购项目,总标包金额1.24亿元。在9月的智元机器人和优必选连续中单后,观察者网曾提到:尽管近期机器人行业订单金额屡创新高,但绝大多数合同的交付节奏都透着谨慎:几乎都是先交付50到100台,等在实际场景中跑通流程、验证效果后,再逐步扩大交付规模。这样的交付模式,其实藏着双方的顾虑:对采购方来说,先用小批量订单试水,能更稳妥地测算投入产出比,避免盲目大规模采购带来的风险;对机器人企业而言,借助真实场景的工况测试设备,刚好能发现技术短板,进一步优化硬件可靠性和软件适配性。而对此,订单狂欢之下更需冷静沉淀,眼球和订单是早期行业不可或缺的燃料,真正需要警惕的,是把聚光灯错当成终点线,把故事直接当财报。
2天前
1
一颗1.8纳米芯片,成了英特尔“最后的救赎”
2025年的秋天,对英特尔来说又是一个临界点。这家曾经定义了硅谷的「硅」的巨头,面对AMD、苹果、高通等后起之秀的多线夹击,一度在设计与制造两端双双失速。从错过移动手机市场的爆发,PC市场主导地位逐渐被蚕食,到各种技术决策失误,昔日的硅谷巨人疲态尽显。如今,一切希望,似乎都压在了一颗芯片上。就在2025年10月9日,英特尔在亚利桑那州公布酷睿Ultra系列第三代处理器的架构细节,这是首款基于英特尔18A工艺节点打造的客户端系统级芯片(SoC),代号为Panther Lake。在经历多年设计和制造双重失速、管理层更迭与战略大回转之后,Panther Lake被赋予了超越产品本身的意义。它既要证明18A的可行性,也要让资本、政府与潜在客户相信,英特尔的「造芯能力」值得押注。英特尔是否能靠Panther Lake重整旗鼓?01、最后赌注「18A」在亚利桑那州钱德勒的英特尔Ocotillo园区,英特尔CEO陈立武手持代号为「Panther Lake」的英特尔酷睿Ultra系列第三代处理器的CPU芯片晶圆,宣布该产品将于今年晚些时候在该州的最新工厂投入大批量生产。根据英特尔的介绍,Panther Lake是一款面向PC的系统级芯片(SoC),集成了CPU、GPU以及专用AI加速器。它统一了以往强调效率的Lunar Lake与强调性能的Arrow Lake,让OEM不再在「电池寿命或峰值性能」之间二选一。它提供从8核到16核的不同版本,并搭载全新Xe3图形核心。顶配型号内建12个GPU核心与光线追踪单元,性能据称较上一代提升逾50%。在AI性能方面,Panther Lake算力最高可达180 TOPS(每秒万亿次运算)。除PC端外,英特尔官方还提到,Panther Lake还将延伸至包含机器人在内的应用。Panther Lake的真正看点是工艺。Panther Lake是英特尔首款基于18A工艺打造的产品,英特尔将其定调为:「迄今在美国本土开发并制造的最先进半导体工艺」。18A这个数字,意思是「1.8纳米」,1A等于0.1纳米。这是英特尔首个2纳米级节点,该节点在英特尔位于俄勒冈的工厂完成开发、获得制造资格并启动早期生产。其工艺的突破在于两项底层技术,RibbonFET与PowerVia。前者是英特尔十余年来首个全新晶体管架构,据称有很强的缩放能力和开关特性。后者是新的背面供电系统,把传统堆叠在晶体管之上的供电金属层搬到背面,让正面的布线主要承载信号、背面承载电源,减少电压下陷与布线拥堵。结合两者,英特尔声称18A相比前一代英特尔3工艺,可实现最高15%的性能提升与约30%的芯片密度改进。据英特称,18A工艺将为其未来「至少三代」客户端与数据中心产品奠定基础。需要说明的是,业界预计Panther Lake仍是典型的异构封装,即CPU计算芯片由英特尔18A工艺生产,而I/O控制器与GPU模块预计仍由外部代工制造。此前,英特尔在工艺出现问题时,一度依赖台积电。除了Panther Lake之外,英特尔还同时公布了基于18A的首款服务器处理器Xeon 6+,代号为Clearwater Forest,预计2026年上半年推出,主要面向超大规模数据中心、云服务商与电信运营商。生产方面,Panther Lake与Clearwater Forest以及多代18A产品,均计划在英特尔位于亚利桑那州钱德勒的全新Fab 52工厂投产。02、临界点上的英特尔Panther Lake和18A工艺,可以说承载了英特尔对未来的所有希望,以及政府资金、产业资本与生态伙伴的耐心。过去几年,英特尔一直处于自救状态。PC端逐渐被AMD蚕食,笔电高端部分被苹果自研ARM系列和高通Oryon追击,先进制程屡度延期,上一代客户端产品还不得不大量外包台积电代工。英特尔前任CEO Pat Gelsinger曾大刀阔斧地推动IDM 2.0战略,企图以史无前例的晶圆厂扩张和技术跃迁重夺领先地位。然而,预期还没有实现,高成本投资就要压垮现金流,技术节点屡屡延误,令市场无法完全信任其IDM体系,不少客户停留在观望状态。2024年底,Pat Gelsinger被英特尔董事会请出门外。三个月后,曾任Cadence主席、在半导体界以稳健著称的陈立武接任CEO。他上任后的第一件事,是把激进的全球扩厂踩下刹车,转而强调只在有真实需求时再上产能,并称如果找不到外部代工大客户,英特尔可能会暂停更先进的14A工艺开发。去年,英特尔裁了1.5万员工。2025年第二季度时,英特尔又计划启动大规模裁员,称到年底,希望核心员工数量仅为75000人。该巨头在去年底拥有约10万名员工,这意味着英特尔今年打算再裁四分之一。尽管危机四伏,英特尔并未成为弃子。2025年8月,白宫宣布将《芯片法案》的补助直接转为股权投资,美国政府以约89亿美元入股英特尔,持股约10%。这笔交易使英特尔成为自2008年金融危机以来美国政府对企业的最大一笔投资之一。而且,这是美方首次以股权形式「救援」一家科技巨头,也意味着英特尔的命运,已被纳入美国战略版图。几周后,另一笔震动业界的交易出现,英伟达宣布以50亿美元投资英特尔,持股约4%,双方将共同开发PC与数据中心芯片。与此同时,软银也投入20亿美元,成为英特尔的重要股东之一。这几笔资金的流入与背书,几乎是救命稻草,让英特尔股价触底反弹。但市场的耐心有限,英特尔需要拿出能证明制造能力的芯片。Panther Lake就是被推到台前证明能力的产品。可以说,这一次产品发布对英特尔来说,都不再像以往那样只是一次迭代,而是向资本、政府与潜在买家发出的信号。03、留给英特尔的时间按照英特尔的计划,Panther Lake有清楚的公开时间表:今年开始爬坡进入量产,首批型号计划在年末前发货,并于2026年1月起在市场上广泛供货。届时,它将正面迎战苹果M系列、AMD Ryzen以及高通Oryon芯片。业界普遍认为,这一代产品将决定英特尔能否重新赢回笔电市场。承担18A重任的,是英特尔最新的Fab 52工厂,这座四层厂房据称烧进去超过200亿美元,配备ASML最新一代曝光设备,目标是在美国本土恢复「最先进制程的量产能力」。过去几个月,英特尔不断把潜在代工客户一批批请进厂房参观,做的当然不是观光,而是争取外部大客户,签下未来订单。问题在于,要让外部相信其先进制程,不在于泛泛的参观,而在未公开的良率曲线。去年底市场的传闻是英特尔18A的良率仍落后竞争对手,官方在近期发布活动日上也不再披露具体良率数字,只表示「年内进入高量产状态」。英特尔2025年内股价因「扭转预期」一度上涨超85%,表明投资者对英特尔翻盘潜力的正面期待,但如果18A不如预期,或者Panther Lake反响平平,今年以来的大幅上涨也可能化为提前透支的信任。但Panther Lake若能如期、按质兑现,它的意义也将越过一代笔电。首先,它能为18A的服务器路线——计划2026年登场的288核高能效数据中心处理器Clearwater Forest——打样背书,让云厂商与超大客户相信18A是一条可复制的工艺生产线。而且,英特尔可以靠它让旗下代工业务更有说服力,毕竟只有自用产品在18A上成功量产,外部客户才会把「试单」升级为真正的合作。比如向英伟达或苹果等完全依赖台积电的芯片巨头证明,英特尔可以生产他们的芯片。今年9月,英伟达和英特尔曾宣布达成横跨PC与数据中心的深度合作。在发布会上,英伟达CEO兼创始人黄仁勋称,他们一直在评估英特尔的代工技术,双方会「探索」机会。简言之,就是处于试验及考察期,短期内英伟达的一些业务仍将继续依赖台积电,英特尔需要证明自己。另外,英特尔当然也希望在笔电份额上止跌,至少在高端轻薄与全能本方面,把被AMD借先进制程建立的优势拉回到同台对打的状态,同时抵挡苹果与高通在高端本地AI场景上的攻城略地。反之,若18A再次踉跄,Panther Lake未达标或量产延误,二级市场的信心回撤会很快,政府与产业资本的「战略投资」叙事也将承受政治与商业的双重拷问。此刻,英特尔选择把乐观写在脸上。在亚利桑那州的英特尔工厂前,陈立武在手持Panther Lake的CPU芯片晶圆的照片里,嘴角上扬。英特尔CTO上个月在公开活动上称,18A与Panther Lake是英特尔「未来的基础」,英特尔在这里「下了两个大赌注」。这些表现和话语在往年或许只是PR,但在2025年秋天却像是英特尔内部的军令状,以及真实心态。Panther Lake如果能证明自己,我们可能会看到一家老牌芯片巨头重新把「制造力」作为竞争力的核心。若它失手,英特尔的翻盘就不得不改写剧本。留给Panther Lake的,是一整年的验证期,不算漫长。接下来,市场会看英特尔18A实现的结果。
2天前
3
Arduino被收购,天堂还是地狱?
十一期间,一则消息彻底震惊业界,高通突然宣布与首屈一指的开源硬件和软件公司Arduino达成收购协议。目前该收购未披露收购金额,这笔交易尚需得到监管部门的批准并满足其它惯例成交条件。作为“买买买”狂魔,高通最近也收购了Edge Impulse和Foundries.io,旨在提供涵盖硬件、软件和云服务的全栈边缘平台。有人猜测,高通瞄准Arduino是要重点布局机器人和物联网了,Arduino未来无疑也会朝向高性能和AI发展。尽管Arduino这一未来方向引发了不少期待,但在工程师群体中,担忧的声音似乎更为突出。许多人担心,这一变化可能会对开源生态造成冲击,甚至是“彻底崩塌”。更有工程师直言:“再见Arduino,你好乐鑫、树莓派、Teensy。”全新UNO Q开发板来了在收购后,高通和Arduino披露首个新产品——Arduino Uno Q开发板。UNO Q是一款具有“双CPU”设计的新一代SBC(单板计算机),类似于Radxa X4的设计理念,即在主处理器之外集成一个独立的微控制器(MCU),而非单纯沿用树莓派的风格:一个支持Linux®Debian的微处理器,搭载高通Dragonwing跃龙4 x A53@2.0GHz处理器QRB2210处理器,集成Adreno GPU 3D图形加速器2 x ISP(13 MP+13 MP或25 MP)@30fps;一个支持Zephyr等实时操作系统(RTOS)的STM32U585微控制器,非常适合精确控制和响应,包括M33@160 MHz、2 MB闪存、786 kB SRAM内存。值得注意的是,QRB2210制程为11 nm LPP(Low Power Plus),封装型号为NSP752,尺寸为12.0×12.4×0.91 mm,间距为0.4 mm,功耗为1W,使用起来应该会很“酷”。这一开发板也是首款支持新IDE——Arduino App Lab的硬件平台。Arduino App Lab是一个全新的集成开发环境,统一了实时操作系统、Linux、Python和AI。这意味着,通过将不同领域桥接成一个无缝体验的单一界面,实现更快、更轻松的开发。与Edge Impulse平台集成,使用真实世界数据构建和微调AI模型,以进行对象识别、异常检测、声音识别等。其他配置上,具体为:无线连接方面,WCBN3536A无线电模块提供双频Wi-Fi 5(2.4/5 GHz)和蓝牙5.1连接,两者均配有板载天线,可实现可靠的无线性能;内存方面,该板具有16 GB或32 GB的eMMC存储选项以及2 GB或4 GB的LPDDR4 RAM选项;多媒体编解码器方面,ANX7625多媒体编解码器可通过板载USB-C连接器输出视频和音频;电源管理方面,UNO Q搭载的PMIC为高通PM4145。价格方面,UNO Q起售价为44美元。很多工程师认为这款SBC与同类产品对比价格有点高,即便是集成了专用MCU。EEWorld网友lijinlei表示,Arduino也要开发Linux了,配合高通的硬件支持,希望能解锁更强大的性能,给嵌入式开发带来更多新的可能,赋能边缘AI融入更多开发者群体,让未来触手可及。一些工程师则对主板的设计细节表示出兴趣,特别是底部类似于计算模块的连接器,认为这开启了许多可能性。但他对新的App Lab软件需要进一步完善以及没有将其集成到Arduino IDE中表示失望。此外,还有一些工程师提到主板使用eMMC作为存储,这对于刷入其他操作系统可能是一个挑战,并注意到设计上将其他连接器通过USB-C集线器进行访问的取舍。Arduino步入新的发展阶段Arduino是一家意大利开源硬件和软件公司、项目和用户社区,设计和制造用于构建数字设备的单板微控制器和微控制器套件。Arduino项目始于2005年,是意大利伊夫雷亚交互设计学院学生的工具,名字来自意大利伊夫雷亚的一家咖啡馆,该项目的一些创始人曾经在那里见面。其硬件产品根据CC BY-SA可证获得许可,而该软件根据GNU宽通用公共许可证(LGPL)或GNU通用公共许可证(GPL)获得许可,允许任何人制造Arduino板和软件分发。Arduino板可从官方网站或通过授权经销商商购买。Arduino板设计使用各种微处理器和控制器。这些板配备了一组数字和模拟输入/输出(I/O)引脚,这些引脚可以连接到各种扩展板(“屏蔽”)或面包板(用于原型设计)和其他电路。这些板具有串行通信接口,包括某些型号上的通用串行总线(USB),也用于加载程序。微控制器可以使用C和C++编程语言(嵌入式C)进行编程,使用标准API(也称为Arduino编程语言),受处理语言的启发,并与处理IDE的修改版本一起使用。除了使用传统的编译器工具链外,Arduino项目还提供了一个集成开发环境(IDE)和一个用Go开发的命令行工具。Arduino在其发展历程中曾面临一些复杂的内部挑战。最著名的事件之一是创始人之间的商标纠纷。其中一位创始人在意大利注册了Arduino商标,但却与在世界其他地区注册该商标的核心团队处于分离状态。这场涉及品牌合法性的争端耗费了数年时间,直到2017年才得以解决。解决了内部危机后,Arduino积极拓展其业务版图,特别是通过推出Pro系列,将硬件产品线扩展到了工业级应用领域。据著名博主Jeff Geerling猜测,此次与高通的合作,尤其是直接获取高通在高效能5G“AI”Arm SoC(系统级芯片)方面的技术积累,将极大地推动Arduino的Pro工业级产品线发展。这被视为Arduino寻求提升其工业硬件解决方案竞争力的重要战略举措。工程师的担忧过去,Arduino使用的芯片多来自Microchip(Atmel)、瑞萨电子、ST、Silicon Labs、乐鑫等公司。虽然高通已表示保证Arduino将照常运行,同时也会保持使用其他芯片的产品,但工程师普遍表现出“悲观”的情绪。Reddit上,一位工程师认为,这是每家收购另一家公司的所说的“客套话”,从长远来看,这绝不是真的,在大约一年左右的时间里,当被收购的公司被整合并且人们在内部组织结构中被洗牌时,情况确实如此。另一位工程师对此表示赞同,他说:“一年时间都算慷慨了。我所在的公司被收购两个月后大规模裁员,所有原来的领导层都在年底前消失了。然后收购我们的人又被收购了,而且这种情况再次发生得更快。外面一团糟。”换句话说,真正的问题在于:高通收购Arduino是否仍然允许其他制造商制造自己的电路板,并且它真的会像自己说的一样,一如既往保持开源吗?“高通是一个专利巨魔,这对Arduino的开放性来说并不是一个好兆头。”工程师用VMware的案例为例推测,尽管被soxfox42指出VMware是被Broadcom而非高通收购,但从过往来看,高通注重金钱而非服务或产品,开源硬件可能将衰落,只剩下Arm继续作为小型创客的出口。多位Reddit用户表达了对高通一贯商业模式的深切疑虑。mvrs认为这可能标志着Arduino品牌的终结,担心高通会迅速扼杀开源硬件,尽管他希望高通能吸取15年前的教训保持软件开放,但仍预见高通可能会采取不明智的商业决策来试图赚钱,从而损害品牌和软件生态。Martin和Major Armstrong的评论都表达了对高通是否会改变其封闭商业惯例的怀疑,Major Armstrong更是提到他以往与高通打交道的经验是必须支付高达百万美元的许可费才能获得问题的答案。Colin D也表示他与高通的长期痛苦经历使他对此感到非常紧张。Jeff Geerling则提出了两个问题:一是高通对Linux的支持程度如何,它将与Debian一起提供,但他们会投入与Raspberry Pi相同的精力来保持它的最新状态,还是会在几年内放弃它;二是如何更轻松地开发充分利用小型微控制器的东西,换句话说与用户简单地将一个独立的ArduinoUNO连接到任何SBC上进行协同工作,本质上的区别和优势究竟在哪里?
2天前
3