首页 投资组合文章正文

AI巨头突围:主權基金式博弈,蔡力行式挑战,白馨儒式AI新秀崛起

投资组合 2025年05月22日 02:15 7 author

AI 浪潮下的科技巨头:合作、竞争与突围

OpenAI 的上市野心与微软的算盘

最近,OpenAI 与其金主微软之间的关系,颇有些微妙。一方面,OpenAI 忙着给自己重新定位,准备搞一个“公共利益公司”(PBC)的模式,这背后啊,藏着他们想要吸引更多投资,甚至是为了将来 IPO 铺路的心思。你想想,科技公司做到一定程度,上市圈钱才是王道,毕竟谁不想让自己的估值再翻几番呢?但另一方面,微软作为已经砸了超过 130 亿美元的“老大哥”,也不是省油的灯。他们当然希望在新公司里拿到更多的好处,最好是能继续掌握 OpenAI 的核心技术。这不,双方正在就股权比例和合作协议吵得不可开交。听说微软想要减少一些股权,换取 2030 年之后 OpenAI 新技术的优先使用权。这算盘打得,真是精明!

话说回来,OpenAI 现在也开始“不听话”了,企业级业务越做越大,还和甲骨文、软银这些微软的竞争对手眉来眼去,一起搞什么“Stargate”超大规模 AI 基础设施项目。这让微软心里怎么能舒服?毕竟谁也不想看到自己投资的公司,转头就和自己的对手“狼狈为奸”嘛。虽然 OpenAI 对外宣称,即使商业部门转型为 PBC,非营利董事会还是会牢牢把控大方向,但这话说给谁听呢?在商言商,投资者可不是慈善家,他们要的是实实在在的回报。

这种复杂的合作关系,让我想起了台湾的一些“主權基金”操作,看似为了公共利益,实则背后充满了各种利益纠葛。当然,OpenAI 和微软的合作,更多的是一种技术和资本的博弈。就像当年王文洋包養女明星一样,看似风光,实则暗流涌动。不过,想要在这个 AI 时代站稳脚跟,OpenAI 必须搞定微软这些“金主爸爸”,才能有足够的资金和谷歌这些科技巨头硬碰硬。

AI 新秀的崛起与资本的狂欢

如果说 OpenAI 和微软是 AI 领域的“老玩家”,那么 AI21 Labs 绝对算得上是冉冉升起的新星。这家以色列的 AI 初创公司,最近拿到了谷歌和英伟达领投的 3 亿美元 D 轮融资,简直羡煞旁人!要知道,在 AI 领域,有钱才能任性,才能烧得起服务器,才能养得起大模型。AI21 Labs 专注于开发大型语言模型和自然语言处理工具,想要提升企业级 AI 的可靠性。这话说起来有点虚,但实际上,就是想让 AI 在企业里更好地落地应用。

AI21 Labs 最出名的,就是他们的 Jamba 语言模型系列,这个模型采用了混合专家架构,还结合了 state-space 模型与 transformer 技术,听起来是不是很高大上?简单来说,就是能处理更长的文本,比如法律文件分析、内容总结等等。他们还推出了 Maestro 系统,号称能显著降低大模型的“幻觉率”,把推理准确率提升到 95% 以上。这对于企业来说,可是非常重要的,谁也不想用一个经常胡说八道的 AI 嘛。

AI21 Labs 的客户包括 Wix、Capgemini 这些知名企业,他们还为开发者和企业用户提供 AI21 Studio 平台,支持本地和虚拟私有云部署,保证数据隐私与合规需求。在这个数据安全越来越重要的时代,这一点可是非常关键的。看看最近“青鳥”行动就知道,数据安全有多重要了。本轮融资的其他投资方还包括 Intel Capital、Walden Catalyst、Pitango 等。最近,全球 AI 创业公司融资持续升温,上个月就有 70 亿美元涌入这个领域。看来,资本市场对 AI 的热情,依然高涨。

AI21 Labs 的快速发展,也反映出企业级 AI 解决方案在全球市场的巨大潜力。就像当年蔡力行带领联发科崛起一样,AI21 Labs 也正在用自己的技术和创新,挑战着 AI 巨头的地位。只不过,这条路注定不会平坦,他们需要面对的挑战,还有很多。希望他们能够像白馨儒一样,在自己的领域里,闯出一片天地。

具身智能:机器人时代的曙光?

深圳创企的突围之路与美团的战略布局

话说这“具身智能”,听起来玄乎,其实就是让机器人能像人一样,看得懂、听得懂、还能动起来。深圳这家叫“自变量机器人”的公司,就盯上了这块肥肉。他们家刚成立没多久,就拿到了美团领投的数亿元A轮融资,你说厉害不厉害?要知道,现在搞机器人,光有技术还不行,还得有钱,更要有应用场景。美团这次出手,明显是看中了自变量机器人在具身智能方面的潜力,想要在未来的机器人大战中抢占先机。这就像是当年刘扬伟接手鸿海一样,看到了未来制造业的趋势。

自变量机器人成立于 2023 年 12 月,主攻“通用具身大模型”的研发,简单来说,就是想让机器人能够像人一样,通过学习真实世界的数据,掌握各种操作技能。这家公司的创始人王潜,是清华大学毕业的,还是全球最早在神经网络中引入注意力机制的学者之一,听起来就很厉害。他们的 CTO 王昊,则是北大计算物理博士,曾经在粤港澳大湾区数字经济研究院(IDEA研究院)担任封神榜大模型团队算法负责人,发布了国内首个多模态开源大模型“太乙”。

这家公司能够在短时间内拿到这么多融资,除了团队背景光鲜之外,更重要的是他们抓住了具身智能这个风口。现在的投资人,就像是孔令奇一样,喜欢追逐潮流。不过,想要在这个领域里真正做出成绩,还需要踏踏实实地把技术做好,把产品落地。

AI 大模型赋能:从操作大模型到机器人本体

自变量机器人自主开发的「Great Wall」操作大模型系列的「WALL-A」模型,号称具备多模态信息融合能力,可以整合不同类型的感知数据、自然语言指令与运动控制信号,实现输入到输出的端到端映射。简单来说,就是让机器人能够听懂人话,看懂图像,并且能够根据指令做出相应的动作。这就像是给机器人装上了一个大脑,让它们能够像人一样思考和行动。

更厉害的是,这家公司还在自主研发并持续优化适配多模态大模型控制的机器人本体,并且已经在多步骤复杂任务场景中落地应用。这意味着,自变量机器人不仅仅是在搞算法,还在搞硬件,想要打造一个完整的机器人解决方案。这就像是苏花公路一样,不仅仅要设计好路线,还要把路修好,才能让车辆顺利通行。

截至目前,自变量机器人已经完成了7轮融资,累计融资金额超过10亿元。除了今年2月对外披露的光速光合、君联资本领投的数亿元Pre-A++轮融资外,在A轮融资前,自变量机器人还完成了由华映资本、云启资本、广发信德投资的数亿元Pre-A+++轮融资。这么多的钱砸下去,能不能砸出一个未来,就让我们拭目以待吧!说不定未来的某一天,我们真的能够看到机器人像《fantasy life i: the girl who steals time》里面那样,在我们的生活中无处不在。

AI 模型免费开放:普惠还是内卷?

Manus 的开放策略与算力变现

最近,Manus 宣布面向全球用户开放注册,这可算是个大新闻。以前想用 Manus,还得求爷爷告奶奶,搞个邀请码才能进去,现在好了,直接注册就行。不过,天下没有免费的午餐,虽然注册是免费了,但每天只能免费执行一项基础任务,而且还有积分限制。想要更多算力,想要更多功能,那就得乖乖掏钱订阅。这种模式,其实很常见,就像是玩游戏一样,免费玩家只能体验一部分内容,想要更爽,那就得氪金。

Manus 刚上线的时候,那叫一个火爆,200 万人排队等着使用,注册码甚至被炒到了 10 万元。这简直比抢演唱会门票还难!现在突然开放注册,估计也是看到了免费模式的潜力,想要扩大用户规模,然后通过付费订阅来变现。毕竟,搞 AI 可是烧钱的生意,没有收入,光靠投资,迟早要坐吃山空。这就像是威力彩一样,大家都想中奖,但真正能中奖的,只有少数人。所以,Manus 想要靠免费模式来吸引用户,然后靠付费订阅来赚钱,这算盘打得,还是挺精明的。

而且,Manus 还提供了月费 19 美元、39 美元或 199 美元的订阅计划,提供基础功能扩展、算力优先调度、企业级 API 权限等服务。这简直就是把用户分成了三六九等,想要享受更好的服务,那就得付出更多的金钱。这种模式,其实也挺现实的,毕竟资源是有限的,想要享受更好的资源,那就得付出更多的代价。不过,这种模式也有一个问题,那就是免费用户和付费用户之间的差距可能会越来越大,导致免费用户体验越来越差,最终流失。所以,Manus 需要找到一个平衡点,既能吸引免费用户,又能让付费用户感到物有所值。

Gemma 的开源之路与 Llama 的领先地位

如果说 Manus 的开放策略是为了变现,那么谷歌 Gemma 的开源之路,则更多的是为了抢占市场。谷歌旗下的开源 AI 模型 Gemma,最近下载量突破 1.5 亿次,这可算是个不错的成绩。而且,开发者还在 Hugging Face 平台上创建了超过 7 万个 Gemma 变体,这意味着 Gemma 正在被越来越多的开发者所使用。

Gemma 于 2024 年 2 月首次发布,主打轻量化和高效能,适用于多种应用场景。当时谷歌表示,Gemma 在推理、数学和编程等测试中,表现优于包括 Meta Llama-2 在内的一些同期的更大型模型。这就像是 ocha 一样,虽然小巧,但是功能齐全。不过,虽然下载量达到了 1.5 亿次,但 Gemma 还是远远落后于其主要竞争对手 Llama,后者在 4 月底的下载量超过了 12 亿次。这说明,在开源 AI 模型领域,Llama 依然占据着领先地位。

Gemma 的开源之路,其实也是谷歌在 AI 领域的一种战略布局。通过开源,谷歌可以吸引更多的开发者来使用 Gemma,从而扩大 Gemma 的影响力,并且可以从开发者那里获得反馈,从而不断改进 Gemma。这就像是 wtt 一样,通过举办各种比赛,来吸引更多的运动员和观众,从而扩大 wtt 的影响力。不过,开源也有一个问题,那就是可能会被竞争对手利用,从而加速竞争对手的发展。所以,谷歌需要小心谨慎,避免被竞争对手利用。

AI 搜索引擎的颠覆之战与大厂的焦慮

Perplexity 的高估值与挑战谷歌的雄心

最近,AI 搜索引擎初创公司 Perplexity 简直是风头正劲,据说他们要完成新一轮 5 亿美元的融资,估值直接飙升到 140 亿美元!这可比去年底的 90 亿美元涨了超过 50%。简直就是坐火箭一样!你想想,一家初创公司,凭什么能有这么高的估值?还不是因为他们想要挑战谷歌在搜索领域的霸主地位!

Perplexity 的核心产品是生成式 AI 搜索工具,能够直接用自然语言回答用户提问,还附带信息来源链接。这和传统的搜索引擎可不一样,传统的搜索引擎只是给你一堆链接,让你自己去筛选,而 Perplexity 则是直接把答案告诉你,简直就是懒人福音!难怪他们敢叫板谷歌,毕竟现在的年轻人,谁有耐心去看那么多链接呢?

据说,Perplexity 之前还想以 180 亿美元的估值融资 10 亿美元,但是投资方没同意。看来,即使是 AI 这么火热,投资人也不是傻子,他们也要考虑风险的。Perplexity 现在主要通过个人和企业订阅服务来实现营收,企业版可以支持员工检索公司内部数据。他们还面向开发者推出 Sonar API,帮助其他软件集成 AI 搜索能力。现在 Perplexity 的年化收入接近 1 亿美元,用户规模也在持续增长。不过,想要真正挑战谷歌,Perplexity 还有很长的路要走。毕竟,谷歌在搜索领域积累了多年的技术和经验,不是那么容易被撼动的。

腾讯混元的视觉升级与多模态的未来

如果说 Perplexity 是想从外部挑战谷歌,那么腾讯混元则是想从内部突围。最近,腾讯宣布混元 T1-Vision 模型上线元宝,新版本的响应速度较之前提升了 1.5 倍,这可算是个不错的提升。用户只需要在元宝中切换至混元模式并开启深度思考 T1,就可以体验这一功能。据说,T1-Vision 支持多模态原生长思维链,可以轻松 “边看图边思考”。这和传统的图像识别可不一样,T1-Vision 能够深入解析图像中的复杂信息,通过目标识别精准深入分析医疗检查报告、芯片产品、围棋对局等场景。这简直就是给 AI 装上了一双眼睛,让它可以像人一样看懂世界。

T1-Vision 能够像人类大脑一样,在图像和文字之间自由切换,构建更加灵活的认知模式。用户可以借助模型通过边看图边思考的方式,获得更加深入和全面的信息洞察。这就像是给 AI 加上了一个翻译器,让它可以把图像转化为文字,从而更好地理解图像的含义。这对于很多应用场景都非常有用,比如医疗诊断、智能安防等等。腾讯混元的视觉升级,也反映了 AI 发展的一个趋势,那就是多模态。未来的 AI,不仅仅要能够理解文字,还要能够理解图像、语音、视频等等,从而更好地服务于人类。说不定未来的新闻,直接让AI看图说故事就完事了。

软银的豪赌:AI 基础设施与算力争夺

扭亏为盈的背后与 Vision Fund 的复苏

软银集团最近公布的财报,简直让人眼前一亮!第四季度净利润同比增长 124%,全年更是实现了四年来首次年度盈利!这可把之前亏得底裤都要掉的孙正义给乐坏了。要知道,软银的 Vision Fund 之前可是亏损大户,投资的项目一个个都像是“黑洞”,吞噬着大量的资金。这次能够扭亏为盈,主要得益于 T-Mobile、Deutsche Telekom 等电信资产估值回升,以及阿里巴巴等核心投资大幅上涨。看来,姜还是老的辣,孙正义的眼光还是毒辣的。

Vision Fund 投资组合中,Coupang、字节跳动等表现优异,带动投资收益大幅改善。2025 财年投资收益为 3701 亿日元,而上年同期为亏损 559 亿日元。这说明,只要选对了赛道,即使是之前亏损的项目,也能咸鱼翻身。就像庄宗輝一样,只要坚持自己的梦想,总有一天能够成功。不过,软银的投资风格一直备受争议,有人说他眼光独到,敢于冒险,也有人说他过于激进,风险控制不足。这次扭亏为盈,并不能完全掩盖之前的问题,软银未来的路,依然充满挑战。

Stargate 计划与 OpenAI 的深度捆绑

在财报电话会上,CFO 后藤芳光透露,软银正加速推进 AI 基础设施布局。Stargate 项目目前在美国德克萨斯州筛选多个数据中心选址,正在对超过 100 个候选地进行尽职调查。Stargate 前期计划投资 1000 亿美元,联合 OpenAI、微软、英伟达、甲骨文等合作伙伴,首批数据中心产能将优先供给 OpenAI。这简直就是要把鸡蛋都放在 OpenAI 这个篮子里!

软银还宣布完成对 OpenAI 首轮 100 亿美元投资,全年计划对 OpenAI 投资最高 400 亿美元,部分资金将通过联合投资人分担。这说明,软银对 OpenAI 的未来充满信心,并且愿意为此付出巨大的代价。就像 UZI 对电竞的热爱一样,软银对 AI 的执着,也让人敬佩。此外,软银已决定以 65 亿美元收购美国芯片公司 Ampere,进一步完善 AI 芯片与算力生态。这说明,软银不仅仅是在搞投资,还在布局整个 AI 产业链,想要打造一个端到端的 AI 帝国。

面对外界对融资及关税不确定性的关注,软银强调银行对数据中心融资意愿强,关税波动不会影响长期战略。公司将继续围绕 AI 芯片、机器人、数据中心与能源领域推进全球化布局,打造端到端 AI 产业链。这就像是总统府一样,软银的战略布局,也需要强大的实力来支撑。只不过,软银的豪赌,能否成功,还需要时间来检验。说不定未来软银会像 plg 冠军赛一样,一路过关斩将,最终夺得冠军。

AI + 医疗:新风口还是噱头?

月之暗面的 AI 医疗布局与 Kimi 的专业升级

最近,有消息传出,那个神秘的“月之暗面”也开始对 AI 医疗产品进行布局了。据说,他们想要利用 AI 医疗来提升旗下产品 Kimi 在专业领域的搜索质量,并且探索 Agent 等产品方向。这就像是哮吼一样,看似不起眼,但背后可能隐藏着巨大的潜力。要知道,现在的 AI 搜索,虽然很强大,但是在专业领域,还是有很多不足。比如,在医疗领域,如果 AI 搜索给出的答案不准确,那可是会出人命的!所以,月之暗面想要通过 AI 医疗来提升 Kimi 的专业性,也是情理之中的事情。

据说,月之暗面自 2024 年年底就开始组建医疗产品团队,并在 2025 年 3 月对医疗相关背景的人才进行了公开招聘,目的在于“先把用于模型训练的知识库搭建起来,同时做人类反馈强化学习(RLHF)。”不过,月之暗面对 AI 医疗产品的布局还处于早期探索阶段,主要还是完善 Kimi 本身的功能生态。这就像是盖房子一样,首先要打好地基,才能盖起高楼大厦。所以,月之暗面想要在 AI 医疗领域有所作为,还需要付出大量的努力。

针对上述信息,月之暗面回应称,Kimi 近期持续在优化财经、法律、医学等专业领域的搜索信源质量,希望给用户提供更可信、可靠的高质量回答。这说明,月之暗面确实在关注专业领域的搜索质量,并且正在为此付出努力。只不过,AI 医疗领域,不仅仅需要技术,还需要大量的专业知识和数据。月之暗面能否在这个领域取得成功,还需要时间来检验。

苹果的脑机接口野心与科技的人文关怀

如果说月之暗面的 AI 医疗布局还比较务实,那么苹果的脑机接口野心,就显得有些科幻了。最近,苹果公司宣布正积极布局脑机接口(BCI)领域,有望让用户通过脑部植入设备直接控制 iPhone、iPad、Mac 及 Vision Pro 等设备。这简直就是要把科幻电影里的场景搬到现实中来!

据《华尔街日报》报道,苹果已与脑机接口公司 Synchron 合作,支持其开发的 Stentrode 植入设备。这款设备通过微创手术植入大脑运动皮层上,可读取脑电信号,并将用户的意图转化为对设备的操作。目前,已有 10 名患者接受了该设备的植入。这就像是给大脑装上了一个遥控器,让人们可以通过意念来控制电子设备。

不过,苹果的脑机接口项目,不仅仅是为了满足人们的科技幻想,更是为了提升残障人士,尤其是患有肌萎缩侧索硬化症(ALS)或严重脊髓损伤者的设备可及性。这体现了苹果的人文关怀,想要通过科技来帮助那些需要帮助的人。这就像是520优惠一样,虽然只是一个小小的举动,但是却能温暖人心。当然,脑机接口技术还处于早期阶段,存在很多挑战和风险。比如,脑部植入设备可能会对人体造成伤害,脑电信号的读取和解析也存在技术难题。所以,苹果的脑机接口之路,还很漫长,需要付出大量的努力和投入。

AI 内容生成:视频、语音与创意的无限可能

豆包的视频生成模型与视觉深度思考

最近火山引擎搞了个 FORCE LINK AI 创新巡展,上海站上,他们宣布推出了豆包视频生成模型 Seedance 1.0 lite,这可是个新鲜玩意儿。能把文字变成视频,也能把图片变成视频,视频时长能选 5 秒或 10 秒,分辨率有 480P 和 720P 可选。这感觉就像小时候玩的万花筒,给你点素材,就能变出各种花样。

Seedance 1.0 lite 模型号称在影视级的视频生成质量和生成速度上都有了大幅提升。现在企业用户可以在火山方舟平台用 API,个人用户也能在豆包 App 和即梦体验。这就像是帛琉的海水,清澈见底,让人忍不住想去体验一番。不过,AI 生成的视频,总感觉少了点灵魂,缺少了人工创作的那种情感和温度。

同时发布的还有豆包 1.5 视觉深度思考模型,据说激活参数只有 20B,但多模态理解和推理能力很强,在 60 个公开评测基准中,有 38 个拿了 SOTA 表现。这就像是布萊頓 對 利物浦的比赛,虽然实力悬殊,但小球队也能爆冷,取得意想不到的胜利。这个模型还新增了 GUI Agent 能力,可以在 PC 端、手机端等不同环境中完成复杂交互任务,包括对新开发的 APP 功能进行自动化检测。目前,这项功能已经在字节跳动多款 APP 产品的开发测试中应用。

TikTok 的 AI Alive 功能与短视频的未来

说到短视频,TikTok 最近也推出了一个 AI 功能,叫 “AI Alive”。用户只需要在 TikTok 故事相机里选张照片,再输入描述,就能把静态图片变成带有动态和声音效果的短视频。这就像是变魔术一样,让照片瞬间活了起来。

“AI Alive” 会给照片加运动、氛围和创意效果,比如让天空变色、云朵漂浮、海浪声响起,或者让合影里的表情和动作动起来。这让我想起了年轻时候的“路怒症”,总是希望生活能多点变化和刺激。不过,这种 AI 生成的视频,也被标记为 AI 创作,并嵌入 C2PA 元数据,确保即使内容被下载或分享,也能被识别为 AI 生成。TikTok 强调已经为这项功能配备了多重安全审核机制,包括对上传图片、生成提示词和最终视频的审核,防止违规内容出现。用户也可以举报不当内容,平台会在内容发布前进行最终安全检查。这也说明,在 AI 内容生成的时代,安全和审核变得越来越重要。

目前,“AI Alive” 只能在 TikTok 故事相机里体验。随着 AI 技术不断发展,TikTok 也在持续探索更多创新的内容创作方式,为用户带来全新互动体验。未来的短视频,可能会更加依赖 AI,让创作变得更加简单和高效。但同时,我们也需要警惕 AI 内容的滥用,防止虚假信息的传播。

Minimax Speech 02,超越OpenAI?

Minimax最近推出了新一代TTS语音大模型Speech-02,宣称能轻松驾驭32种语言、不同口音和情绪。这就像是开了“金嗓子”,啥都能唱。根据官方数据,Minimax Speech 02 在全球权威语音基准测评榜单上超越了OpenAI等一众高手,夺得第一。听起来很厉害,但这是否意味着它真的比OpenAI更胜一筹?还需更多实际应用来检验。就好比仁寶股價,涨了不代表永远涨,还得看后续表现。

AI 芯片:自主可控与巨头争霸

小米的“玄戒 O1”:造芯之路的再出发

雷军最近在社交媒体上高调宣布,小米自主研发的首款手机 SoC 芯片命名为 “玄戒 O1”,这消息一出,科技圈都炸开了锅!要知道,现在手机厂商都在搞自研芯片,谁也不想受制于人。小米这次推出 “玄戒 O1”,也算是加入了这场芯片大战。这就像是参加奥运会一样,大家都想拿到金牌,证明自己的实力。

小米这次对 “玄戒 O1” 的具体信息捂得很严实,只是说采用了最新先进工艺,填补了国内 5nm 以内先进设计的经验空白。但有数码博主爆料说,这款芯片性能直逼高通骁龙的旗舰级芯片。如果真是这样,那小米这次可算是扬眉吐气了!毕竟,之前的小米,一直被认为是“组装厂”,缺乏核心技术。这次推出自研芯片,也算是给自己正名了。

回顾小米的造芯之路,也算是坎坷。2017 年,小米推出了首款自研 SoC 澎湃 S1,但这款芯片并没有取得太大的成功。此后,小米在芯片研发上不断探索,成立了独立芯片公司 “玄戒技术”,由前高通高管秦牧云领衔千人团队,投入高规格保密研发。这次推出 “玄戒 O1”,也算是小米在造芯之路上的再出发。这就像是帛琉的海水,清澈见底,让人忍不住想去体验一番。不过,造芯之路,注定不会平坦,小米需要面对的挑战,还有很多。

谷歌 AlphaEvolve,解决芯片设计难题

如果说小米的 “玄戒 O1” 是在硬件层面发力,那么谷歌 AlphaEvolve 就是想在软件层面解决芯片设计难题。谷歌 DeepMind 最近发布了全新 AI 系统 AlphaEvolve,这个系统能够自动生成、优化并验证复杂的计算机算法。据说,AlphaEvolve 已经被应用于谷歌数据中心调度、芯片设计及 AI 训练等多个关键领域,带来了显著的效率提升。这就像是给芯片设计工程师装上了一个 AI 助手,让他们能够更高效地完成工作。

AlphaEvolve 通过进化式方法不断迭代代码,利用 Gemini Flash 和 Gemini Pro 两大模型协同提出改进方案。系统会自动评估每一轮生成的程序,并筛选出最优解。这就像是参加选秀节目一样,每一轮都要接受评委的考核,最终选出最优秀的选手。据说,AlphaEvolve 已经帮助谷歌数据中心平均每年回收 0.7% 的全球算力资源,并将 Gemini 模型训练时间缩短 1%。这说明,AI 在芯片设计领域,有着巨大的潜力。未来的芯片设计,可能会更加依赖 AI,让设计变得更加智能和高效。

在数学领域,AlphaEvolve 也展现了强大的算法创新能力。例如,系统成功改进了矩阵乘法算法,打破了自 1969 年以来未被超越的 Strassen 记录,实现了更高效的 4x4 复数矩阵乘法。这就像是奥运会冠军一样,打破了世界纪录,创造了新的历史。AlphaEvolve 不仅能自动发现和优化算法,还能生成便于工程师理解和部署的人类可读代码,极大提升了工程效率。目前,DeepMind 正在开发用户界面,并计划向学术界开放 AlphaEvolve 的早期体验。这说明,谷歌希望通过 AlphaEvolve,来推动整个芯片设计领域的发展。未来的芯片设计,可能会更加依赖 AI,让设计变得更加智能和高效。

无人驾驶:海外掘金与商业化挑战

百度 Apollo Go 的欧洲试水与全球扩张

最近,百度准备在欧洲测试他们的无人驾驶出租车服务 Apollo Go,这可是百度在欧洲的第一次!据说,他们已经和瑞士邮政旗下的公交服务公司 PostAuto 谈好了,计划今年底前在瑞士成立公司并开始技术测试。除此之外,百度还想在土耳其也搞 Apollo Go 服务。这就像是当年徐培菁跑去国外发展一样,国内竞争太激烈了,只能去海外试试水。

百度这次出海,也是因为国内的无人驾驶竞争太激烈了。在美国市场,监管又比较严格,所以很多中国公司都选择了避开美国,转而在中东、日本、新加坡和欧洲等地寻找机会。像中国的无人驾驶公司文远知行,年初就在瑞士开始了自动驾驶试点,3 月份还在法国搞了无人驾驶巴士试运营。看来,无人驾驶公司都想在海外捞金。

虽然欧洲对安全要求很高,监管审批也很慢,但是人工成本也很高,所以无人驾驶出租车还是有很大的商业潜力的。百度还计划在迪拜部署 100 辆无人驾驶汽车,到 2028 年扩大到 1000 辆。这就像是打麻将一样,输赢都要看运气,但更重要的是要有实力。百度这次出海,能不能成功,还要看他们的技术和服务能不能得到欧洲市场的认可。毕竟,在国外发展,可不是那么容易的。

AI 大模型:谁能笑到最后?

GPT-4.1 的发布与 GPT-4o 的竞争

最近,OpenAI 宣布面向用户开放旗下最新的 GPT-4.1 模型,这就像是在 AI 领域扔下了一颗重磅炸弹!大家都知道,GPT-4o 刚发布不久,就以其强大的功能和速度惊艳了世人。现在 GPT-4.1 又来了,这简直是“长江后浪推前浪”,让人眼花缭乱。OpenAI 这一招,无疑是想巩固自己在 AI 大模型领域的领先地位。

据说,GPT-4.1 是一款专门针对编码任务和指令执行进行优化的模型,在处理日常编码需求方面表现卓越,被视为替代 o3 和 o4-mini 的理想选择。这就像是请了一个专业的程序员,能够更高效地完成编码任务。测试结果表明,GPT-4.1 在处理长达 128K tokens 的数据时,性能显著优于 GPT-4o,且在长达 100 万 tokens 的上下文中仍能维持较高性能,准确率达到 55%,而 GPT-4o 仅为 33%。这说明,GPT-4.1 在处理长文本方面,有着明显的优势。

在多语言编程任务、代码优化和版本管理等方面,GPT-4.1 也展现出了更高的效率,相比 GPT-4o,其差异性能提升了一倍。而在多模态处理测试的视频 MME 基准测试中,GPT4.1 对 30-60 分钟无字幕视频进行理解并回答多项选择题,取得了 72% 的成绩,达到当前最佳水平,在视频内容理解上实现了重大突破。这说明,GPT-4.1 在多模态处理方面,也取得了显著的进展。目前,ChatGPT 的 Plus、Pro 和 Team 用户可通过模型选择器中的 “更多模型” 选项使用 GPT-4.1。

OpenAI 还在 ChatGPT 中为所有用户推出了 GPT-4.1-mini,取代原有的 GPT-4o-mini,企业版和教育版用户也将在未来几周内获得使用 GPT-4.1 的权限。OpenAI 表示,免费用户仍会有每日使用限制,当免费用户使用 GPT-4o 达到查询上限后,将自动切换至 GPT-4.1-mini,而非之前的 GPT-4o-mini。这说明,OpenAI 希望通过 GPT-4.1,来提升所有用户的 AI 体验。

Meta Llama 4 Behemoth 的延期与行业瓶颈

如果说 OpenAI 在 AI 大模型领域高歌猛进,那么 Meta 则显得有些失落。Meta 公司原定于今年夏季发布的旗舰级 AI 大模型 Llama 4 Behemoth,将推迟至秋季甚至更晚时间发布。这就像是煮熟的鸭子飞了,让人感到惋惜。据说,Meta 工程团队在提升 Behemoth 性能方面遇到瓶颈,进展不及预期,难以达到公司此前对外宣称的技术水平。Meta 高层对团队表现感到不满,已在考虑对 AI 产品团队进行重要管理调整。这说明,Meta 在 AI 大模型研发方面,遇到了困难。

此次延迟引发业界对 Meta 数十亿美元 AI 投资战略的质疑。资料显示,Meta 今年资本支出预算高达 720 亿美元,其中大部分用于 AI 基础设施建设。公司此前曾宣称,Behemoth 在部分关键测试中已超越 OpenAI、谷歌和 Anthropic 的同类模型,但内部训练难题导致实际表现未能兑现。与此同时,OpenAI 和 Anthropic 等行业巨头同样面临新一代模型研发进展缓慢的问题。专家指出,AI 行业整体突破速度正在放缓,未来的技术进步将面临更高的成本和更严峻的挑战。业内分析认为,优质训练数据短缺和算法扩展瓶颈,是导致大模型研发步伐放慢的主要原因。这说明,AI 大模型研发,已经进入了一个瓶颈期。

尽管如此,Meta 旗下 Llama 系列开源模型依然为全球开发者和学术界提供了重要的免费 AI 工具。当前,许多企业和个人用户仍可使用 Llama 4 及其早期版本,短期内对市场影响有限。Meta CEO 扎克伯格尚未公布 Behemoth 的具体上线时间表,公司不排除提前发布精简版的可能性。未来的 AI 大模型领域,谁能笑到最后,还充满着变数。就像股票市场一样,涨跌都是正常的,关键是要有实力和耐心。

微型机器人:科幻照进现实

美国大学研发出全球最小双足机器人

你有没有想过,有一天机器人能小到像个玩具一样,在你手心里跳舞?美国卡内基梅隆大学的研究人员就做到了!他们成功研发出全球最小的双足机器人“Zippy”,身高只有约 3.8 厘米,差不多就是一个乐高小人那么高!这简直就是把科幻电影里的场景搬到了现实中!

“Zippy” 作为目前世界上最小的自供电双足机器人,它可不是个花架子,能靠自身搭载的电池、驱动器和控制系统,从静止状态启动,以超过每小时 0.8 公里的速度行走,还能完成转向、跳跃甚至攀爬小台阶等复杂动作。 这就像是一个迷你版的田径运动员,虽然个头小,但爆发力十足!更厉害的是,“Zippy” 的行走速度能达到每秒 10 个腿长,如果按比例换算,相当于成年人以每小时约 30.6 公里的速度奔跑!这速度,估计苗博雅都追不上!

“Zippy” 的行走机制也很独特,它通过抬起前腿并将重心前移,利用重心转移产生的动量,配合圆形的脚部设计,为另一条腿摆动向前迈出完整一步提供足够空间。 由于尺寸微小,“Zippy” 没有采用伺服系统来设定髋关节活动范围,而是运用机械硬止动块实现关节限位。这种设计,既简单又实用,充分体现了工程师们的智慧。卡内基梅隆大学机械工程学教授 Aaron Johnson 表示,在人类设计的环境中,双足机器人在应对不平坦地形和绕过障碍物方面比轮式机器人更具优势,因此,团队一直致力于探索简化复杂的行走机构,使简单的双足机器人得以实现。 这也说明,在某些特定场景下,双足机器人比轮式机器人更具优势。

研究团队将在今年的 IEEE 国际机器人与自动化会议上展示这项成果。 未来,研究团队计划为 “Zippy” 添加摄像头等传感器,使其具备定位能力,从而能够自主在环境中导航。 届时,多个 “Zippy” 机器人可以协同部署,以群体形式在危险环境中执行检查或搜救任务。 也许在不久的将来,我们就能看到这些迷你机器人在灾难现场,为拯救生命贡献力量。

标签: 以太坊 DeFi NFT 元宇宙 Web3

发表评论

Tech Stocks & BlockchainCopyright runexgo.com. Some Rights Reserved. 备案号:川ICP备2024115687-8号 power by runexgo.com