在这股AI大模型的风口中,5年亏损超438亿元的商汤科技,抢到了先机,推出了自研的AI大模型体系,站到了与阿里、百度、华为等巨头同台竞争的位置。但要成为中国版OpenAI,商汤还差多远? 作者胡描编辑罗丽娟 发酵了一个季度,年初被ChatGPT引爆的AI大模型,在近期迎来了集中爆发。被誉为中国AI四小龙之一商汤科技,也抢到了先机,交出了自己的AI大模型体系日日新SenseNova。 在4月10日的技术交流日上,商汤科技董事长兼CEO徐立展示了日日新体系下的语言大模型商量,AI文生图创作秒画、2D3D数字人生成如影、大场景小物体生成琼宇格物等一系列生成式AI模型及应用。 公开资料显示,其服务于大模型的AI大装置SenseCore,共有27000块的GPU芯片卡,可以输出5。0exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。甚至在英伟达A100的储存量上,商汤也达到了上万张,占到了与BAT同台竞争的位置上。 不过,强大的算力背后,商汤也付出了巨额的代价。据商汤财报,在2018年2022年之间,其研发费用率从45。9飙升至105。在2022年,商汤全年净亏损60。45亿元。据公开数据,2018年至今,商汤累计亏损达到了438亿元。 在资本输血的路径上,商汤与OpenAI有着相似之处。但不同于微软对后者的坚定支持,商汤扛着AI第一股的光环登上了港交所,又在半年后,上市前投资者、基石投资者股权解禁时,迎来了投资者的退出套现,股价下挫,市值腰斩。 ChatGPT刮起的AI大模型热潮,无疑是商汤的一次跃升机会,而商汤又会如何抓住呢?01商量,能力如何? 在4月10日的发布会上,商汤一口气展示了多个产品。 在日日新这个大模型体系下,商汤有与ChatGPT相似产品商量(SenseChat)。这是一个1800亿参数的中文大语言模型,可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等。 在现场,徐立演示了其创作广告语,与用户一人一句续写儿童故事,解答法律、医疗问题,编程等功能。 将超长文本《专利法》投喂给商量后,再向它提问。可以看到,商量能够理解《专利法》的文本,而后对用户的问题进行解答,回答的内容并非复制《专利法》的大段内容。 在医疗咨询上,当用户提出症状后,商量并没有给出病情诊断。而是进行多次询问,根据用户的患病时长、其他症状等,才给出了可能的病症和求医科室建议,更加类似人工的问诊。 商汤表示,目前问诊助手功能已在包括新华医院在内的多家医院落地,未来有望面向更多医院开放。 在编程的能力上,徐立表示,内部实测代码编写效率提升62,在HumanEval测试集上,准确率达到了40。2。在AI的辅助下,新一代软件开发的二八定律正在形成,未来将会是80AI生成20人工。 目前,商量还未开启内测,其能力对比ChatGPT、文心一言如何,还需要后续观察。不过,发布会上,商汤还展示出了其他让人眼前一亮的生成式AI模型及应用。 秒画为文生图创作平台,它的逻辑与Midjourney类似,用户选定风格后,输入提示词即可生成相应的图片。其一大亮点在于可以由用户自添加批量图片,自训练图片风格。 在展示中,徐立尝试创作一副港风美女图,在平台自生成效果并不如意后,在平台自添加进了数十张八九十年代香港女星照片。而后秒画生成的图片风格便更接近于用户想要的效果。 据商汤方面介绍,秒画可以做到2秒生成1张512K分辨率的图片,用户可基于单卡A100自训练。基于平台发布的模型,可设置toB服务API(应用程序编程接口),结合商汤大算力对外提供服务。 如影是商汤推出的AI数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。 在应用场景中,不乏直播带货、名师教学、宣传视频、短视频等。 琼宇、格物均为3D内容生成平台,分别指琼宇大空间3D内容生成应用、格物小物体3D内容生成应用,可基于3D内容生成技术实现对空间、物体的复刻与交互,快速生成大到城市、小到花朵的建模。 商汤方便表示,两者结合,可以高效、低成本生成大规模的三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间,可在商业广告、直播间等场景下应用。 从几款产品展示出来的效果来看,商汤的图片生成能力、打造数字人能力,以及制作视频,3D建模的能力,都达到了不错的效果。 不过,作为面向B端的技术,目前日日新大模型体系开放面向政企客户的API接口。何时开放内测,还未能确定。02商汤的底气 在国内,商汤可能是最早将人工智能大模型写入招股说明书的上市公司。作为中国AI四小龙之一,商汤对AI大模型的研发,也并非起于当下。 在2019年时,商汤便推出了10亿参数量规模的视觉模型,彼时,商汤已经使用了上千张GPU卡进行单任务训练。在过去两年里,商汤还训练了百亿参数规模的超大视觉模型。 在今年3月,商汤又推出了多模态多任务通用大模型书生(INTERN)2。5,具有30亿参数。 训练这些模型的基础,包括当前推出的大模型日日新,均得益于商汤AI大装置SenseCore的搭建。 在2015年,商汤开始研发深度学习训练框架SenseParrots,并逐渐以此为核心、持续研发,搭建起了AI基础设施SenseCore。据2022年财报,SenseCoreAI大装置基于2。7万块GPU的并行计算,系统实现了5。0exaFLOPS的算力输出,可支持最多20个千亿参数量超大模型(以千卡并行)同时训练。 到目前,SenseCore已支持8家客户进行大模型训练,总共提供了7000多张GPU卡。支持了超过10个大模型训练项目,包括语言大模型、文生图模型、视觉大模型、多模态模型等自研模型和客户自定义模型。 这一轮国内的AI大模型竞争中,算力竞争是一个十分重要的元素。 商汤联合创始人、首席科学家王晓刚曾表示,2021年,商汤在上海的临港建立了AIDC的超算中心,有5000P的算力,1万块的A100,而且可以实行数千卡的大规模的并行的训练。 商汤公布的一份纪要中提到,要训练像ChatGPT这样的生成式AI,所需的算力至少需要1万张英伟达A100加速卡的支持。在目前,国内只有6家公司具备这样的硬件实力,分别为商汤、百度、腾讯、字节、阿里、幻方。 这也意味着,在算力的硬件储备上,商汤站到了与BAT同台竞争的位置上。 此外,不仅是英伟达的专用显卡,商汤也在采购并适配国产的GPU。 在去年,商汤已在AI大装置中适配了许多寒武纪、海光的GPU卡。消息人士表示,商汤AI大装置当前的算力中,有10左右的算力,是由国产GPU卡提供的,商汤也一直在进行适配。 不过,相比于资金实力更加雄厚的大厂,商汤仍有不小的差距。相关消息显示,当前阿里云云上至少有上万张A100,整体能够达到10万张,阿里集团所拥有的量级为阿里云的5倍。 短期来看,商汤在国内AI大模型研发上算力不弱。但从长期来看,商汤如何能持续获得高端GPU,如A100、A800,存在不确定性。 毋庸置疑的是,国内的AI大模型正在开展一场追逐战,百度的文心一言、阿里的通义千问、华为的盘古、京东言犀,以及商汤的日日新纷纷加入战场。在未来,或还将有更多的入局者。 中国到底需要多少个AI大模型?氪信科技CEO、粤港澳大湾区数字经济研究院计算金融CTO工作室负责人朱明杰曾告诉全天候科技,AI大模型是一个基础设施,可以理解智能手机时代中的手机系统,如iOS、安卓。朱明杰认为,AI行业不需要太多的系统。 而从当前来看,入局者们都不想放过成为AI顶层设计者的可能性。这场争分夺秒的追逐战,也难以避免。03亏钱能力堪比openAI? 相比之下,商汤比起入局的互联网、科技巨头而言,还有许多内忧未曾解决。 商汤基础设施优势的代价,是高比例的研发投入。 在2022年,商汤在研发支出上合计40亿元,同比增长11;研发人效相比去年进一步提高90,人均每年研发模型数9。35个;累计商用模型数提高了93至6。7万个。截至2022年12月31日,公司的研发队伍达3466人,占员工总数的68。 但高昂的研发投入,暂时还未兑换成同等比例的营收,商汤仍在持续亏损。 据财报显示,在2022年商汤净亏损60。93亿元。在2018年至2022年5年中,商汤累计亏损总金额达438亿元。 商汤能够发展至今并在2021年底登陆港交所,一定程度上离不开资本输血。在上市前,商汤经历了12轮融资,累计融资金额达到了52。2亿美元,在它的背后,曾经站着软银、阿里、银湖、IDG、中国国有企业结构调整基金、上海国际集团、赛领、鼎晖等资本方。 这似乎也与OpenAI的成长路径有所相似。 在2019年,微软宣布和OpenAI建立独家合作伙伴关系,投资总额10亿美元。这笔资金放在如今爆火的AI行业来看,也是一笔巨款。而10亿美元还只是开始,截至目前,微软多次注资,已陆续向OpenAI投资130亿美元。在当前,OpenAI估值接近300亿美元。 相比于投入的金额,当前OpenAI的营收还微不足道。根据研究机构PitchBook的数据,OpenAI今年有望产生2亿美元的收入,较2022年增长150。 但不同于微软对OpenAI坚定的支持,商汤已经经历了投资人的撤离变现。 在去年6月30日,商汤科技上市前投资者、基石投资者股权基本解禁,涉及股份占公司总股本的73。在短短一天之内,商汤科技的市值蒸发了915亿港元。而后半年,阿里、软银、环球资本等投资方已纷纷减持套现。 今年以来,在AI大模型热潮之下,商汤的股价有所回温。当前的市值为1104亿港元,距离最高时的3200亿港元,仍有2000亿的差距。 商汤的确抢到了AI大模型的先机,但作为一家市场化的企业,在发力日日新大模型体系的同时,商汤更需要推进自身业务结构转型。 截至2022年末,商汤的业务主要分为智慧生活、智慧城市、智能汽车、智慧商业四大板块。其中,智慧生活与智能汽车增速显著,但智慧商业、智慧城市下滑也十分明显。在过去一年中,增长业务并未拉齐下滑业务,商汤实现营业收入38。09亿元,同比下降18。97。 目前,商汤的日日新大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市四业务板块。但大模型能够为这四块业务带来多少的增值,也还有待市场检验。