9月12日—16日,以“数字引擎 贸易未来”为主题的上海城市形象展区将亮相2024年中国国际服务贸易交易会,重点展示在国家战略引领下,上海在更高起点上全面深化改革开放,建设上海DEPA合作区、“丝路电商”合作先行区,争创国家服务贸易创新发展示范区,推动服务贸易高质量发展的成果和亮点。澳门新葡萄新京官网下面让我们探营上海城市形象展区的服务贸易企业。
如何随时随地创造语言环境学英语?前两个月,90后小华为了学英语,用起了一款名为“海螺AI”的APP,“比如你可以提出,想要练习在咖啡店场景下的口语,然后你就能和AI对话,还可以主动问AI自己哪些表述不妥当,让它纠正。”
实际上,这并不是一款专门用来学外语的APP,但因其智能助手的特性,被用户“开发”出各种用法。
据了解,海螺AI来自一家上海人工智能科创企业——稀宇科技(MiniMax)。从2021年成立至今,MiniMax已获得IDG、高瓴、国寿、阿里、腾讯、米哈游、红杉等多家海内外知名机构的超过10亿美金融资。今年服贸会,它也将带着最新大模型成果来到现场,展现人工智能的前沿魅力。
MiniMax副总裁刘华告诉记者,虽然起步较晚,但MiniMax在创立之初就坚定全栈自研大模型的道路,无论2B还是2C业务,都是为了能让其自研大模型触达更多用户,希望用人工智能技术让大家的生活更便捷,践行公司“与用户共创智能”的宗旨。
MiniMax在WAIC 2024活动展台自研大模型,技术和心理的双重考验
除了海螺AI,小华还用过MiniMax旗下另一款软件“星野”——和自定义的虚拟伙伴聊天,用户可以在星野APP上设定智能体的形象、声音和人设,并与之进行实时沟通互动,建立感情连接。
在2B业务端,MiniMax开放平台至今也服务超3万家企业客户,是国内公有云上调用量最大的大模型开放平台。譬如,MiniMax为金山办公提供文本生成、要点总结、任务分发、表格和演示文稿生成等能力,帮助其打造“WPS AI”产品;MiniMax还作为联想指定大模型供应商,与其联合打造AIPC个人智能体联想小天。
这些成绩背后,依靠的是MiniMax自研模型。作为中国首个研发万亿参数MoE大语言模型并成功上线的AI企业,MiniMax持续在模型算法上做创新,并最新推出基于MOE+ Linear Attention的新一代模型技术。通过此新型线性模型架构,MiniMax大模型能在单位时间内更加高效地训练海量数据,极大地提升了模型的实用性和响应速度。
“Abab其实是‘阿巴阿巴’的意思,就像婴儿牙牙学语时的状态,有点像是为了自嘲,因为那时候OpenAI已经做出GPT3,感觉人家已经比较成熟了。”刘华说,全栈自研是一条很艰难的道路。技术方面,不仅模型代码要自己写,训练数据要自己找,就连训练模型的集群也要自己和算力厂家一起打造。
心理层面上同样承压。在研发的过程中,团队需要在一次次面对糟糕结果的同时,还要坚持认定研发方向的正确性。“大家都知道,大模型需要训练到一定参数量后,才会有智能涌现的展示,我们中间有很长一段时间看不到这个,但我们还是得相信走下去是对的,如果在半路坚持不下去换赛道,就没有现在的成果了。”刘华说。
8月31日,MiniMax音乐模型与视频模型已经在MiniMax开放平台和海螺AI网页版上线系列文本模型将于未来数周内正式发布,并采用新一代创新技术。
在国内,海螺AI和星野APP的月活总用户已达到千万级。而在海外,有着星野“海外版”之称的Talkie也深受国外用户的欢迎。据SensorTower数据,Talkie的月活跃用户数量已达1100万。在2B业务方面,MiniMax则积极在“一带一路”国家地区进行拓展。
让国产大模型走出去,是MiniMax近年来一直在推进的方向,“我希望我们是一家全球化企业,在海内外都能开展业务。”刘华说,出海不仅可以服务更多国外客户,还能直接面对海外竞争,拥有更大迭代的动力。
在他看来,移动互联网时代时,中国有许多互联网企业产品都成功走到海外,并在当地具有一定影响力,“这样的故事在大模型时代,为什么不能复制呢?”
事实上不只是MiniMax,大模型出海已经形成一种趋势。5月23日,阿里云宣布,大模型服务平台百炼国际版即将上线,提供一站式、全托管的大模型定制与应用服务;科大讯飞在2024年世界移动通信大会上宣布,旗下讯飞听见同传、讯飞智作等产品在海外市场落地,登陆沙特、新加坡、马来西亚等市场。
清华大学新闻学院教授、人工智能学院教授沈阳在接受《环球时报》记者采访时表示,四大因素驱动中国AI大模型走向国际市场。
第一,为扩大市场份额,企业要寻求更大的产业空间;第二,国内AI技术发展较快,而海外许多国家仍处于起步阶段,AI大模型可以进入到这些市场进行产品验证和改进;第三,全球市场特别是东南亚、北非、北美和南美,为AI技术提供了更丰富的应用场景;第四,AI大模型出海也有助于深化与友好国家的经贸合作。
刘华说,比如在大洋彼岸,更多是产业界、资本界和学界在对大模型进行追捧,当地的普通民众其实对大模型并没有太熟悉。但在国内可以明显感受到,全社会对大模型的认可度和接受度都很高,大家很愿意尝试大模型产品,这给大模型行业的发展奠定了非常好的发展基础。
政策层面,2024年政府工作报告中就首次提出,要深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。具体到上海,人工智能作为上海三大先导产业之一,正在积极推进“人工智能+”发展,并发挥示范引领作用。
“我觉得对我们现在中国的大模型行业来说,提供了一个非常好的去做技术,同时去做产品的社会条件。”刘华说。
人工智能是新质生产力的驱动力。目前,MiniMax还在积极研发下一代更大参数的大模型,能让文本、语音、视觉三个模态更加自然的融合到下一代的这个模型里面。同时,也在通过算法的优化,来降低模型落地调用的成本。
图为“2024 MiniMax Link 伙伴日”活动上,MiniMax创始人、CEO闫俊杰主题分享
具体来看,语音模型亟待攻克的难点是交互延时,也就是用户在和智能体对话时,大模型的停顿时间,延时缩短,才能更像日常生活中人与人之间的自然沟通。值得一提的是,MiniMax新一代语音模型已实现对粤语、日语、韩语、西班牙语等多语种支持的升级。
“可能大家看到的,是我们在通过大模型提高个人生产力,提高大家的工作效率,其实这一波以大模型为代表的人工智能技术,是在引领一波新的科技革命。”刘华表示,随着模型能力的提高,现在它可以充当大家的语音助手,以后还能成为科学家们的科研助手。
“随着视觉模态模型的能力提高,我们相信大模型能够在一线生产制造环节发挥更大的作用,这是一个循序渐进的过程。”