今天(10月31日),2023云栖大会在浙江杭州举行,两百多家云计算全产业链企业共3000项技术、产品、应用参展,记者发现,“大模型技术”毫无疑问是当下的热词。
今年以来,国内外科技企业竞相围绕大模型扩展商业版图。数据显示,截至2023年8月,我国已发布的大模型达156个,10亿级参数规模以上大模型已超80个,展现出“百模大战”的竞争态势。从与人顺畅聊天到写合同、童话,从检测程序安全漏洞到辅助创作游戏甚至电影……大模型开始加速赋能千行百业,呈现出丰富的应用和技术形态。
通俗来说,大模型就是利用海量的数据和算力,训练出可以生成各种内容的超级人工智能。不同于传统IT系统的确定性,这种模型背后有其自己对世界模型空间的认知。ChatGPT就是通用人工智能大模型出现的典型代表。
云栖大会上,阿里云正式发布了通义千问2.0,相比6个月前发布的1.0版本,新版本在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。据介绍,通义千问2.0拥有千亿级参数,所有人都可通过APP直接体验。
模型能力的提升,也带来了市场需求的扩容,千行百业都想借助大模型实现生产和服务方式的变革。如某智能汽车操作系统接入大模型后,用户用车时,如果说想听雨打竹林的声音,相应的画面和声音便在座舱内显现,比最初的语音互动更多元,也更符合用户习惯。
产品总监黄缨宁介绍道:“人类的创造力和需求是非常复杂多变的,传统的小模型可能理解不了那么多,那搭载了大模型技术的智能座舱,能够基于所说的话信息进行逻辑推理,然后生成更符合人类对话体验的一个动作执行。”
童语故事创始人张华成就了一位父亲用大模型创业的故事。三个月前,他们上线了国内首个利用人工智能生成内容能力的儿童绘本产品“童语故事”,部署在淘宝和微信小程序里。用户上传头像后可进行数字分身创建,只需在故事主题栏中输入一句主题,如“如何解决孩子爱哭的问题”,就能得到以该数字分身为主角的特定主题童话绘本,整个过程极快,通常生成时间在1-3分钟左右,没想到,3个月后月活用户便涨到了30万。
“那这个不一样的背后是什么?就是代入感,我可以把这个小朋友自身的,他在他过去的熟悉的场景里面,把那个场景变成一个动画片,叠加这种个性化的内容诉求在里面,你每个人看到是不一样的,他阅读的兴趣是被激发的。”
来自深势科技的创业团队还认为,AI大模型可以帮助新药研发做到过去做不了的事。相关工作人员介绍说,比如一些难成药的靶点,就可以对蛋白动态构象进行充分采样,探索全新的隐藏/别构口袋,相当于把一个生命科学的问题,转化成计算工程的问题。且以前可能需要做一百万次实验,通过大量的计算和模拟之后,只用做几百次、上千次:“通过计算机的模拟,能够模拟出来这个药物发现的一些环节,哪些是有可能成药的。一个人体蛋白质,能够在当中找一个蛋白质的口袋,把药物放进去,能够改变这个蛋白质特性,当然这个很复杂,都还在早期探索阶段。”
业内人士表示,大模型的价值在于应用。只有在多样化的实际应用场景中赋能智能经济与智能社会的发展,才能找到产业价值,同时也成就大模型自身。不过,随着大模型的普及和应用,其也面临着一些挑战和问题。例如,数据隐私和安全性、算法的偏见和歧视问题以及模型的解释性和可理解性等。
未来,在进一步研究和探索大模型在行业应用中的可持续发展路径和创新应用模式的同时,也需要关注大模型的伦理和社会影响问题,制定相应的规范和标准,促进人工智能技术的健康发展。
(江苏新闻广播/丁凤云 编辑/汪泽)