商汤科技“日日新”大模型体系下“秒画”大模型 本报记者 刘歆 摄
科大讯飞在2023世界人工智能大会上展示星火大模型与行业的结合 本报记者 刘歆 摄
8月31日以来,商汤科技、上海人工智能实验室、科大讯飞等国产人工智能(AI)大模型通过首批备案“持证上岗”,面向全民开放服务。同时,一大波测评在小红书、微信公众号上走红,大家纷纷通过搜索能力、情感分析能力等不同角度来看哪个大模型更“聪明”。也有人表示担忧,之前学生拿ChatGPT写论文让高校教师头疼,国产大模型开放,对教育会否带来更大冲击?
那么,这些大模型和普通人有何关系?目前用户刚需使用场景有哪些?国产大模型上线也有时日,带着种种疑问,记者采访了领域内的多位专家。
六大变革指日可待
根据我国8月15日正式实施的《生成式人工智能服务管理暂行办法》,利用生成式人工智能产品向公众提供服务前,应当按照有关规定开展安全评估,并履行算法备案等手续。此轮通过备案并集中上线的国产大模型,就是首批“持证上岗”者。
9月5日正式上线的讯飞星火认知大模型,14小时用户数便突破百万,后台数据显示,目前用户刚需使用场景集中于知识问答、内容生成、教育学习、编程辅助等场景。
“认知大模型技术将深刻改变每一个普通人的工作和生活。”这是科大讯飞副总裁、研究院院长刘聪的判断。截至目前,讯飞星火App的用户开发出一万个左右的个性化AI助手,普通人能调用多个已经上架的AI助手,也能通过简单几步开发自己的专属AI助手,满足职场、营销、出行、生活、公文、客服等多种场景需求,帮助解决工作生活中的各种问题。
他告诉记者,未来几年,通用认知智能技术将持续快速发展,给全世界带来六大方面的重大模式创新和产业变革:改变信息分发和获取的模式、革新内容生产模式、全自然交互完成任务、实现专家级的虚拟助手、颠覆传统手工编程方式、成为科研工作加速器。
兴利除弊用好“工具”
大模型应该做什么?自OpenAI公司发布ChatGPT后,争论就没有停止,尤其在教育领域,相当数量的学生使用ChatGPT完成毕业论文和平时作业——它不仅可以找出语法错误,还能对行文提出建议。
这一回,国产大模型“开闸”,并且多款大模型的数学、代码能力相当出色,已经成年的大学生尚且不能抵挡ChatGPT带来的便利,对学龄青少年来说,大模型的开放是否会带来学习上的某种依赖?
“这其实是对于各种‘工具’共同的关切。不仅是大模型,计算器、辅导书背后的参考答案、搜索引擎等等,都会存在‘滥用’‘作弊’的隐忧。”商汤科技副总裁、AI伦理与治理委员会主席张望指出,大模型还处在快速发展、快速适应和更新的过程中,“长期来看,生成式人工智能工具将成为人们生活和工作当中必不可少的助手、伙伴。积极探索和引导未成年人正确使用生成式人工智能工具意义重大,比如说生成式人工智能的通识教育、引导青少年正确使用等,都是可以考虑优化的方向”。
既是压力也是动力
与此同时,大模型“飞入寻常百姓家”后,引发人们对数据安全和隐私的新一轮担忧。张望认为,这既涉及对数据安全和个人信息保护、科学技术伦理、算法与模型安全相关制度的建立与严格执行;同时也涉及对相关技术工具的完善和使用,比如对数据脱敏、数据沙箱、模型安全体检等。“相关大模型的产品全链路,包括设计、编码、测试、交付等阶段均需经过数据安全和个人信息保护审查,确保产品具备数据安全和隐私保护能力才能批准上线。”他解释。
大模型从“生出来”到“用起来”的时间并不长,这得益于监管上的思维之变——过去对人工智能的发展多是“事后监管”,而这一回变成“边跑边管”。
据相关统计,目前我国10亿以上参数规模的大模型已近80个,大模型备案机制的建立和首批开放,一定程度上建立起真实用户调用和模型迭代之间的“飞轮效应”。“对人工智能行业来说既是一种压力,也是一种动力。”张望分析,压力主要来自于各方对生成式人工智能的各项能力和表现提出更高的期待,但正是这种期待也从侧面反映出人工智能距离大规模应用越来越近,各方对人工智能的关注进入到一个空前的高度,对人工智能行业来说其实也是一种动力。
同场竞技拥有底气
据分析,此轮国产大模型正式上线并面向全民开放后,会带来大量的用户注册、使用量以及由此产生的海量数据,将大大助力模型训练,促进技术和产品迭代升级,进而使大模型变得更智能与更“聪明”,为用户创造更好的使用体验。不过需要指出的是,目前国内大模型在C端仍以免费使用为主,而C端用户付费意愿相对较弱,如何跑通商业模式还需长期观察。
记者注意到,国内大模型迭代取得新进展后,人们还是“习惯性”地拿它们与ChatGPT“比较长短”。对此,科大讯飞副总裁、研究院院长刘聪指出,目前国内与国际顶尖的认知智能大模型对比还存在综合实力、平台能力等差距,在“直道冲锋”过程中,会在芯片、高质量数据、系统迭代等方面遇到严峻挑战。不过,国内在大模型各技术领域方面有长期的探索与积累,核心技术方面的系统性创新也不断“开花结果”。他认为,挑战并奋力追赶的过程必将是一场“持久战”,需要产业先行,科研创新与产业发展齐头并进。
刘聪表示,大模型集中上线之后,未来会出现“通用大模型‘剩者为王’、垂直大模型百花齐放”的局面,而有数据、懂场景的细分行业龙头企业要和能提供通用认知智能大模型的平台合作,站在安全可控、具备训练优化及自我迭代能力的平台的肩膀上进行长期可持续的产品打磨。“目前国内大模型产业呈现百花齐放的格局,未来随着相关制度规范的不断完善,国产大模型在‘持久战’中会拥有更足的底气和支持。”他总结说。本报记者 郜阳