昨天,国内首个融合权威工具书资源的智能审校解决方案——“辞文智能知识审校系统”正式发布。“辞文”基于《大辞海》权威知识库与百度文心大模型深度融合的创新成果,标志着出版行业智能化转型迈入新阶段。目前,“辞文”可以在10分钟之内完成40万字文本量的审校,并支持Word/WPS和PDF主流文档格式,其错误识别准确率达到80%。
“辞文”由上海辞书出版社联合百度、鲸汤(上海)智能科技有限公司历时两年研发,深度整合我国标志性大型综合性辞典《大辞海》中30多万词条的权威知识体系与文心大模型理解、生成、逻辑、记忆四大核心能力。“辞文”实现了四大技术突破:精准的知识溯源能力,能让用户不仅知道“错在哪里”,更明白“正确的应该是什么”;强大的多轮推理能力,可深入验证文本多维度合理性,找出隐藏的逻辑谬误;动态的知识更新机制,确保核查结果紧跟学术发展前沿;智能的交互式审校流程,既保留人工专业判断,又发挥AI的效率优势。审校工作效率成倍提升,有效解决传统文本审校在知识性、逻辑性方面的痛点。
在“辞文”中输入:“古今痴男女,谁能过情关?语妙天下的‘多情却被无情恼’也是出自元好问之手。”系统显示:“【建议替换】:‘也是’为‘并非’;【原因】:根据权威资料,并未提及‘多情却被无情恼’这句诗出自元好问之手,因此目标文本中的这一说法可能构成事实性错误。”修订内容将这一错误说法进行了更正,符合修订要求。
“辞文”还突破了以往各类文本审校工具的局限,实现了从“文字纠错”到“知识审校”的能力跨越,但是其价值更在于守护知识传播的准确性与严肃性。目前该产品已成功应用于人文社科、科学技术等出版领域。开发团队曾在某数字阅读平台上选取了一篇8000字的秦始皇主题文本,经专业编辑团队植入25处精心设计的知识性错误,涵盖历史事件、人物关系、制度沿革等,使用“辞文”智能审校系统进行检测,成功识别了20处错误。“辞文”还发现1处文本中原来就存在的错误。“泰山刻石已残,存字四行,每行十二字。现存山东泰山碧霞。”正确的是:“泰山刻石已残,存十字,现存山东泰山岱庙。”未来,“辞文”还将拓展至新闻传媒、教育科研等场景,致力于成为内容生产领域的“数字质检员”。
本报记者 徐翌晟