首页 >> 语言学 >> 新闻头条
机器自动写作大学生运动会致辞、体育赛事新闻、高校学术活动总结稿件—— 汉语智能写作取得重大突破(在一线)
2016年06月02日 07:37 来源:人民日报 作者:董洪亮 字号

内容摘要:输入“时间”“学校”“参加人员”和“领导”等大学生运动会关键词,机器就迅速生成一篇1000多字的开幕式致辞,其中有致谢、天气情况、运动会人数及项目等。更难能可贵的是,致辞还富有情感色彩——这是日前在“2016中国汉语智能写作成果发布会”上的一幕。

关键词:智能;汉语;写作;写作平台;语言

作者简介:

  输入“时间”“学校”“参加人员”和“领导”等大学生运动会关键词,机器就迅速生成一篇1000多字的开幕式致辞,其中有致谢、天气情况、运动会人数及项目等。更难能可贵的是,致辞还富有情感色彩——这是日前在“2016中国汉语智能写作成果发布会”上的一幕。

  5月下旬,北京语言智能协同研究院发布汉语智能写作重大突破——体育赛事新闻、大学生运动会开幕式致辞和高校学术活动总结稿件可以由智能写作平台自动完成写作。该成果是首都师范大学副校长周建设教授担任领衔专家的研究团队经过多年探索,在语言智能研究领域取得的一项重大理论和技术突破。

  如何看待能够自动写作的机器

  智能写作平台准确、快捷地生成应用稿件,具有开创性意义。北京大学计算语言学研究所所长王厚峰教授说,“演示令我很惊讶”。

  据周建设介绍,智能写作是利用计算机完全自动地对收集的文档进行整理、提取、过滤、筛选、组装、写作,自动地生成相关文章。

  北京语言智能协同研究院特聘教授吕学强说,研究团队通过对受限语体海量篇章文本数据的挖掘,提出了一种大数据的汉语表达智能模型并研发了汉语受限语体智能写作系统,构建了相关知识库体系。目前,智能写作平台能够完成受限语体的文稿,受限语体是有特定使用场合,结构、格式比较固定的语体。

  这项汉语智能写作重大突破,是国家社科基金重大招标项目子项目——“自然语言信息处理的逻辑语义学研究·言语生成系统”“语言、思维、文化层次的高阶认知研究·语图生成系统”的阶段性成果;也是国家自然科学基金项目——“语义web中不确定知识的本体表示和融合的理论方法研究”“无监督分词及词性归纳联合方法研究”“e—earning中基于学业表情的情绪认知分析研究”的阶段性成果。

  据介绍,汉语智能写作平台包含32项关键技术,其所写文稿内容流畅性、语义准确性与人工写作的差别在缩小。

  智能写作平台的理论技术创新

  想要机器像人一样自如写作,就要构建“人一样”的汉语表达智能模型。在语言生成的过程中,汉语智能写作平台对所要表达的信息进行语义和语法方面的聚合,其中,内容规划即内容确定+结构构造,句子规划包括选词、优化聚合、指代表达式生成等,句子实现就是将经句子规划后的文本描述映射至由文字、标点符号和结构注解信息组成的表层文本。

  首都师范大学文学院教授史金生说,汉语智能写作平台构建了基于汉语智能表达的知识库,其一是语言模板库——单词、短语、句子语料库;其二是语义类型库——给汉语智能表达提供话语论域,以便将话题限定在特定语义领域内布局谋篇、组织语句。有两个子系统支持汉语表达智能模型,即“词项—语句”语义网络,实现从词到句子的自动生成;“语句—语篇”语义网络,实现自然语言语篇的自动生成。

分享到: 0 转载请注明来源:中国社会科学网 (责编:王婷婷)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
QQ图片20180105134100.jpg
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
w020151002585424653788_副本_副本_副本_副本_副本_副本_副本_副本.jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们