科普动态

2023年度科普行动专项计划(第三期) | 智能翻译—沟通交流的好帮手

发布时间:2023-06-29作者:上海能动中心

 

   科技立则民族立,科技强则国家强。科普是智慧之源、力量之源、创新之源。把握大势,实现高水平科技自立自强,需要重视蓄积科普的力量。

   2023年5月13日-5月14日,“中国科学院第十九届公众科学日暨全国科技工作者日”正式拉开帷幕,为响应“遇见科学,预见未来”主题活动,上海浦东先进能源动力研究中心正式启动2023年度科普行动专项计划,本次主题是“点燃全民科普明灯,筑梦科技自立自强“。
   科普行动专项计划第三期分享主题是智能翻译—沟通交流的好帮手。

   “小度小度,快帮我将【我很高兴认识你】翻译成英文!”

   大家有没有觉得,这个场景在日常生活中很常见呢?

   随着全球化发展及多元文化的交融,语言的相互转译成了生活中随处可见的场景。

   假如你急需翻译一句外语,而身边没有可以求助的人,你会怎么做呢?

   很多人都会首选翻译软件去协助我们快速理解。那么翻译软件究竟是如何实现精准翻译的呢?

翻译软件界面

   其实,翻译软件里也夹藏着近年来的大热词人工智能”这一技术,随着该项技术的发展愈加成熟,翻译软件的准确率和精度也大幅度提升。

   那到底什么是人工智能呢?人工智能是指使用计算机来模拟人的某些思维过程和智能行为,如学习、推理、思考和规划等,从而使计算机更“智能”,并实现更高层次的应用,智能翻译就是应用人工智能的实现的高层次应用之一。

   让我们借助下图更加清晰地了解智能翻译的工作原理吧~

翻译软件背后的三大模块

   我们可以从这张图看出,智能翻译主要由三大模块组成,分别是输入术语模块、机器学习算法模块输出术语模块。

   比如现在有一组中文短语“今天我很开心”,想要翻译成英文“Today i am so happy”。

   那么“今天我很开心”就是输入术语模块(输入对象),而“Today i am so happy”就是输出术语模块(输出对象)。

   大家都知道,人类和计算机的语言并不一样,那么计算机又是如何识别我们人类的语言呢?

   原来,在输入术语模块中,会被插入一个由大量语料库训练而成的语言模型A,通过识别输入对象中的语言特征,如语法、词汇、句式等,去匹配并转换为计算机能够理解的语言,也就是机器语言A

   那么问题来了,输入的文字被转换为机器语言A后,翻译软件又是如何发出翻译指令的呢?是谁让翻译软件知道要将中文短语“今天我很开心”(输入对象)翻译成英文“Today i am so happy”(输出对象)的呢?

   这个时候,就需要隆重介绍我们的机器学习算法模块了。

   在机器学习算法模块中,会被插入一个语言模型B,而这个模型则是通过大量的样本和数据库,根据不同语言之间的相似性和差异性来训练得到的;同时这个语言模型B也会结合机器语言A在上下文中的语境,输出合适的机器语言B,如词义的多义性或句子的修饰语等等。

   最后,在输出术语模块中,同样也需要一个语言模型C,将机器语言B转换为我们人类能够看得懂的语言,也就是输出对象

   同时,为了更好地适应用户的使用场景和需求,该模型C也会根据输出内容做出调整和优化等一些后处理,比如语法和语义的准确性检查和纠错等处理,从而得到输出对象,也就是目标语言。

   此外,我们在使用不同的翻译软件时,同样的输入对象,但得到的输出对象却不完全相同。其中,我们通常将更接近输入对象的翻译软件称之为高精度翻译,那么到底是什么影响了翻译软件的精确度呢?

   原来,语言模型A、B、C在各模块中的转换功能直接决定了翻译的精确度,这些模型的数据样本越多、数据库越大,那该模型便越“智能”,我们最后得到的翻译内容(输出对象)也越可靠。

   其实随着近年来人工智能技术的愈发成熟,该技术的应用可谓是潜移默化地融入了我们的日常生活中。
   全球顶尖管理咨询公司埃森哲于2017年发布的《人工智能:助力中国经济增长》报告显示,到2035年人工智能有望推动中国劳动生产率提高27%。
   我国发布的《新一代人工智能发展规划》提出,到2030年人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。
   你们身边又有哪些人工智能技术的应用呢?欢迎在后台留言栏中分享交流~
供稿| 苏贵龙
责编| 郑雯洁