科普动态

2023年度科普行动专项计划（第三期） | 智能翻译—沟通交流的好帮手

发布时间：2023-06-29作者：上海能动中心【小中大】

科技立则民族立，科技强则国家强。科普是智慧之源、力量之源、创新之源。把握大势，实现高水平科技自立自强，需要重视蓄积科普的力量。

2023年5月13日-5月14日，“中国科学院第十九届公众科学日暨全国科技工作者日”正式拉开帷幕，为响应“遇见科学，预见未来”主题活动，上海浦东先进能源动力研究中心正式启动2023年度科普行动专项计划，本次主题是“点燃全民科普明灯，筑梦科技自立自强“。

科普行动专项计划第三期分享主题是智能翻译—沟通交流的好帮手。

“小度小度，快帮我将【我很高兴认识你】翻译成英文！”

大家有没有觉得，这个场景在日常生活中很常见呢？

随着全球化发展及多元文化的交融，语言的相互转译成了生活中随处可见的场景。

假如你急需翻译一句外语，而身边没有可以求助的人，你会怎么做呢？

很多人都会首选翻译软件去协助我们快速理解。那么翻译软件究竟是如何实现精准翻译的呢？

翻译软件界面

其实，翻译软件里也夹藏着近年来的大热词“人工智能”这一技术，随着该项技术的发展愈加成熟，翻译软件的准确率和精度也大幅度提升。

那到底什么是人工智能呢？人工智能是指使用计算机来模拟人的某些思维过程和智能行为，如学习、推理、思考和规划等，从而使计算机更“智能”，并实现更高层次的应用，智能翻译就是应用人工智能的实现的高层次应用之一。

让我们借助下图更加清晰地了解智能翻译的工作原理吧~

翻译软件背后的三大模块

我们可以从这张图看出，智能翻译主要由三大模块组成，分别是输入术语模块、机器学习算法模块和输出术语模块。

比如现在有一组中文短语“今天我很开心”，想要翻译成英文“Today i am so happy”。

那么“今天我很开心”就是输入术语模块（输入对象），而“Today i am so happy”就是输出术语模块（输出对象）。

大家都知道，人类和计算机的语言并不一样，那么计算机又是如何识别我们人类的语言呢？

原来，在输入术语模块中，会被插入一个由大量语料库训练而成的语言模型A，通过识别输入对象中的语言特征，如语法、词汇、句式等，去匹配并转换为计算机能够理解的语言，也就是机器语言A。

那么问题来了，输入的文字被转换为机器语言A后，翻译软件又是如何发出翻译指令的呢？是谁让翻译软件知道要将中文短语“今天我很开心”（输入对象）翻译成英文“Today i am so happy”（输出对象）的呢？

这个时候，就需要隆重介绍我们的机器学习算法模块了。

在机器学习算法模块中，会被插入一个语言模型B，而这个模型则是通过大量的样本和数据库，根据不同语言之间的相似性和差异性来训练得到的；同时这个语言模型B也会结合机器语言A在上下文中的语境，输出合适的机器语言B，如词义的多义性或句子的修饰语等等。

最后，在输出术语模块中，同样也需要一个语言模型C，将机器语言B转换为我们人类能够看得懂的语言，也就是输出对象。

同时，为了更好地适应用户的使用场景和需求，该模型C也会根据输出内容做出调整和优化等一些后处理，比如语法和语义的准确性检查和纠错等处理，从而得到输出对象，也就是目标语言。

此外，我们在使用不同的翻译软件时，同样的输入对象，但得到的输出对象却不完全相同。其中，我们通常将更接近输入对象的翻译软件称之为高精度翻译，那么到底是什么影响了翻译软件的精确度呢？

原来，语言模型A、B、C在各模块中的转换功能直接决定了翻译的精确度，这些模型的数据样本越多、数据库越大，那该模型便越“智能”，我们最后得到的翻译内容（输出对象）也越可靠。

其实随着近年来人工智能技术的愈发成熟，该技术的应用可谓是潜移默化地融入了我们的日常生活中。

全球顶尖管理咨询公司埃森哲于2017年发布的《人工智能：助力中国经济增长》报告显示，到2035年人工智能有望推动中国劳动生产率提高27%。

我国发布的《新一代人工智能发展规划》提出，到2030年人工智能核心产业规模超过1万亿元，带动相关产业规模超过10万亿元。

你们身边又有哪些人工智能技术的应用呢？欢迎在后台留言栏中分享交流~

供稿｜苏贵龙

责编｜郑雯洁