科技立则民族立,科技强则国家强。科普是智慧之源、力量之源、创新之源。把握大势,实现高水平科技自立自强,需要重视蓄积科普的力量。
“小度小度,快帮我将【我很高兴认识你】翻译成英文!”
大家有没有觉得,这个场景在日常生活中很常见呢?
随着全球化发展及多元文化的交融,语言的相互转译成了生活中随处可见的场景。
假如你急需翻译一句外语,而身边没有可以求助的人,你会怎么做呢?
很多人都会首选翻译软件去协助我们快速理解。那么翻译软件究竟是如何实现精准翻译的呢?
翻译软件界面
其实,翻译软件里也夹藏着近年来的大热词“人工智能”这一技术,随着该项技术的发展愈加成熟,翻译软件的准确率和精度也大幅度提升。
那到底什么是人工智能呢?人工智能是指使用计算机来模拟人的某些思维过程和智能行为,如学习、推理、思考和规划等,从而使计算机更“智能”,并实现更高层次的应用,智能翻译就是应用人工智能的实现的高层次应用之一。
让我们借助下图更加清晰地了解智能翻译的工作原理吧~
翻译软件背后的三大模块
我们可以从这张图看出,智能翻译主要由三大模块组成,分别是输入术语模块、机器学习算法模块和输出术语模块。
比如现在有一组中文短语“今天我很开心”,想要翻译成英文“Today i am so happy”。
那么“今天我很开心”就是输入术语模块(输入对象),而“Today i am so happy”就是输出术语模块(输出对象)。
大家都知道,人类和计算机的语言并不一样,那么计算机又是如何识别我们人类的语言呢?
原来,在输入术语模块中,会被插入一个由大量语料库训练而成的语言模型A,通过识别输入对象中的语言特征,如语法、词汇、句式等,去匹配并转换为计算机能够理解的语言,也就是机器语言A。
那么问题来了,输入的文字被转换为机器语言A后,翻译软件又是如何发出翻译指令的呢?是谁让翻译软件知道要将中文短语“今天我很开心”(输入对象)翻译成英文“Today i am so happy”(输出对象)的呢?
这个时候,就需要隆重介绍我们的机器学习算法模块了。
在机器学习算法模块中,会被插入一个语言模型B,而这个模型则是通过大量的样本和数据库,根据不同语言之间的相似性和差异性来训练得到的;同时这个语言模型B也会结合机器语言A在上下文中的语境,输出合适的机器语言B,如词义的多义性或句子的修饰语等等。
最后,在输出术语模块中,同样也需要一个语言模型C,将机器语言B转换为我们人类能够看得懂的语言,也就是输出对象。
同时,为了更好地适应用户的使用场景和需求,该模型C也会根据输出内容做出调整和优化等一些后处理,比如语法和语义的准确性检查和纠错等处理,从而得到输出对象,也就是目标语言。
此外,我们在使用不同的翻译软件时,同样的输入对象,但得到的输出对象却不完全相同。其中,我们通常将更接近输入对象的翻译软件称之为高精度翻译,那么到底是什么影响了翻译软件的精确度呢?
原来,语言模型A、B、C在各模块中的转换功能直接决定了翻译的精确度,这些模型的数据样本越多、数据库越大,那该模型便越“智能”,我们最后得到的翻译内容(输出对象)也越可靠。