推荐设备MORE

廊坊企业网站建设企业—千翼

廊坊企业网站建设企业—千翼

疑难问题

响应式H5建站—为了赶翻译下岗,微软又往前走了

日期:2021-02-13
我要分享

导语:很多人感觉,视頻视频语音中文汉语翻译就是先把视頻视频语音辨别为文本,再把文本中文汉语翻译为此外一种语言的整个过程。具体上其实不是那般。
[标识:內容1]

—— 你它是什么含意啊?

—— 沒有甚么,含义含义。

一名新新职工新员工入职场的中文汉语翻译员,忧虑越来越越越强劲的机器设备中文汉语翻译抢了本身饭碗,因而在上提出问题,“这一生产制造制造行业也是有没有发展趋势发展前途?”老湿机们争相往前安慰,在这其中一位说,年轻人你兔样兔森破,让机器设备中文汉语翻译一下上面这一对话,看可否拿到,再聊忧虑吧。

不知道道道“年轻人”有没有去试。雷锋网(手机微信微信公众号:雷锋网)去试了试,发现生产制造制造行业认同最強大的 Google 中文汉语翻译和微软公司企业中文汉语翻译(Microsoft Translator),确实都弄不懂这一具备在我国特性的视頻视频语音对话。但两者的关键主要表现,也不是一样的。

同一段视頻视频语音,它是 Google 的结果:

它是微软公司企业的结果:

具体来说。运用视頻视频语音中文汉语翻译,Google 会详尽储存所有字;微软公司企业则会把第一句中的腔调词“啊”字省掉掉,把第二句中的“含义”省掉掉一个(可分辨为误伤)。为什么?

TrueText:祛除“哼哼哈嘿”

微软公司企业告之雷锋网,通常省掉掉“啊”以及误伤一个“含义”,是因为他们在视頻视频语音中文汉语翻译中运用了一项独门绝技——TrueText(智能化化文本校正)。在一份官方网网文字文本文档中,微软公司企业那麼描述 TureText 的作用:

这一整个过程包括去除造成不顺畅的字词(例如“啊”“嗯”以及不断术语)、将文本融解成句子、再加标点和规格写辨别。

这就是微软公司企业的视頻视频语音中文汉语翻译技术性性,为“口头上上语”所做的提高之一。Olivier Fontana 是微软公司企业科学研究科学研究院 Microsoft Translator 产品发展趋势发展战略负责人,在八月中旬的一次沟通交流沟通交流中,他告之雷锋网,大伙儿平时发言,讲出去的和写成来的描述方式并不是一样的(口头上上语和书面形式方式语),TrueText 可以把视頻视频语音辨别出的文字,变成机器设备更十分非常容易掌握的、更加有意义的内容,这一技术性性微软公司企业在全球范围内是唯一无二的。

因为工作中中关系,原文中写作者平常要处理许多采访巧记,尽管文本经历速录员的“人力资源提高”——祛除了许多腔调词,但通篇文字文本文档中找寻许多个不断的详尽句子,大部分并不是可能的。除开提早提前准备好的演说稿,十分小有些人平时发言的状况下会够用连贯性性的语句,描述本身的含义。人来发言时,本来就是磕磕绊绊的,是“话中有话”的,是“不言而喻”的,机器设备掌握人的原意,再转换成此外一种语言,也是十分艰难。TrueText 技术性性十分于用机器设备做了英文英语口语文本内容的整理。

视頻视频语音中文汉语翻译:为对话而提高

很多人感觉,视頻视频语音中文汉语翻译就是先把视頻视频语音辨别为文本,再把文本中文汉语翻译为此外一种语言的整个过程。具体上其实不是那般。

Olivier Fontana 告之雷锋网,微软公司企业尝试过这种简单拼凑的方式,但中文汉语翻译质量无法令人让人令人满意。最终微软公司企业的方案计划方案是,在视頻视频语音辨别阶段就为英文英语口语的辨别做了与众不同的输入提高,辨别之后的文本经历 TrueText 技术性性的处理,再进入文本中文汉语翻译阶段,文本中文汉语翻译的输出结果也要为英文英语口语做提高,最终依据健全的 TTS 技术性性让机器设备“载入来”中文汉语翻译结果。

Olivier Fontana 说,在“及时对话场景”的中文汉语翻译实体线实体模型商品产品研发整个过程中,微软公司企业遭受着三项关键的挑战:

收集英文英语口语语料。务必许多时间和金钱,来收集英文英语口语化的语料数据信息信息内容。

训练这类语料。这一项的测算成本费费十分高,务必许多的测算工作中工作能力和硬件配置配备加速系统软件手机软件。

开发设计设计方案英文英语口语实体线实体模型。每一种语言的英文英语口语描述方式和音标音标发音方法都不一样,同一种语言不一样班集体的人声伴奏伴奏音、俚语、响声速率和描述方式也不一样,无法用同一种实体线实体模型去进行。

微软公司企业详尽详细介绍,针对英文英语口语的中文汉语翻译提高,非常是在是针对闲谈对话内容的提高,以及 TrueText 技术性性,微软公司企业在业界都是唯一的。

Olivier Fontana 说明,传统式式机器设备中文汉语翻译都是依据比较公布的文本中文汉语翻译,微软公司企业则加上了许多依据英文英语口语对话的语料库。他显露,微软公司企业甚至还出钱请了很多人来 Skype Translator 上闲谈,谈他们的暑期,日常生活起居,作为英文英语口语数据信息信息内容进行搜集。

“对话即综合服务平台”

Skype Translator 的及时视頻视频语音中文汉语翻译技术性性,一经问世,就造成了生产制造制造行业关注。它是一项让两个不一样语言的人,可以及时依据本身的母语进行视頻视频语音进行沟通交流沟通交流的“黑高新科技高新科技”(见)。微软公司企业最初在 2012 年天津市市的一次学术研究科学研究主题风格主题活动上呈现了该项技术性性。17年十一月,该项技术性性在 Skype Translator 应用上进行商业服务,之后陆续运用到桌面上上版 Skype Translator 和 Microsoft Translator 手机上上App中。今年上半年度度,该项技术性性迈进新的里程数数碑,微软公司企业将 API 对外开放对外开放给所有人,方便快捷开发设计设计方案者将其集成化化到本身的应用中。

微软公司企业中文汉语翻译针对视頻视频语音“对话”进行的众多提高,十分非常容易让人想起到,这一公司在2020年初 Build 沟通交流大会上公布的发展趋势发展战略“对话即综合服务平台”。他们还显露,在今年年底前,将为Office 365企业顾客提供 Skype Meeting Broadcast 服务。依据该服务,可以自动式为互连网交流会再加外挂外挂字幕,并将会议及时地中文汉语翻译成不一样语言展现出来。 

注:原文中曾用题型《微软公司企业中文汉语翻译:别人仍在为“书面形式方式语”努力,大伙儿早就为“口头上上语”提高》

雷锋网原创文章内容內容,没承受权禁止转截。详尽信息内容见。