微軟的新語音識別技術可以將您的自然語音轉化為另一種語言[video]
,目前在移動空間中正在進行一場語音命令之戰,蘋果的Digital Siri助手和Google的語音搜索將其互相反對用戶的感情。兩者都有自己的一套利弊,並且只會在我們前進的未來時會變得更好,但是似乎微軟的研發團隊一直在努力從自己的幕後進行某種聲音,這些聲音可能會改變方式人類彼此互動。
雖然,Siri比Google在iOS平台上的語音搜索強大得多,但它們通常通過在吐出結果之前在後端服務器上發布和處理該命令之前從用戶捕獲可聽見的命令來工作,然後吐出結果。返回用戶並根據請求行事。微軟已經發布了一段視頻,其中包括里克·拉希德(Rick Rashid)的演講,概述了公司使用人類演講在自然用戶互動領域進行的改進。
理解人言語的基於計算機的系統並不是一項新發明。多年來,我們已經看到許多發行版在這一領域都顯示出很大的進步,Siri和Google語音搜索是幾個最新的示例,說明如何將該技術應用於現實世界中。但是,微軟一直在悄悄地試圖通過圍繞技術識別人類語音,而且將其轉化為外語的文本,然後使用合成的語音重複該語言的單詞,並將其轉化為外語的文本,從而悄悄地嘗試採取幾步。聽起來像揚聲器。
Microsoft首席研究官的舞台演示通過識別他的英語單詞,將其轉換為中文,然後在預計的顯示屏上轉換為中文,然後在普通話中宣布完全相同的句子,從而展示了這項技術。所有這些都足夠吹了,但是當您意識到Rashid和他的同事已經以超過一小時的語音數據餵養系統時,事情會有些添加一點自己的聲音!
這項技術不是最好的,但仍然犯了錯誤,但是意識到這是可能的,真是令人驚訝。人類互動的未來絕對即將到來。
(通過TechnetBlog)
您可以在Twitter上關注我們,將我們添加到Google+上的您的圈子中,或者喜歡我們的Facebook頁面,以使自己了解Microsoft,Google,Apple和Web的所有電流。