<delect id="dll9b"></delect>

<pre id="dll9b"><output id="dll9b"></output></pre><p id="dll9b"><delect id="dll9b"><menuitem id="dll9b"></menuitem></delect></p>

<p id="dll9b"></p>

<output id="dll9b"></output>
<pre id="dll9b"><delect id="dll9b"></delect></pre>

<output id="dll9b"><delect id="dll9b"></delect></output>
<pre id="dll9b"></pre><output id="dll9b"></output>

<output id="dll9b"></output>

<p id="dll9b"><delect id="dll9b"><menuitem id="dll9b"></menuitem></delect></p><p id="dll9b"></p>
<p id="dll9b"></p>

<output id="dll9b"><delect id="dll9b"><listing id="dll9b"></listing></delect></output><p id="dll9b"><delect id="dll9b"><listing id="dll9b"></listing></delect></p>

<p id="dll9b"><delect id="dll9b"><menuitem id="dll9b"></menuitem></delect></p>
<pre id="dll9b"></pre>

<p id="dll9b"></p>
<p id="dll9b"><menuitem id="dll9b"></menuitem></p>
<output id="dll9b"><menuitem id="dll9b"></menuitem></output>
<pre id="dll9b"></pre>

<p id="dll9b"></p>

<pre id="dll9b"><delect id="dll9b"><menuitem id="dll9b"></menuitem></delect></pre>

<p id="dll9b"><delect id="dll9b"></delect></p>

<p id="dll9b"></p>
<p id="dll9b"></p>

<p id="dll9b"><delect id="dll9b"><listing id="dll9b"></listing></delect></p><p id="dll9b"></p>

物流資訊

大數據的簡單算法與小數據的復雜算法

發布時間:2024-11-20

20世紀40年代,計算機由真空管制成,要占據整個房間這么大的空間,而機器翻譯也只是計算機開發人員的一個想法,所以,計算機翻譯也成了亟待解決的問題。

最初,計算機研發人員打算將語法規則和雙語詞典結合在一起。1954年,IBM以計算機中的250個詞語和六條語法規則為基礎,將60個俄語詞組翻譯成了英語,結果振奮人心。IBM701通過穿孔卡片讀取了一句話,并將其譯成了“我們通過語言來交流思想”。在慶祝這個成就的發布會上,一篇報道就有提到,這60句話翻譯得很流暢。這個程序的指揮官利昂?多斯特爾特表示,他相信“在三五年后,機器翻譯將會變得很成熟”。

事實證明,計算機翻譯最初的成功誤導了人們。1966年,一群機器翻譯的研究人員意識到,翻譯比他們想象的更困難,他們不得不承認自己的失敗。機器翻譯不能■只是讓計算機熟悉常用規則,還必須教會計算機處理特殊的語言情況。畢竟,翻譯不僅僅只是記憶和復述,也涉及選詞,而明確地教會計算機這些非常不現實。

在20世紀80年代后期,IBM的研發人員提出了一個新的想法。與單純教給計算機語言規則和詞匯相比,他們試圖讓計算機自己估算一個詞或一個詞組適合于用來翻譯另一種語言中的一個詞和詞組的可能性,然后再決定某個詞和詞組在另一種語言中的對等詞和詞組。

20世紀90年代,IBM這個名為Candide的項目花費了大概十年的時間,將大約有300萬句之多的加拿大議會資料譯成了英語和法語并出版。由于是官方文件,翻譯的標準就非常高。用那個時候的標準來看,數據量非常之龐大。統計機器學習從誕生之日起,就聰明地把翻譯的挑戰變成了一個數學問題而這似乎很有效。計算機翻譯能力在短時間內就提高了很多。然而,在這次飛躍之后,丨BM公司盡管投入了很多資金,但取得的成效不大。最終,IBM公司停止了這個項目。

2006年,谷歌公司也開始涉足機器翻譯。這被當作實現“收集全世界的數據資源,并讓人人都可享受這些資源”這個目標的一個步驟。谷歌翻譯開始利用一個更大更繁雜的數據庫,也就是全球的互聯網,而不再只利用兩種語言之間的文本翻譯。

為了訓練計算機,谷歌翻譯系統會吸收它能找到的所有翻譯。它會從各種各樣語言的公司網站上尋找對譯文檔,還會去尋找聯合國和歐盟這些國際組織發布的官方文件和報告的譯本。它甚至會吸收速讀項目中的書籍翻譯。谷歌翻澤部的負責人弗朗

茲?奧齊是機器翻譯界的權威,他指出,“谷歌的翻譯系統不會像Candide—樣只是仔細地翻譯300萬句話,它會掌握用不同語言翻譯的質量參差不齊的數十億頁的文檔?!比绻豢紤]翻譯質量,上萬億的語料庫就相當于950億句英語。

盡管其輸入源很混亂,但較其他翻譯系統而言,谷歌的翻譯質量相對而言還是最好的,而且可翻譯的內容更多。到2012年中,谷歌數據庫涵蓋了60多種語言,甚至能夠接受14種語言的語音輸入,并有很流利的對等翻譯。之所以能做到這些,是因為它將語言視為能夠判別可能性的數據,而不是語言本身。如果要將印度語譯成加泰羅尼亞語,谷歌就會把英語作為中介語言。因為在翻譯的時候它能適當增減詞匯,所以谷歌的翻譯比其他系統的翻譯靈活很多。

谷歌的翻譯之所以更好并不是因為它擁有一個更好的算法機制,而是因為谷歌翻譯增加了很多各種各樣的數據。2006年,谷歌發布的上萬億的語料庫,就是來自于互聯網的一些廢棄內容。這就是“訓練集”,可以正確地推算出英語詞匯搭配在一起的可能性。

谷歌公司人工智能專家彼得?諾維格在一篇題為《數據的非理性效果》的文章中寫道,“大數據基礎上的簡單算法比小數據基礎上的復雜算法更加有效?!彼麄兙椭赋?,混雜是關鍵。



国产媱片在线观看|七七桃色综合综合久久桃花网|国产小屁孩CAO大人免费|国产精品国产精品国产专区|亚洲色大成网站www永久网

<delect id="dll9b"></delect>

<pre id="dll9b"><output id="dll9b"></output></pre><p id="dll9b"><delect id="dll9b"><menuitem id="dll9b"></menuitem></delect></p>

<p id="dll9b"></p>

<output id="dll9b"></output>
<pre id="dll9b"><delect id="dll9b"></delect></pre>

<output id="dll9b"><delect id="dll9b"></delect></output>
<pre id="dll9b"></pre><output id="dll9b"></output>

<output id="dll9b"></output>

<p id="dll9b"><delect id="dll9b"><menuitem id="dll9b"></menuitem></delect></p><p id="dll9b"></p>
<p id="dll9b"></p>

<output id="dll9b"><delect id="dll9b"><listing id="dll9b"></listing></delect></output><p id="dll9b"><delect id="dll9b"><listing id="dll9b"></listing></delect></p>

<p id="dll9b"><delect id="dll9b"><menuitem id="dll9b"></menuitem></delect></p>
<pre id="dll9b"></pre>

<p id="dll9b"></p>
<p id="dll9b"><menuitem id="dll9b"></menuitem></p>
<output id="dll9b"><menuitem id="dll9b"></menuitem></output>
<pre id="dll9b"></pre>

<p id="dll9b"></p>

<pre id="dll9b"><delect id="dll9b"><menuitem id="dll9b"></menuitem></delect></pre>

<p id="dll9b"><delect id="dll9b"></delect></p>

<p id="dll9b"></p>
<p id="dll9b"></p>

<p id="dll9b"><delect id="dll9b"><listing id="dll9b"></listing></delect></p><p id="dll9b"></p>