華生 (人工智能程式)
此條目的參照需要清理,使其符合格式。 (2014年4月6日) |
華生(英語:Watson)是能夠使用自然語言來回答問題的人工智能系統,[2]由IBM公司的首席研究員大衛·費魯奇所領導的DeepQA計劃小組開發並以該公司創始人托馬斯·J·華生的名字命名。[3][4]
2011年,華生參加綜藝節目《危險邊緣》來測試它的能力,這是該節目有史以來第一次人與機器對決。[3]2月14日至16日廣播的3集節目中,華生在前兩輪中與對手打平,而在最後一集裏,華生打敗了最高獎金得主布拉德·魯特爾和連勝紀錄保持者肯·詹寧斯。[5][6]華生贏得了第一筆獎金100萬美元,而肯·詹寧斯和布拉德·魯特爾分別只有30萬和20萬。賽後,詹寧斯和魯特表示將一半獎金用於慈善事業,IBM公司也將華生的獎金分給了兩家慈善機構。[7]
華生在比賽節目中按下訊號燈的速度始終比人類選手要快,但在個別問題上反映困難,尤其是只包含很少提示的問題。對於每一個問題,華生會在螢幕上顯示3個最有可能的答案。華生4TB磁碟內,包含2億頁結構化和非結構化的資訊,[8]包括維基百科的全文。[9]在比賽中華生沒有連結到互聯網。[10][11]
結構
編輯華生是IBM製造的電腦問答(Q&A)系統。[2] IBM介紹時說「它是一個集進階自然語言處理、訊息檢索、知識表示、自動推理、機器學習等開放式問答技術的應用」,並且「基於為假設認知和大規模的證據搜集、分析、評價而開發的DeepQA技術」。[2]
硬件
編輯根據IBM的說法:
華生是一台專為複雜分析而最佳化設計的系統,整合大規模並列處理器POWER7和IBM DeepQA軟件使其能在3秒內回答危險邊緣的問題成為可能。華生是由90台IBM Power 750伺服器(還包括10個機櫃裏額外的輸入輸出埠、網絡和叢集控制器節點)組成的叢集伺服器,共計2880顆POWER7處理器核心以及16TB主記憶體。每台Power 750伺服器使用一個3.5GHz、8核心,每核心4線程的POWER7處理器。只有POWER7處理器強大的平行計算能力才能勉強執行華生安裝的IBM DeepQA軟件。[13]
John Rennie說,華生每秒可以處理500GB的數據,相當於1秒閱讀100萬本書。[14] IBM研發負責人和進階顧問Tony Pearson估計華生的硬件花費近300萬美元,[15]其80 TeraFLOPs的處理能力在超級電腦世界500強排名第94,在超級電腦世界50強排名第49。[16] Rennie還說,比賽的數據是存放在華生的主記憶體中的,因為硬碟的存取速度太慢了。[14]
軟體
編輯華生的軟件由數種不同語言寫成,包含Java、C++和Prolog等,並且採用Apache Hadoop框架做分散式計算,還有Apache UIMA(Unstructured Information Management Architecture)框架、IBM DeepQA軟件和SUSE Linux Enterprise Server 11 作業系統。[8][17][18]「……超過100項不同的技術被用在自然語言分析、來源辨識、尋找並生成假設、挖掘證據以及合併推翻假設。」[19]
數據
編輯華生的資訊來源包括百科全書、字典、詞典、新聞和文學作品。華生也使用資料庫、分類學和本體論。特別是DBpedia, WordNet,和Yago。[20]
IBM小組為華生提供數百萬的文件,其中包括字典、百科全書和其他能建立知識庫的參考材料。[11]儘管華生在比賽中沒有連結互聯網,[21]它4TB的磁碟上仍有2億頁結構化和非結構化的資訊供其使用,[8]其中包括了維基百科的全文。[9]
操作
編輯「 | 用電腦技術來解決危險邊緣的問題聽起來有點雷人。那機器將問題中的關鍵字提取出來,然後在叢集簇(華生有相當於15TB的人類知識)中徹底搜尋這些關鍵字。它會針對關鍵字仔細搜尋能找到的資訊及其上下文、分類名、答案的類型、時間、地點、性別以及其他資料。當它「認為」某個答案比較肯定時,它就會按響搶答器。對參與危險邊緣的人類選手來說,這個過程是瞬間和直觀的,但我深信我們的大腦也或多或少做着相同的事情 | 」 |
——肯·詹寧斯[22] |
危險邊緣遊戲中,所有選手(也包括華生),必須等到主持人將每個線索念完,然後就緒燈亮起,第一個按下搶答器按鈕的人可以獲得回答問題的機會。[11][23]華生像接收電子文字一樣得到這些線索的同時這些線索也顯示給人類選手[11]。然後它會將這些線索解析為不同的關鍵字和句子片段,這樣做是為了尋找統計相關詞組。[11]華生最革新的並不是在於全新的操作演算法,而是能夠快速同時執行上千的證明語言分析演算法來尋找正確的答案。[11][24]演算法找出的相同答案越多,華生就越肯定答案正確[11]。一旦華生發現一個潛在的解決方法,並且這個解決方法有效,它就會核對資料庫來確定答案[11]。在前20個問題中,人類選手搶答平均需要6~7秒,而華生視聽到線索來決定是否搶答。[11]在這段時間內,華生還必須評價反應和判斷對答案是否自信十足。[11]在危險邊緣比賽取得勝利的部分系統是用來接收「就緒」訊號和檢查華生是否有足夠的信心去按響搶答器的電路系統。由於電子訊號傳遞速度比人類反應速度快許多,華生的反應明顯比人類選手要快,但是人類選手會對就緒訊號燈亮起的時刻作出預測。[25]拿到搶答權後,華生將答案按危險邊緣的格式整理並用電子語音讀出[11]。華生的語音是演員傑夫·伍德曼(Jeff Woodman)錄製的,他參與了2004年IBM語音合成專案[26]。
與人類選手比較
編輯華生的基本工作原則是解析線索中的關鍵字同時尋找相關術語作為回應。這使得華生與人類選手既有優勢又有劣勢[27]:華生不擅長理解線索之間的關聯。所以人類選手通常比華生更快生成思路,尤其當線索很少的的時候[11]。華生的程式不允許其使用在未確定答案前就按響搶答器這種大眾化戰術。[11]一旦生成了答案華生就會迅速反應,按下搶答器,而不會受到人類選手的心理戰術影響[11][28]。
危險邊緣的工作人員使用了不同的手段來顯示華生和人類選手按下搶答器的狀態[25],但是卻一直備受爭議。[28]人類選手用的是一盞燈,他們需要0.1秒的時間來反應[29][30]。而華生使用的是電子訊號,能在8毫秒內(0.008秒)啟用搶答器[31]。人類選手嘗試要求補償知覺延遲造成的誤差[32],但兩者之間的反應時間差依舊是太大了[28]。因為華生並不需要估算就緒訊號何時到達[32][30]。
參見
編輯參考文獻
編輯- ^ YouTube上的IBM Watson: The Face of Watson
- ^ 2.0 2.1 2.2 DeepQA Project: FAQ, IBM Corporation, [2011-02-11], (原始內容存檔於2011-06-29)
- ^ 3.0 3.1 Hale, Mike, Actors and Their Roles for $300, HAL? HAL!, The New York Times, 2011-02-08 [2011-08-19], (原始內容存檔於2012-03-29)
- ^ The DeepQA Project, Research.ibm.com, [2011-02-18], (原始內容存檔於2011-06-29)
- ^ Markoff, John, Computer Program to Take On 'Jeopardy!', The New York Times, 2009-04-26 [2009-04-27], (原始內容存檔於2011-09-06)
- ^ Loftus, Jack, IBM Prepping Soul-Crushing 'Watson' Computer to Compete on Jeopardy!, Gizmodo, 2009-04-26 [2009-04-27], (原始內容存檔於2013-02-07)
- ^ IBM's "Watson" Computing System to Challenge All Time Greatest Jeopardy! Champions, Sony Pictures, 2010-12-14 [2010-12-15], (原始內容存檔於2013-06-16)
- ^ 8.0 8.1 8.2 Jackson, Joab, IBM Watson Vanquishes Human Jeopardy Foes, PC World, IDG News, 2011-02-17 [2011-02-17], (原始內容存檔於2011-02-17)
- ^ 9.0 9.1 Zimmer, Ben, Is It Time to Welcome Our New Computer Overlords?, The Atlantic, 2011-02-17 [2011-02-17], (原始內容存檔於2011-02-18)
- ^ Raz, Guy, Can a Computer Become a Jeopardy! Champ?, National Public Radio, 2011-01-28 [2011-02-18], (原始內容存檔於2011-02-28)
- ^ 11.00 11.01 11.02 11.03 11.04 11.05 11.06 11.07 11.08 11.09 11.10 11.11 11.12 11.13 Clive Thompson. Smarter Than You Think: What Is I.B.M.’s Watson?. The New York Times Magazine. 2010-06-16 [2011-02-18]. (原始內容存檔於2011-06-05).
- ^ Ferrucci, D.; et al. Building Watson: An Overview of the DeepQA Project. AI Magazine. 2010, 31 (3): 59 [February 19, 2011]. doi:10.1609/aimag.v31i3.2303. (原始內容存檔於2017-12-28).
- ^ Is Watson the smartest machine on earth?, Computer Science and Electrical Engineering Department, UMBC, 2011-02-10 [2011-02-11], (原始內容存檔於2011-09-27)
- ^ 14.0 14.1 Rennie, John, How IBM’s Watson Computer Excels at Jeopardy!, PLoS blogs, 2011-02-14 [2011-02-19], (原始內容存檔於2011-02-22)
- ^ Lucas, Mearian, Can anyone afford an IBM Watson supercomputer?(Yes), Computerworld, 2011-02-21 [2011-02-21], (原始內容存檔於2013-12-12)
- ^ Tony Pearson's blog. [2011-08-19]. (原始內容存檔於2019-10-06).
- ^ Takahashi, Dean, IBM researcher explains what Watson gets right and wrong, VentureBeat, 2011-02-17 [2011-02-18], (原始內容存檔於2011-02-18)
- ^ Novell, Watson Supercomputer to Compete on 'Jeopardy!' -- Powered by SUSE Linux Enterprise Server on IBM POWER7, The Wall Street Journal, 2011-02-02 [2011-02-21], (原始內容存檔於2011-04-21)
- ^ Watson – A System Designed for Answers[永久失效連結]
- ^ 存档副本. [2011-08-19]. (原始內容存檔於2020-11-06).
- ^ IBM's 'Watson' to take on Jeopardy! champs, AFP, 2011-02-11 [2011-02-19], (原始內容存檔於2012-05-25)
- ^ Ken Jennings. My Puny Human Brain. Slate. Newsweek Interactive Co. LLC. February 16, 2011 [February 17, 2011]. (原始內容存檔於2011-02-18).
- ^ Libresco, Leah Anthony, A Non-Trivial Advantage for Watson, The Huffington Post, 2011-02-21 [2011-02-21], (原始內容存檔於2016-03-04)
- ^ Will Watson Win On Jeopardy!?, Nova ScienceNOW (Public Broadcasting Service), 2011-01-20 [2011-01-27], (原始內容存檔於2011-01-24)
- ^ 25.0 25.1 David, David, How Watson "sees," "hears," and "speaks" to play Jeopardy!, IBM Research blog (IBM), 2011-01-10 [2011-02-21], (原始內容存檔於2017-11-05)
- ^ Avery, Lise, Actor Jeff Woodman, Voice of IBM's Watson Computer (MP3), Anything Goes!!, 2011-02-14 [2011-02-15], (原始內容存檔於2019-09-21)(interview of Jeff Woodman)
- ^ 參照錯誤:沒有為名為
cnet
的參考文獻提供內容 - ^ 28.0 28.1 28.2 參照錯誤:沒有為名為
jenning
的參考文獻提供內容 - ^ Kosinski, R. J.(2008). A literature review on reaction time, Clemson University. 互聯網檔案館的存檔,存檔日期2010-06-11.
- ^ 30.0 30.1 Baker, Stephen. Final Jeopardy: Man vs. Machine and the Quest to Know Everything. Boston, New York: Houghton Mifflin Harcourt. 2011: 174. ISBN 0547483163.
- ^ Baker, Stephen. Final Jeopardy: Man vs. Machine and the Quest to Know Everything. Boston, New York: Houghton Mifflin Harcourt. 2011: 178. ISBN 0547483163.
- ^ 32.0 32.1 參照錯誤:沒有為名為
strachan
的參考文獻提供內容
外部連結
編輯- Watson homepage
- DeepQA homepage (頁面存檔備份,存於互聯網檔案館)
- About Watson on Jeopardy.com
- Smartest Machine on Earth (PBS NOVA documentary about the making of Watson) (頁面存檔備份,存於互聯網檔案館)
- POWER7
- Power Systems
- Noam Chomsky on Watson and AI (頁面存檔備份,存於互聯網檔案館)
- The Watson Trivia Challenge (頁面存檔備份,存於互聯網檔案館). The New York Times. June 16, 2010.
- #IBMWatson (頁面存檔備份,存於互聯網檔案館) Twitter hashtag
- This is Watson (頁面存檔備份,存於互聯網檔案館) - IBM Journal of Research and Development(IEEE出版)
J! Archive
編輯- Jeopardy! Show #6086 - Game 1, Part 1 (頁面存檔備份,存於互聯網檔案館)
- Jeopardy! Show #6087 - Game 1, Part 2 (頁面存檔備份,存於互聯網檔案館)
- Jeopardy! Show #6088 - Game 2 (頁面存檔備份,存於互聯網檔案館)