產業

新聞寫作的未來：人類記者和機器人記者如何互動

鉅亨網新聞中心 2015-11-26 14:11

‌

資深媒體人、ft中文網總編輯王豐撰文指出，

巴黎恐怖襲擊后短短一周多的時間，已有至少四位中國公民在世界各地被極端伊斯蘭恐怖分子殺害。中國人再次深切感受到了在一個全球化的時代，恐怖主義無遠弗屆的禍害。

‌

在對幾次恐怖事件的報導中，我注意到，中文新媒體平臺和自媒體都異常活躍迅捷。突發快訊的翻譯、實時進展的跟進，甚至獨家現場報導，都可圈可點。但是，相關媒體在報導準確性方面也出現了一些不大不小問題。

巴黎恐怖襲擊尚在進行中時，國內各門戶網站、自媒體公號對襲擊細節和傷亡人數的及時更新都動人心魄，吸引了很多讀者。但其中不乏誤譯誤報，在短時間內有誤導讀者的可能。印象較深的是，“遇難人數上升到197”一度被多家新媒體、自媒體引用，事后證明與實際情況差別很大。甚至有門戶網站專門指出，“197”是法國警方提供給目擊者的緊急熱線號碼，不是死亡人數。

另外一個比較離譜的錯誤是，官方通訊社中新社的網站在11月19日上午發布了這樣一篇報導：“美波士頓發槍擊案嫌犯引爆爆炸物自殺身亡”，隨后被新浪等門戶網站轉載。

這條新聞在國內似乎未引起太大影響，但很快有身居美國的朋友指出，波士頓根本沒發生這類案件。倒是美聯社當天發布了一條波黑薩拉熱窩發生槍擊案的新聞，除了地點外，與上文各種細節完全一致。初步判斷是，中新網把“波斯尼亞-黑塞哥維那”錯誤地翻譯成“波士頓”，把槍擊案地點挪到了7000公里之外。

舉出上述例子並非幸災樂禍、或是以“行業警察”自居，而是因為我由此聯想到了近幾年來逐漸火爆的另一個行業話題：機器人寫稿。日益強大的計算能力和大數據分析能力，結合機器學習方面的技術進展，已經令電腦程式可以取代新聞從業者的一些職能，並且讓國內外不少新聞業同行感到緊張。那么，這些技術是否也可以幫助新聞機構避免此類令人尷尬、誤導讀者甚至可能造成巨大損失的事實錯誤？

以我對“機器人寫稿”技術發展至今的觀察，它似乎主要作用在傳統新聞采編流程中的三個節點：

一是資訊的采集。在資訊爆炸的時代，新聞行業早已開始通過電腦程式篩選資訊，捕捉海量資訊中的“突發”和“異動”，發現新聞線索。例如，駐華外國財經媒體早在十幾年前就開始用類似網絡爬蟲的軟件實時監控關鍵政府、機構、企業網站和數據庫，尤其是央行、財政部、統計局等定期發布的宏觀經濟數據。相關數據庫、網頁一旦有更新，這些軟件立即以郵件、手機簡訊或電腦桌面“紅條”的形式通知記者處理。財經類通訊社間對發稿時效、第一時間影響市場能力的競爭，往往精確到秒甚至毫秒；比起更早時候新聞助理們整天眼巴巴地盯著新華社電訊終端，或者用鼠標手動更新網站，爬蟲軟件顯然高效、人性得多。

時至今日，社交媒體日益成為新聞線索的最快、最廣來源，監控分析社交媒體動向和趨勢的軟件更是不斷推陳出新，很多技術能力強大的新聞機構更是自行開發相關軟件，直接接入自己的內容管理系統（cms）。

當然，近幾年來最為吸引業內和大眾眼球的還是人工智慧技術在“寫稿”環節的應用。就目前的發展看，這一功能的基本原理其實並不復雜：對於一些相對格式化、以數據為核心內容的新聞（例如財經、體育新聞），記者編輯們可以先準備好相對固定模板，其中的變量（時間、地點、數據等）可以隨時由上文提到的由爬蟲軟件獲取的最新數據所代替，從而產生最新的報導。

據我所知，彭博社、路透社等財經新聞機構，至少在四五年前即已自行開發相關軟件，以多半自動、少半人工的形式產生並發布格式簡單的財經新聞。類似技術近年來在國內外新聞機構間不斷改進升級，也在大眾中引起了越來越高的興趣。

以今年9月份在國內媒體圈轟動一時的騰訊財經“8月cpi同比上漲2.0% 創12個月新高”這篇新聞稿為例：

“騰訊財經訊國家統計局周四公布數據顯示，8月cpi同比上漲2.0%，漲幅比7月的1.6%略有擴大，但高於預期值1.9%，並創12個月新高。

國家統計局城市司高級統計師余秋梅認為，從環比看，8月份豬肉、鮮菜和蛋等食品價格大幅上漲，是cpi環比漲幅較高的主要原因。8月份豬肉價格連續第四個月恢復性上漲，環比漲幅為7.7%，影響cpi上漲0.25個百分點。部分地區高溫、暴雨天氣交替，影響了鮮菜的生產和運輸，鮮菜價格環比上漲6.8%，影響cpi上漲0.21個百分點。……”

其中cpi和各種商品價格的同比、環比漲跌數據，都可以由“爬蟲”從國家統計局網站上獲取，填入事先準備好的模板中。騰訊財經此文還引用了多位分析師的觀點，估計是采用了更加復雜的預設模板和邏輯判斷，並且可能最後仍需一定程度的人工干預（編輯）。

第三個節點是新聞機構生產出的內容的智慧發布。例如《紐約時報》開發的blossom程式，通過大數據分析確定哪些內容更適合發布到社交媒體平臺。這個節點似乎與本文討論的內容關係不大。

那么，問題來了：如果隨著機器學習能力的提高，上文提到的“抓取資訊+填充模板”的機器人寫稿形式逐漸擴大到更多的領域，適應更復雜的情況，它能否同樣具有強大的“防錯”和“糾錯”功能？“機器人記者”除了比肉身記者更加快捷外，還能夠更加準確嗎？

從理論上看，機器人記者的準確度似乎可以完勝人類記者。

首先，用爬蟲類軟件從權威資訊來源處搜取的資訊和數據，在轉換成為新聞產品的過程中極大減少了人為誤抄錄的可能。在翻譯問題上，盡管不同語言間的機器翻譯仍舊不能完全替代人工翻譯，但各種電腦輔助的翻譯工具已經可以實現數字、拼寫、語法、專有名詞、情境一致性等多種內容的翻譯和校對，上文提到的把電話號碼誤做死亡人數，或是“波黑-波士頓”一類低級翻譯錯誤可以輕易被電腦翻譯工具發現並糾正。

當然，準確程度也極大地取決於計算能力和軟件的完善程度。四年多前，我所供職的一家國際財經通訊社為了提高對中國宏觀經濟數據報導的速度，開始試驗以軟件從政府網站調取最新數據，並自動以簡單的新聞模板發布。但是，試驗開始不久，就出現了一次重大事故：搜尋軟件誤將政府網站上一個月前的舊頁面當做更新頁面，將數據調取后形成快訊稿，並且未經編輯核實，直接發到到客戶終端，引發不少客戶投訴，萬幸未造成重大投資損失。時至今日，盡管軟件的復雜程度和計算能力已有巨大進步，機器應對種種復雜的現實情況的能力、尤其是學習能力，仍舊是關鍵。

其次，在資訊來源的甄別和核實方面，電腦的強大處理能力也有助於大幅提高準確性。

在浩如煙海的政府、機構、企業、媒體網站和數據庫、個人網站和社交媒體賬號等等之中，如何判斷哪個是“權威”、“可靠”的新聞來源？目前已知的和可以想象的做法，包括通過對海量歷史內容的檢索和互相驗證，形成對資訊來源可靠性的評判；判斷某一“新聞事件”是否真正發生，可以監控與之最相關領域的媒體、個人和機構的反饋，尤其通過那些可信度較高的個體的反饋加以判斷；甚至依據地理位置，從周邊大量個人社交媒體賬號的反應得出判斷… 這些依賴於強大的數據處理和分析能力的工作，電腦顯然都比人更加勝任。

但是，人類記者和機器人記者最大的區別出現了：除了相對被動地搜尋現存資訊以外，人類記者還可以主動調查和核實資訊：聯系當事人、可能的知情人或相關專家，通過人際交流實現對資訊的證實或證偽。新聞歸根到底是為人類服務的，人類記者的最大價值也就體現在人際交流的能力。除非電腦演進到可以與人類主動、無障礙地交流，甚至通過智慧、心理的較量從人類身上獲得后者本來不愿提供的資訊，這將成為人類記者不可替代的最後一塊陣地。當然，如果電腦真的發展到全面“智壓人類”的地步，那也就是“天網”統治世界、毀滅人類的時候了。

至於在常識、直覺、同理心（empathy）、感召力、職業道德等等對於廣義的新聞工作具有重要意義的能力和素質方面，更是很難想象電腦能夠在可見的未來替代人類。

這樣看來，依據遠超人類的強大計算能力來獲取、篩選和分析數據是機器人的強項，新聞業與之相關的工作也正在被電腦不斷取代，這對新聞行業整體的時效、準確、客觀性提升大有幫助；但是，在可見的未來，即便是在純粹事實性的新聞報導中，電腦仍舊難以完全取代人類記者。

也許未來的新聞機構不再需要動輒幾十人、數百人的“大平面”辦公室，會在一定程度上以大型服務器機房甚至是“云計算”取而代之，但在一些關鍵的、具有高附加值的環節上，經驗豐富的人類記者編輯仍舊將占據核心的地位。諸如觀點、分析、評論、調查等更加復雜、涉及人類主觀意識的新聞形態，在未來很久一段時間內都必須仍舊由人類記者編輯負責——除非這些形態乃至傳統意義上的新聞行業，因為市場需求的變遷而先行消亡。

在新聞這樣一個面臨巨大沖擊的行業，上述結論未必能給從業者多少安慰。但是至少，它提醒我們不能放松職守。電腦會讓我們中的很多人失業，但不會是全部；電腦替我們做了很多累活苦活，但最重的責任，仍舊需要我們來承擔。

說到這里，是否可以請中新社和新浪網至少把“波士頓槍擊案”的錯誤網頁刪掉？（文章來源：ft中文網）

(本新聞來源：和訊網)

掌握全球財經資訊點我下載APP

新聞寫作的未來：人類記者和機器人記者如何互動

文章標籤

‌

‌

‌

‌