賣數據給AI公司 新聞企業新出路

2024年06月14日 星期五

 

#學術瑰寶#

近年人工智能是世界最火熱的新科技,OpenAI旗下的ChatGPT把人工智能平民化,普通市民都可以用ChatGPT「創造」,例如作文、改編文章、翻譯、尋找資料、創作劇本、製作圖片及影片等,甚至可以撰寫電腦程式。

要訓練人工智能的大型語言模型,需要大量優質而且真實的數據,以確保人工智能會給出正確答案。由於人工智能可以24小時運作,現時不少國際新聞媒體已經使用人工智能撰寫簡單的新聞報道,以節省成本。

既然人工智能需要大量數據,那麼誰掌握了社會時事等的大數據?無錯,就是新聞企業,而且報社、電台或電視台的新聞資料,大都經過事實查核(fact check),是優質且真實的數據,用於訓練大型語言模型最好不過。

最近,國際知名的新聞集團(News Corporation)與OpenAI達成「多年全球合作夥伴關係」協議,授權OpenAI使用新聞集團出版的內容,以回答用戶查詢及訓練大型語言模型,5年期的合作總值超過2.5億美元,約19.46億港元。據《華爾街日報》的報道,新聞集團可獲得現金收入,並以積分形式使用OpenAI技術。

新聞集團旗下本身有多個業務,包括《華爾街日報》、道瓊斯通訊社、財經網站Market Watch、《巴倫周刊》、《紐約郵報》、英國《泰晤士報》及《太陽報》等眾多媒體業務,可以提供大量數據訓練大語言模型。

互聯網的發展在過去二十多年來快速轉變,由網絡搜尋走向社交媒體,每次轉變都衝擊傳統新聞機構,愈來愈少人買報紙、付費閱讀;相反,大家都在社交媒體獲取新聞資訊,傳統新聞機構只能看着社交媒體賺得盆滿缽滿,自身網站的流量遭社交媒體搶走,廣告收入持續下跌,不少新聞企業連年虧損。

步入人工智能時代,新聞機構的內容對人工智能變得非常珍貴,尤其歷史悠久的新聞機構保存了大量互聯網時代以前的寶貴資訊,普通讀者未必會「課金」購買,但用來訓練人工智能就非常有用;OpenAI願意出資購買新聞集團的數據,意味認可傳統新聞集團的內容絕對有價值。OpenAI今次與新聞集團的協議亦非獨家,這意味新聞集團可以再與Google等人工智能機構合作,從而獲取收入,成為集團另一收入來源。

其實不只新聞集團,OpenAI亦有與Politico及Business Insider的母公司Axel Springer簽署授權,3年合約費用2500至3000萬美元;與《英國時報》達成的授權費每年500至1000萬美元;美聯社則每年數百萬美元;法國世界報(Le Monde)及西班牙媒體集團Prisa Media都有與OpenAI達成類似授權協議。

ChatGPT的出現無疑引領互聯網世界進入新次元,現在的新聞教育無法避免要引入人工智能教育;新聞機構賣新聞之餘,其保留的歷史數據對訓練人工智能來說更值錢。香港的媒體或可參考一下,為公司帶來新收入來源,改善業績,改善對旗下記者的待遇。

 

撰文︰Fred
大專新聞及傳播學兼職講師

#Fred# #傳媒#