施普林格·自然:探索AI技術對出版流程與服務模式變革
□本報記者 尹琨
2019年,施普林格·自然出版了一本完全由AI(人工智能)生成,有關鋰離子電池最新研究進展的圖書《鋰離子電池》,成為施普林格·自然AI應用的重要里程碑,該書電子版下載量目前已達41.3萬。
2021年,施普林格·自然采用混合人機交互方式,出版了另一本AI生成的文獻綜述圖書《氣候、行星和進化科學:計算機生成的文獻綜述》,將人工撰寫的文本和計算機生成的文獻綜述融合在一起,成為將人機協作納入其出版實踐的首次嘗試。
今年,施普林格·自然又出版了采用人機交互方式生成的圖書《CRISPR——計算機生成的文獻綜述》,該書基于最新的自動摘要AI平臺,是施普林格·自然首次使用AI摘要生命科學領域的文獻生成圖書,也是首次有中國學者參與其AI生成圖書的實驗。該書電子版上線4個多月以來,已有2700多次訪問(包括電子書在線閱讀和下載),平均每章被訪問400多次。
不難看出,施普林格·自然近年來持續探索和應用AI等新技術。圍繞AI技術對出版流程與服務模式帶來的變革,《中國新聞出版廣電報》記者日前對話施普林格·自然集團大中華區總裁暨全球圖書業務總裁湯恩平。
應對信息過載問題
湯恩平用“試驗”形容3本AI圖書。他希望這些試驗能幫助施普林格·自然更好地了解AI如何用于改善編輯和出版過程,幫助研究人員提高研究效率,甚至引發討論。
什么樣的主題適合做AI圖書?前提是已經擁有很多出版內容的主題。“人類無法‘消化’所有出版了的內容,但算法可以幫忙提供概覽并在某種程度上幫助研究者理解內容,找出聯系,并在特定情境下告訴他們什么是有趣和重要的。”湯恩平表示,機器可以比人類更好、更中立、更快地總結大型文本語料庫,因此可以通過AI幫助研究界應對無處不在的信息過載問題。
以CRISPR(規律間隔成簇短回文重復序列)及其相關技術為例,作為近年來重要的研究熱點,相關研究成果呈爆炸式增長。截至2022年6月,僅施普林格·自然就已出版了超過5.3萬篇相關論文。研究人員面臨著如何從大量文獻中快速了解和掌握該領域最新科學進展的挑戰,將AI應用于學術出版的實踐無疑為應對這類挑戰提供了解決方案。
《CRISPR——計算機生成的文獻綜述》主編之一,上海科技大學生命科學與技術學院教授劉冀瓏曾對此表示,CRISPR與鋰電池研究領域一樣,近年來都涌現了大量論文,因此非常適合使用AI更加快速和有效率地生成文獻綜述。相信在不久的將來,這一基于AI的文獻自動摘要系統將會進一步促進科學進步,為人類的知識傳播作出革命性的貢獻。
人機交互而非取代人類
AI技術可以在出版中有各種程度不同的應用。施普林格·自然目前出版的3本AI圖書,其中兩本采用人機交互模式。
湯恩平介紹了《CRISPR——計算機生成的文獻綜述》的出版流程。首先,主編團隊根據自定的關鍵詞檢索施普林格·自然近年來出版的該領域的期刊論文,再根據研究領域知識圖譜計算及主編的理論框架在檢索結果中篩選出114篇論文。AI平臺在讀取這些論文的全文之后,自動生成摘要。最后,主編團隊將這些文章摘要分類和排序后劃分為6章,并人工撰寫各章節的簡介,以方便讀者閱讀。
“施普林格·自然的目標并不是用計算機取代人類作者或編輯。”湯恩平指出,對于研究界而言,最大的價值在于圖書的大部分仍將由人類作者撰寫,施普林格·自然為作者提供計算機生成的模板與目錄,從而大量減少作者寫作新書所需的時間,提高出版速度。2021年,已有500位作者在寫作早期從施普林格·自然獲得了這樣的模板支持。從編輯的角度來看,編輯決策終歸是人做出的,機器不能承擔責任,這是一個永遠無法被替代的工作。
AI圖書可以在很短的時間內消化大量已出版的內容并用于總結復雜的科學主題,其優勢在成書速度,以及中立地使用所有可用的資源。“理想情況下,計算機生成的書與人類作者寫的書沒有區別。”湯恩平建議根據內容而不是作者是人類或計算機來選擇圖書,那對讀者來說會是一件好事。從長遠來看,這也有助于推動出版業步入知識創造的領域。
AI是不可或缺的組成部分
用于優化工作流程的AI等技術,使出版更快、更容易、更準確。除了自動生成內容之外,施普林格·自然還將AI應用于圖書出版過程中的其他許多領域。
比如,自2021年10月以來,施普林格·自然開始利用DeepL AI翻譯工具,為圖書作者提供中文等多種語言譯成英語的免費服務,并無縫整合到圖書出版流程中。翻譯的內容會施以人工檢查,以確保準確性。
在期刊出版中,施普林格·自然使用AI來加速同行評審,以及發現虛假論文。今年5月,施普林格·自然推出名為PySciDetect的開源軟件,在稿件提交階段就可識別虛假研究和數據,供整個研究和學術界用于應對虛假科學論文。該軟件迄今已為施普林格·自然檢查了超過380萬篇期刊文章和超過250萬個圖書章節。
“AI是我們系統不可或缺的組成部分,我們必定會繼續對它予以特別的重視。”湯恩平表示,施普林格·自然會繼續開發算法,但不會只出版計算機生成的內容,而是將其視為一種作者服務,讓作者可以按需使用。
“我們非常相信人機協作,讓各個方面都做自己擅長的事情。”湯恩平告訴記者,創造力和責任交給人類,大型文本語料庫的數據處理可以由機器來完成。這將更好更快地帶來科學產出,并在更短時間內取得更大進步。
- 2022-08-03有書做伴故事多
- 2022-08-03吉林:退伍軍人變身“真人圖書”
- 2022-08-03浙江:軍地共建“書香筧橋”
- 2022-08-03天津: 線上書香推“八一特輯”