歡迎光臨
每天分享高質量文章

3 款用於學術出版的開源工具 | Linux 中國

學術出版業每年的價值超過 260 億美元。

— Paul Shanno

 

有一個行業在採用數字化或開源工具方面已落後其它行業,那就是競爭與利潤並存的學術出版業。根據 Stephen Buranyi 去年在 衛報[1] 上發表的一份圖表,這個估值超過 190 億英鎊(260 億美元)的行業,即使是最重要的科學研究方面,至今其系統在選題、出版甚至分享方面仍受限於印刷媒介的諸多限制。全新的數字時代科技展現了一個巨大機遇,可以加速探索、推動科學協作而非競爭,以及將投入從基礎建設導向有益於社會的研究。

非盈利性的 eLife 倡議[2] 是由研究資金贊助方建立,旨在透過使用數字或者開源技術來走出上述僵局。除了為生命科學和生物醫療方面的重大成就出版開放式獲取的期刊,eLife 已將自己變成了一個在研究交流方面的實驗和展示創新的平臺 —— 而大部分的實驗都是基於開源精神的。

致力於開放出版基礎設施專案給予我們加速接觸、採用科學技術、提升使用者體驗的機會。我們認為這種機會對於推動學術出版行業是重要的。大而化之地說,開源產品的使用者體驗經常是有待開發的,而有時候這種情況會阻止其他人去使用它。作為我們在 OSS(開源軟體)開發中投入的一部分,為了鼓勵更多使用者使用這些產品,我們十分註重使用者體驗。

我們所有的程式碼都是開源的,並且我們也積極鼓勵社群參與進我們的專案中。這對我們來說意味著更快的迭代、更多的實驗、更大的透明度,同時也拓寬了我們工作的外延。

我們現在參與的專案,例如 Libero (之前稱作 eLife Continuum[3])和 可重現檔案棧Reproducible Document Stack[4] 的開發,以及我們最近和 Hypothesis[5] 的合作,展示了 OSS 是如何在評估、出版以及新發現的溝通方面帶來正面影響的。

Libero

Libero 是面向出版商的服務及應用套餐,它包括一個後期製作出版系統、整套前端使用者介面樣式套件、Libero 的鏡頭閱讀器、一個 Open API 以及一個搜尋及推薦引擎。

去年我們採取了使用者驅動的方式重新設計了 Libero 的前端,可以使使用者較少地分心於網站的“陳設”,而是更多地集中關註於研究文章上。我們和 eLife 社群成員測試並迭代了該站點所有的核心功能,以確保給所有人最好的閱讀體驗。該網站的新 API 也為機器閱讀能力提供了更簡單的訪問途徑,其中包括文字挖掘、機器學習以及線上應用開發。

我們網站上的內容以及引領新設計的樣式都是開源的,以鼓勵 eLife 和其它想要使用它的出版商後續的產品開發。

可重現檔案棧

在與 Substance 和 Stencila[7] 的合作下,eLife 也參與了一個專案來建立可重現檔案棧(RDS)—— 一個開放式的創作、編纂以及線上出版可重現的計算型手稿的工具棧。

今天越來越多的研究人員能夠透過 R Markdown[8] 和 Python[9] 等語言記錄他們的計算實驗。這些可以作為實驗記錄的重要部分,但是儘管它們可以獨立於最終的研究文章或與之一同分享,但傳統出版流程經常將它們視為次級內容。為了發表論文,使用這些語言的研究人員除了將他們的計算結果用圖片的形式“扁平化”提交外別無他法。但是這導致了許多實驗價值和程式碼和計算資料可重覆利用性的流失。諸如 Jupyter[10] 這樣的電子筆記本解決方案確實可以使研究員以一種可重覆利用、可執行的簡單形式釋出,但是這種方案仍然是出版的手稿的補充,而不是不可或缺的一部分。

可重現檔案棧[11] 專案旨在透過開發、釋出一個可重現原稿的產品原型來解決這些挑戰,該原型將程式碼和資料視為檔案的組成部分,並展示了從創作到出版的完整端對端技術棧。它將最終允許使用者以一種包含嵌入程式碼塊和計算結果(統計結果、圖表或圖形)的形式提交他們的手稿,併在出版過程中保留這些可視、可執行的部分。那時出版商就可以將這些做為出版的線上文章的組成部分而儲存。

用 Hypothesis 進行開放式註解

最近,我們與 Hypothesis 合作引進了開放式註解,使得我們網站的使用者們可以寫評語、高亮文章重要部分以及與線上閱讀的群體互動。

透過這樣的合作,開源的 Hypothesis 軟體被定製得更具有現代化的特性,如單次登入驗證、使用者介面定製,給予了出版商在他們自己網站上實現更多的控制。這些提升正引導著關於出版學術內容的高質量討論。

這個工具可以無縫整合到出版商的網站,學術出版平臺 PubFactory[13] 和內容解決方案供應商 Ingenta[14] 已經利用了它最佳化後的特性集。HighWire 和 Silverchair[16] 也為他們的出版商提供了實施這套方案的機會。

其它產業和開源軟體

隨著時間的推移,我們希望看到更多的出版商採用 Hypothesis、Libero 以及其它開源專案去幫助他們促進重要科學研究的發現以及迴圈利用。但是 eLife 的創新機遇也能被其它行業所利用,因為這些軟體和其它 OSS 技術在其他行業也很普遍。

資料科學的世界離不開高質量、良好支援的開源軟體和圍繞它們形成的社群;TensorFlow[17] 就是這樣一個好例子。感謝 OSS 以及其社群,AI 和機器學習的所有領域相比於計算機的其它領域的提升和發展更加迅猛。與之類似的是以 Linux 作為雲端 Web 主機的爆炸性增長、接著是 Docker 容器、以及現在 GitHub 上最流行的開源專案之一的 Kubernetes 的增長。

所有的這些技術使得機構們能夠用更少的資源做更多的事情,並專註於創新而不是重新發明輪子上。最後,這就是 OSS 真正的好處:它使得我們從互相的失敗中學習,在互相的成功中成長。

我們總是在尋找與研究和科技介面方面最好的人才和想法交流的機會。你可以在 eLife Labs[18]上或者聯絡 innovation@elifesciences.org[19] 找到更多這種交流的資訊。


贊(0)

分享創造快樂