您現在的位置是:首頁 > 互聯網網站首頁互聯網

簡化科學家如何共享數據

  • 互聯網
  • 2020-02-06 16:28:21

數據通常是科學的核心–研究人員跟蹤速度,測量來自恒星的光,分析心率和膽固醇水平并掃描人腦中的電脈沖。

但是,通常很難與其他科學家,同行評審的期刊編輯或資助者共享數據。該軟件可能是專有軟件,購買價格過高。一個人可能需要多年的培訓才能管理和理解該軟件。否則創建軟件的公司可能會倒閉。

一個研究小組開發了一個開源數據管理系統,科學家希望該系統能夠解決所有這些問題。研究人員在《PLOS ONE》雜志上概述了他們的系統。

“我們希望創建一種文件格式和數據集模型,以封裝我們在實驗室的所有儀器上處理的大多數數據集,” 俄亥俄州立大學化學教授 ,該論文的資深作者Philip Grandinetti說。 。“這個長期存在的問題在科學家中普遍存在,那就是您購買了價值數百萬美元的儀器,而制造該儀器的公司卻擁有自己的專有格式,這是與其他任何人共享的噩夢。”

大型數據集很難共享,部分原因是軟件通常是專有的,部分原因是文件通常太大,以至于難以通過電子郵件或基于云的服務器共享。即使文件可以導出為可以共享的文件類型,重要的元數據(解釋數據集實際內容的東西)也經常丟失。

他們的系統被Grandinetti及其同事稱為“核心科學數據模型”,旨在輕松共享復雜的數據集,而無需占用大量帶寬和硬盤空間的海量文件,并且不會丟失元數據??紤]一個包括空氣溫度,氣壓,風速和太陽通量的數據集-該系統可以處理它?;蚩紤]來自遙遠星系中恒星的光的測量結果和顏色-該系統可以處理它。

Grandinetti說:“您需要一個非常靈活的數據集,能夠以一種文件格式保存所有這些內容,而又不會丟失信息。” “所以,我們的想法是創建一個我們認為足夠靈活的模型來做到這一點。”

俄亥俄州立大學的團隊與丹麥奧爾胡斯大學的Thomas Vosegaard教授以及法國奧爾良大學的Dominique Massiot博士合作,開發了可以在Mac或PC上運行的軟件。 他們將其上載到Web上 并使代碼開源(這意味著任何人都可以查看,使用和免費下載它。)PLOS ONE的發布是有意的:該期刊也免費提供給任何人。

而且,研究人員希望,該系統可以是一種簡單,免費的方法,可以將多種類型的數據組合到一個位置。

博士后研究員Deepansh Srivastava表示:“我們以科學家的身份研究多個數據集,而作為一名科學家本人,我希望能夠從所有這些文件中獲取數據,并以一種可以使用的方式將它們放在一起。”在Grandinetti的團隊中。

“如果我們可以簡單地將其導出為一種文件類型(作為核心科學數據文件類型),而不是尋找數據并將其從數據集中提取,我們將能夠在一個通用系統中工作。”

Top fb怎么赚钱