数据跟踪器用于流数据源的基于内容标识符的注册表的概念验证目标给定URL上的数据可能会定期更改,甚至会连续更改。
这与我们可能用于预测的数据尤其相关,例如来自NOAA或NASA的环境数据或来自NEON的生态数据。
这样的数据源很少具有DOI,并且每次我们根据它们进行预测时都为这些源创建DOI通常是不切实际的(请参阅)。
该存储库概述了一种简单的替代方法。
我们想要一个自动化的工作,该工作:观看网址计算找到的数据的每个唯一副本的标识符(或用于进行预测的标识符)存档找到的数据的每个新副本允许我们使用其标识符检索该数据的精确副本。
方法正如BenTrask,JorritPoelen和其他人所建议的那样,我们将使用简单的内容哈希总和作为标识符,而不是将DOI用于该标识符。
(请注意,此方法与git,dat,IPFS和其他基于内容的系统的方法不同,因为它更简单-无需
2023/6/14 18:01:24
2.31MB
R
1