***表 1*** 分别显示了两个数据集的描述性统计数据。内向***普查***(小组 A)包含略多于 2.617 亿行代码,其中 72% 属于顶级编程语言。软件包平均包含 14.2 万行代码,顶级语言子集的平均代码行数略低,为 11.3 万行。在考虑需求(使用)方面时,我们注意到 ***普查*** 软件包的使用次数超过 270 万次,其中 92% 来自顶级语言。软件包的平均使用次数为 1,472.4 次,其中顶级语言的使用率更高,约为 1,497.5 次。我们在面向外部的 ***BuiltWith*** 数据中发现了类似的模式,但程度不同。来自 ***BuiltWith*** 的软件包包含超过 8,200 万行代码,其中 71% 使用的是顶级编程语言。***BuiltWith*** 样本中的软件包平均有 11.1 万行代码,而顶级语言的平均代码行数较少,约为 8 万行。这是因为我们的 ***BuiltWith*** 数据主要由基于 JavaScript 的软件包组成,这些软件包通常比用其他语言编写的软件包要小。***BuiltWith*** 软件包的使用次数超过 14.2 万次,其中 99.97% 属于顶级语言。接下来,我们利用这些原始观测数据,通过 ***劳动力市场方法*** 计算出所有开源软件的价值,并估算出供需双方创造的价值。
0 commit comments