Apache Arrow

维基百科,自由的百科全书
跳转到导航 跳转到搜索
Apache Arrow
开发者Apache软件基金会
首次发布2016年10月10日,​9年前​(2016-10-10
当前版本
    Module:EditAtWikidata第29行Lua错误:attempt to index field 'wikibase' (a nil value)
    源代码库https://github.com/apache/arrow
    编程语言C, C++, C#, Go, Java, JavaScript, MATLAB, Python, R语言, Ruby, Rust
    引擎
      Module:EditAtWikidata第29行Lua错误:attempt to index field 'wikibase' (a nil value)
      类型数据格式, 算法
      许可协议Apache许可证 2.0
      网站arrow.apache.org

      Apache Arrow 是一种与语言无关英语Language-agnostic软件框架,用于开发处理栏式数据库的数据分析应用程序。Apache Arrow包含一个标准化的物件栏内存格式,且能够表示平面层级化数据,以便在现代CPUGPU硬件上进行高效率的分析操作。[1][2][3][4][5]这种功能反而会减少或则消除限制使用大型数据集的可行性因素,比如动态随机存取存储器的成本、易变性或则物理性的约束。[6]

      注释[编辑]

      1. ^ Apache Arrow and Distributed Compute with Kubernetes. [2018-12-13]. (原始内容存档于2021-12-07). 
      2. ^ Baer, Tony. Apache Arrow: Lining Up The Ducks In A Row... Or Column. Seeking Alpha. [2016-02-17]. (原始内容存档于2021-12-07). 
      3. ^ Baer, Tony. Apache Arrow: The little data accelerator that could. ZDNet. [2019-02-25]. (原始内容存档于2021-12-07). 
      4. ^ Hall, Susan. Apache Arrow's Columnar Layouts of Data Could Accelerate Hadoop, Spark. The New Stack. [2016-02-23]. (原始内容存档于2021-12-07). 
      5. ^ Yegulalp, Serdar. Apache Arrow aims to speed access to big data. InfoWorld. [2016-02-27]. (原始内容存档于2016-08-19). 
      6. ^ Tanveer Ahmad. ArrowSAM: In-Memory Genomics Data Processing through Apache Arrow Framework. bioRxiv. 2019: 741843 [2021-12-07]. doi:10.1101/741843可免费查阅. (原始内容存档于2021-12-07). 

      参阅[编辑]

      外部链接[编辑]