在新选项卡中打开链接
  1. 有比Pandas 更好的替代吗?对比Vaex, Dask, PySpark, Modin和Julia

    • 表格是存储数据的最典型方式,在Python环境中没有比Pandas更好的工具来操作数据表了。 尽管Pandas具有广泛的能力,但它还是有局限性的。比如,如果数据集超过了内存的大小,就必须选择一种替代方法。 但 … 展开

    Pandas替代

    让我们首先探讨反对替代Pandas的论点。
    1.他们不像Pandas那么普遍
    2.文档,教程和社区支持较小
    我们将逐一回顾几种选择,并比较它们的语法,计算方法和 … 展开

    知乎专栏
    数据集

    对于每种工具,我们将使用Kaggle欺诈检测数据集比较基本操作的速度。 它包含两个文 … 展开

    知乎专栏
    Dask-并行化数据框架

    Dask的主要目的是并行化任何类型的python计算-数据处理,并行消息处理或机器学习。 扩展计算的方法是使用计算机集群的功能。 即使在单台PC上,也可以利用多个处理核心来加快 … 展开

    知乎专栏
    PySpark

    它是用于Spark(分析型大数据引擎)的python API。 Spark已经在Hadoop平台之上发展,并且可能是最受欢迎的云计算工具。 它是用Scala编写的,但是pySpark API中的许多方法都可以 … 展开

    知乎专栏
     
  1. Pandas替代

    • 并行/云计算— Dask,PySpark和Modin
    • 高效内存利用— Vaex
    • 不同的编程语言— Julia
    这是否有帮助?
  2. 速度起飞!替代 pandas 的 8 个神库 - 腾讯云

  3. 萝卜大杂烩 | Polars ,最强Pandas平替(内含实操代码, …

    Polars是一个用于操作结构化数据的高性能DataFrame库,可以说是平替 pandas 最有潜质的包。 当然pandas目前作为 Python数据分析 的核心工具来说还是最强的,完全值得我们深入学习。

  4. Pandas替代框架性能测 …

    Pandas在大数据处理上的不足,制约了其在数据科学领域的进一步发展,尽管它在小数据集上处理非常灵活方便;探究Pandas在大数据时代的替代品,是算法工程师面临的重要问题。 当然,现在各类公有云和分析型数据库大行其道,大 …

  5. Pandas替代框架性能测评:Polars、Modin、Pandarallel与pySpark

  6. 最强 Pandas 平替 -- Polars - CSDN博客

  7. 为Pandas加速,Dask, Ray, Modin, Vaex, RAPIDS哪个好呢?

  8. 一个闪电般快速的 DataFrame 处理库,完美替代 Pandas - 51CTO

  9. Pandas替代框架性能测 …

    2022年5月15日 · Pandas在大数据处理上的不足,制约了其在 数据科学 领域的进一步发展,尽管它在小数据集上处理非常灵活方便;探究Pandas在大数据时代的替代品,是算法工程师面临的重要问题。 当然,现在各类 公有云 和分析型数 …

  10. Polars库 | 最强 Pandas 平替来了 | 大邓和他的PYTHON

    2023年12月27日 · Polars 是一个用于操作结构化数据的高性能 DataFrame 库,由于 Polars 是从0开始用Rust编写,紧密与机器结合。 其矢量化和列式处理可在现代处理器上实现缓存一致性算法和高性能。 如果您经常使用 pandas,那么用起 …