Benchmarking for DuckDB and Polars | allainews.com

June 2, 2023, 1:38 p.m. | /u/100GB-CSV

Data Science www.reddit.com

Testing Data: 300 Million Rows x 14 Columns

Testing Functions: Read Parquet File => Filter => Group By => Write CSV File

DuckDB: 3.9s Polars: 16.2s

Testing machine: 8 cores and 32 GB memory

====================================================

import duckdb

import time

s = time.time()

con = duckdb.connect()

con.execute("""copy (SELECT Ledger, Account, DC, Currency, SUM(Base\_Amount) as Total\_Base\_Amount

FROM read\_parquet('input/300-MillionRows.parquet')

WHERE Ledger>='L30' AND Ledger <='L70'

GROUP BY Ledger, Account, DC, Currency)

to 'output/DuckFilterGroupByParquet.csv' (format csv, header true);""")

e = time.time()

print("DuckDB FilterGroupBy Parquet Time …

benchmarking csv currency data datascience duckdb filter import machine memory parquet testing

More from www.reddit.com / Data Science

Tech layoffs cross 70,000 in April 2024: Google, Apple, Intel, Amazon, and these companies cut … 7 hours ago | www.reddit.com

amazon apple april companies +7

How much did your grad program help you get a job? 8 hours ago | www.reddit.com

big course datascience employers +7

What’s the DS job market like for people who have a decent amount of experience? 11 hours ago | www.reddit.com

datascience experience faang graduate +5

Put my foot down and refused to go ahead with what would amount to almost … 12 hours ago | www.reddit.com

call data datascience data scientist +2

How would you model this problem? 15 hours ago | www.reddit.com

churn count datascience features +4

What makes a good or bad product manager? 18 hours ago | www.reddit.com

datascience ever good love +5

REVOLUTIONIZING DRAG-AND-DROP PYTHON GUI BUILDING 18 hours ago | www.reddit.com

building datascience gui python

Apple silicone users: how do you make LLM’s run faster? 19 hours ago | www.reddit.com

apple build datascience faster +5

What are you excited about based on the career you've built so far and where … 1 day, 10 hours ago | www.reddit.com

career datascience fun knowledge +2

AI Engineer Intern, Agents

@ Occam AI | US

View on ai-jobs.net

AI Research Scientist

@ Vara | Berlin, Germany and Remote

View on ai-jobs.net

Data Architect

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Data ETL Engineer

@ University of Texas at Austin | Austin, TX

View on ai-jobs.net

Lead GNSS Data Scientist

@ Lurra Systems | Melbourne

View on ai-jobs.net

Data Engineer - Takealot Group (Takealot.com | Superbalist.com | Mr D Food)

@ takealot.com | Cape Town

View on ai-jobs.net