Chuyển đổi EPUB sang CSV

Chuyển EPUB sang CSV — trích xuất dữ liệu văn bản dạng bảng miễn phí

Thả tập tin ở đây. 1 GB Kích thước file tối đa hoặc là Đăng ký
đến
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Đầu ra dữ liệu sạch

Nội dung EPUB được trích xuất thành tệp CSV có cấu trúc — sẵn sàng cho bảng tính, nhập cơ sở dữ liệu hay quy trình dữ liệu tự động.

Trích xuất nhanh

Trích xuất văn bản sang CSV nhanh ngay cả với sách điện tử lớn. Máy chủ đám mây xử lý công việc trong vài giây không làm chậm thiết bị.

Xử lý bảo mật

EPUB của bạn bị xóa ngay sau khi chuyển đổi. Tệp CSV đầu ra được tự động dọn sạch khỏi máy chủ trong vòng 24 giờ.

Làm thế nào để chuyển đổi EPUB sang CSV

1

Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.

2

Chọn csv hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)

3

Hãy để tập tin chuyển đổi và bạn có thể tải tập tin csv của bạn xuống ngay sau đó

Về các định dạng

EPUB (Electronic Publication) là tiêu chuẩn sách điện tử mở, ban đầu được phát triển bởi International Digital Publishing Forum (IDPF) và hiện được duy trì bởi W3C sau khi hai tổ chức sáp nhập vào năm 2017. Phiên bản đầu tiên mang tên EPUB được phê duyệt vào tháng 10 năm 2007, kế thừa từ cấu trúc Open eBook Publication Structure (OEBPS). Tệp EPUB thực chất là một tập tin nén ZIP chứa các tài liệu nội dung XHTML hoặc HTML5, bảng định kiểu CSS, hình ảnh, phông chữ và siêu dữ liệu, được tổ chức theo các đặc tả Open Packaging Format và Open Container Format. Phiên bản chính hiện tại, EPUB 3, hỗ trợ nội dung tái bố cục và bố cục cố định, đa phương tiện nhúng, tương tác JavaScript, phương trình MathML và các tính năng trợ năng tiếp cận phong phú bao gồm đánh dấu ngữ nghĩa và lớp phủ phương tiện để đồng bộ văn bản và âm thanh. Ưu điểm nổi bật là hỗ trợ thiết bị rộng rãi — khác với các định dạng độc quyền, EPUB hoạt động tự nhiên trên hầu hết mọi thiết bị đọc sách điện tử, máy tính bảng và ứng dụng đọc sách ngoài Kindle, từ Apple Books và Google Play Books đến Kobo và hàng chục ứng dụng bên thứ ba khác. Mô hình văn bản tái bố cục là một thế mạnh cốt lõi khác, tự động điều chỉnh phân trang, cỡ chữ và lề để phù hợp với bất kỳ kích thước màn hình và tùy chọn người dùng nào. Đặc tả mở và sự quản lý tích cực của W3C đảm bảo bảo tồn lâu dài và độc lập với nhà cung cấp, biến EPUB thành tiêu chuẩn thực tế cho xuất bản số tại các thư viện, cơ sở giáo dục và nhà bán lẻ thương mại trên toàn thế giới.
Phát hành lần đầu: Tháng mười 2007
CSV (Comma-Separated Values — Giá trị phân cách bằng dấu phẩy) là định dạng văn bản thuần túy dùng để lưu trữ dữ liệu dạng bảng, trong đó mỗi dòng đại diện cho một hàng và các trường trong hàng được phân cách bằng dấu phẩy. Định dạng này bắt nguồn từ máy tính lớn IBM vào đầu những năm 1970 để trao đổi dữ liệu giữa các chương trình và kể từ đó đã trở thành định dạng chung nhất cho việc trao đổi dữ liệu có cấu trúc. Mặc dù trông đơn giản, CSV có những điểm phức tạp tiềm ẩn: các trường chứa dấu phẩy, ký tự xuống dòng hoặc dấu nháy kép phải được đặt trong dấu nháy kép, và các dấu nháy kép nhúng sẽ được thoát bằng cách nhân đôi. RFC 4180, công bố năm 2005, đã chuẩn hóa các quy ước này, nhưng các triển khai CSV vẫn khác nhau đáng kể giữa các phần mềm, với sự khác biệt về ký tự phân cách (dấu chấm phẩy ở nhiều vùng châu Âu), ký tự xuống dòng, mã hóa ký tự và quy tắc dấu nháy. Một ưu điểm là tính phổ quát tuyệt đối — mọi ứng dụng bảng tính, hệ thống cơ sở dữ liệu, ngôn ngữ lập trình và công cụ phân tích dữ liệu đều có thể đọc và ghi CSV, khiến nó trở thành định dạng an toàn nhất để trao đổi dữ liệu giữa các hệ thống không tương thích. Bản chất văn bản thuần túy là một thế mạnh cốt lõi khác: các tệp CSV có thể mở bằng bất kỳ trình soạn thảo văn bản nào, xử lý bằng các công cụ dòng lệnh như awk và sed, quản lý phiên bản với Git, và đọc từng dòng mà không cần tải toàn bộ tập dữ liệu vào bộ nhớ. CSV vẫn là định dạng xuất mặc định cho cơ sở dữ liệu, nền tảng phân tích web, thiết bị khoa học và cổng dữ liệu mở của chính phủ trên toàn thế giới.
Nhà phát triển: IBM
Phát hành lần đầu: 1972

Các câu hỏi thường gặp

Tại sao chuyển EPUB sang CSV?

CSV là định dạng bảng đơn giản nhất — lý tưởng để nhập dữ liệu sách điện tử vào cơ sở dữ liệu, bảng tính hay script xử lý dữ liệu.

Phần mềm nào mở tệp CSV?

Excel, Google Sheets, LibreOffice Calc, trình soạn thảo văn bản, công cụ dữ liệu Python/R, tiện ích nhập CSDL — CSV được hỗ trợ toàn cầu.

Loại dữ liệu nào được trích xuất?

Nội dung văn bản và cấu trúc bảng từ EPUB được chuyển thành hàng phân cách bằng dấu phẩy. Văn bản không dạng bảng thành các mục liên tiếp.

Tôi có thể dùng CSV trong cơ sở dữ liệu không?

Có — CSV là định dạng nhập chuẩn cho hầu hết mọi hệ thống cơ sở dữ liệu. Dữ liệu được trích xuất sẵn sàng nhập trực tiếp.

Chuyển đổi EPUB sang CSV có miễn phí không?

Có, Convertio cung cấp chuyển đổi EPUB sang CSV miễn phí. Gói trả phí tăng dung lượng cho tệp lớn hơn và khối lượng nặng hơn.

Tôi có thể xử lý nhiều tệp không?

Có — hỗ trợ tải lên hàng loạt. Xếp hàng nhiều tệp EPUB và trích xuất tất cả sang định dạng CSV trong một phiên.

Xếp hạng chất lượng từ EPUB đến CSV

4.1 (53 phiếu bầu)
Bạn cần phải chuyển đổi và tải xuống ít nhất 1 tệp để cung cấp phản hồi!